通過資料探勘能分析《紅樓夢》各回的真偽嗎?

時間 2021-05-31 17:47:50

1樓:

反對所有認為資料分析能分出紅樓真偽的答案。

用電腦來資料分析文字真偽,好比通過測謊儀來分分析乙個人是否講真話一樣不靠譜,說實話,測謊儀的有效性還比資料分析來得高,原因是,文字創作是包含極多維度的量子水平上的資料體現,它被壓縮成文字,給人造成一種可分析的錯覺,事實上,資料分析,最多只能分析詞頻多寡,由此來認定文字真偽,好比用電腦分析兩個人穿的服裝相似與否,來判斷這兩人是否屬於同一種族一樣不靠譜。

2樓:宮醬油

關於紅樓夢作者的定量分析國內外都有人做過。

主要是根據作者的寫作風格(虛詞出現的頻率)來判斷每回的差異情況。

國外影響力較大的有:陳炳藻,從詞彙上的統計論《紅樓夢》的作者問題,「首屆國際《紅樓夢》研討會」(1980,美國威斯康星大學)

國內較為認可的版本是:李賢平,《紅樓夢》成書新說,復旦大學學報社科版,5(1987),3-16.

得出的結論各有千秋。

3樓:趙智

對某些領域的人早就不是新鮮東西了,不過可能演算法在一直持續改進,再把我了解的思路給大家解釋一下吧。

我們對某種具體的東西的文字描述(形容性的),比如乙個蘋果,一朵花,在同一文化教育環境情況下成長的人,可能主要區別不是很大。但無關緊要的虛詞,標點,句子的長短等等,可能個人的習慣就差別很大,這種分析就是看文章在這些方面的表現是否接近,來判斷是否同一作者所寫。

4樓:rlei

前八十回和後四十回常用助詞的詞頻分析對比很早就有人做過了,呈現出有顯著差異的情況。這還是我小時候——約二十多年前——在《少年科學》上看到的。

收集使用者喜好,通過資料分析和挖掘,是否可以絕對保證廣告推送智慧型度和準確度?

chen holyfield 大資料永遠解決不了乙個問題 使用者需求是不能猜的,儘管你觀察了乙個人好久,你也不能說你了解乙個人。最好的營銷方式是讓客戶告訴你他要什麼,這也許很難很遙遠,但這才是營銷的終極解決之道。 陸浩然 問題應當改成 通過資料探勘和分析,是否可以改善廣告推送的智慧型度和準確度?但真...

資料分析如何轉資料探勘?

位元組Funk飛 資料分析如何轉資料探勘?雖然這二者都是直接根據接觸的職業,但是對於資料的處理和跟資料的關係還是有著很大的去唄的,資料分析師針對已有的資料進行不同的模型構建然後分析,將有價值的東西提取出來,但是資料探勘呢,只是單純的資料探勘,是一種資料收集和提取的過程 我之前也是資料分析,感覺沒什麼...

如何通過資料分析,找出90後與00後的區別?

Frank Lao 可嘗試按照下面步驟著手開始,定義問題,切忌問題範圍太大,畢竟兩個群體的區別,從頭到腳,多幾次頭腦風暴都不一定能列個80 問題可以基於特定的條件範圍,但答案是選擇題,單選是最好的,多選也可以接受,而開放性簡答題很容易讓受眾思維發散,無法聚焦在你的結論,同時你也很難下手研究。舉例,9...