從統計學角度看,無邊桃炎的 627 大禮包是否專業?其資料統計的真實程度和可信度如何?

時間 2021-05-08 20:26:34

1樓:鬼門生

本來我是將信將疑的,畢竟外行人也不了解這些直到最近無邊桃炎被人肉的事情一出…………

可信度max

他急了他急了他急了肖戰急了

2樓:嵐貳

來學習的忍不住跑個題

帶粉籍和不帶粉籍的相同專業的回答還是看得出來差異的,不符合題意啊,本來我也是來學習的。

我看到有個回答裡面說肖戰粉絲裡面高學歷好多啊,如果粉絲群體高學歷好多的話會做出人肉別人的事情嗎?這又是乙個統計學問題了,令人深思。

最後:她們說我詆毀攻擊她們的愛豆

而我只是將他做過的事情複述了一遍而已

3樓:

資訊與計算科學專業,修了一些統計學和R、python語言的課。大概處於溫和抵制/持有惡感的路人。

首先從文字分析的步驟講,大概分為:爬蟲、清洗、分析三方面。中文文字分析有乙個難點在於「文字分詞」(因為中文的詞和詞之間不像英文有空格),也就是將一句話分成若干個片語。

例如:「我討厭肖戰」應該被分詞為「我討厭肖戰」。但是我個人實際操作的時候會出現這樣的問題,例如「我不喜歡肖戰」會被分為「我不喜歡肖戰」,而單獨看「喜歡」又變成了乙個死忠粉的詞彙。

不知道桃桃用的是什麼工具分詞,會不會出現這樣的問題。

另外,把「不」直接和後面的詞分組也是不恰當的,比如「能不能」「喜歡不喜歡」這樣的詞彙不應該拆分為「能不能」「喜歡不喜歡」,而應該看作整體。

桃桃這次的資料全部是描述性統計,這方面難點在於「視覺化」,也就是你如何把資料以最為清晰易懂的方式展現給大家。桃桃之所以沒有放一些模型的擬合,個人認為是考慮到過於專業的研究不利於大眾傳播。對於很多潛在的投資方而言,這乙份描述性統計得出的東西已經足夠了。

(即,群體開始分割、走向極端化)

從結果的角度,非要說可信度,除了上面的疑問,還有一點當然是她對於「死忠粉」「中立」「惡感」等標準的劃分,這一點不知道是業內的慣例還是她個人的標準。如果要更有信度,可以與其他同類藝人用同樣的標準對比(比如王一博)。此外,相對比例不代表絕對數量

肖戰雖然處於風口浪尖,但是其絕對粉絲數顯然是超過很多過氣明星的。如果我是投資方,我更希望看到的是這樣乙份報告:把所有主流藝人的「吸金」能力做個排名,然後看肖戰到底處於哪個級別。

事實上,我對於」肖戰糊「這件事仍然是悲觀的,不知道你們記不記得這樣的故事:車企老闆讓客戶對兩款車打分,一款車平均分8分,另一款平均分6分,但是最終研發了6分的車。因為雖然這款車平均分6分,但投票人兩極分化,很多9分10分和1分2分。

而極端者更傾向購買。也就是說我個人認為,如果真的有這樣乙個吸金能力排名,肖戰的排名未必就低。

4樓:

非專業人士,非業內。

第一眼看無邊桃炎資料的時候,看上去還是可信的第二眼,看到肖戰粉絲分分跳腳,實名的吹彩虹屁個誇讚。既然你們覺得資料不可信,為什麼要看為了讓這份資料好看,帶上名字呢?矛盾不?

第三眼,以肖戰方的尿性,無足輕重的人是不會搭理的。他們現在不僅搭理了,還要幫助ta呢!肖戰方請的律師,一直讓我很疑惑,感覺在微博買了房,大律師這麼接地氣的嗎?

5樓:一塊機智的肥肉

6.30的事情我看了之後,我只想說

我從來沒有這麼討厭乙個明星,以至於我不說他的名字大家都知道是誰。

但是我就要說,是肖戰!肖戰!肖戰!肖戰!

我不光要說

還要大聲說

6樓:

對大部分吃瓜群眾來說,技術細節爬資料手段分析方法都不重要,重要的是本次事件的前因後果,以及該博主巧妙的把更加精準的方向指出來了,這就足以讓肖戰,肖戰工作室,肖戰粉絲團再次忙碌起來,拼命洗地,使勁為其復出造勢,極力拖延肖戰走糊的節奏,不過今天肖戰工作室及其律師下場為被肖戰粉絲網暴的網友維權的戲碼還真挺吸引眼球的,反正本人是沒見過,有點少見多怪的意思。

統計資料及分析「不重要」的原因並不侷限於字面意思,而是,肖戰相關的吃瓜群眾,要麼是聽說過肖戰及其團隊粉絲各類操作的,要麼是某事件發生前後塌了房子的,被攻擊過的,被舉報過的,等等,自然不用海量的資料去告訴自己什麼是切身感受,什麼是客觀事實。

不過,私以為肖戰不會那麼快就糊是真的,他身後的利益鏈不允許,待播劇還有好幾個,綜藝代言大禮包乙個也不會少,撒出去的銀子如利刃出鞘,誰會幹虧本兒的生意?因此所以so,各位,保守預期來說,至少2-3年內依然還將是處處可見肖戰的光景,其工作室操作之橫,粉絲戰鬥力之強,確實跟肖戰本人的愛豆魅力息息相關,所以咱也別笑話新鮮出爐的金掃帚獎得主,那也是熱度,順帶蹭寶強啊。

7樓:

聽說作者三次元被閉嘴了,不過既然用的是公開的資料,模型也是現成的,有哪位大仙復現開源下嗎?

地抵制失格網紅肖戰,抵制黑sh。

8樓:資料分析那點事

這個問題沒法回答。簡單說就是無邊桃炎搞了一大批資料,然後使用自然語言處理進行正負向分類,從而產生這份報告。具體的原始資料和模型都沒有說明,沒有這些前置資訊,很難判斷是否存在問題。

從乙份嚴謹的資料分析報告的角度,這篇報告是殘缺的,作者的結論不能作為嚴謹的資料分析結論,是不是真的沒有辦法衡量,但是作者的資料視覺化做的挺好的。

小細節上可以改進的點:

選擇2.1(週六)、3.1(週日)、4.

1(週三)、5.1(勞動節)、6.1(周一)、6.

25(端午節)這幾個時間節點對比資料,也不夠嚴謹。畢竟是爬取的是資訊資訊,在節假日、週末、工作日的情況肯定存在差異,所以對於作者結論,娛樂圈的資料分析結論作為娛樂,不好嗎?

9樓:

還是知乎好點,無邊桃炎這條微博的資料竟然死活上不去熱搜,還被限流,昨天更是直接三次元被紮口。

爬蟲當然沒必要懷疑真實度,就是這個可信度吧,對抵制者很不公平,應該是沒爬過贊姨割割之類的代稱,體感的路人惡感數量比報告裡的要多很多,所以同時也說明無邊桃炎的結論是正確的,應該時刻牢記帶大名

10樓:

不是統計專業,說幾句。

1、桃的統計學資料視覺化為明星輿情分析提供了乙個方法途徑。(雖然不是第乙個)說得過一點,有指引性作用,在方法影響力擴大的前提下,相信會有更多人採用這種方法。

2、拿學術上的專業給不具備相關素養的普通人看是幼稚的。如果能將專業性通俗化到普通人的認知水平那就更好了。統計顯著性也許在這裡更重要。

3、在一定程度上,這是乙個可重複性實驗,可以通過相互對比來驗證。

4、情感傾向的統計標準,對每個人都是不一樣的。引起爭論是必然的,但至少有了乙個爭論的物件。

5、資料是可以做出來的,可信度是不絕對的,甚至往後的使用可能會有更大水分。

11樓:文以載道古律師

解放軍都打到上海了,你不想著怎樣布防台灣,擱這算戰損比呢。

這就是乙個趨勢,渡江戰役都打完了。

肖戰的台灣海峽是什麼?開個肖戰麵包店,還是去白馬會所當收銀。

我反對肖戰,反對的是他的團隊用傳銷,邪教的手段圈粉,固粉。而不是他本人。

月入6000的家庭,女兒成績追星影響生活,成績。肖戰會羞愧嗎?還是覺得粉絲行為,不該上公升到正主?

12樓:我妻由奶

統計專業研究生。

曾某網際網路公司兼職。

為什麼你覺得專業人士一定能看出問題呢?

科普一下做這種分析的步驟:

1洗資料,一般兼職的以及非專業的人都做這個。

原理簡單,步驟不複雜,需要會統計和程式設計。但做的結果人與人差異還是有的。

2資料分析。

這個主要看分析方法。有的分析方法資料敏感性還是有的,可能出現改變一兩個引數結果差異很大的情形。

結論:1你讓我百分百保證他做得是錯的,我得付出超過她的精力去錘他。

2他這個人很專業。這個資料結果也很專業。

3假定你是公司老闆,你看這個種資料也要靠自己對行業的分析,而不是錘他。

人都是有常識的,盲目崇拜偶像的人或許沒有,我相信大多數人還是有的。

看她的結論,發正面言論的人多了,負面言論也多了,路人緣差了,這不是挺符合常識的嗎?

有什麼可質疑的呢?

13樓:

MKT相關不請自來,免費的報告,還是給業餘人士看的,你要啥自行車呢?正兒八經做乙個耗時間耗精力,拿出去大部分人看不懂,科普一下就好了,真當平時上班閒得慌沒事做?

你咋不問問Marketline判定sentiment的基準和演算法是什麼?

再說一句,業內不是神,也是人,很多業內和我一樣就是個普通社畜,老闆不下班自己就不敢下班,兢兢業業做自己的工作,有時候產出有疏漏實在正常不過了,搞研究大家都有Confidence Interval呢。在這種情況下,原作者一定是含有主觀情緒在的,要求非常客觀精確的,請你們不要過分了。

如何以從統計學的角度求解火災蔓延的元胞自動機模型?

大模頭 周呂文 大模頭周呂文 澳洲變燠洲,考拉成烤拉!澳洲山火為什麼難以控制?大模頭周呂文 死於新冠的康威和他的生命遊戲經典的森林火災元胞自動機模型是由 Drossel 和 Schwabl 在1992年給提的 7 森林火災元胞自動機模型定義在正方形網格上,元胞有三種狀態 樹 未燃燒的樹 火 正在燃燒...

從遺傳學角度看,真的存在來世嗎?

如果宇宙時間是無限的,或者說是迴圈的,那麼在這無限的時間裡會不會又誕生乙個地球?無限時間裡重複無限次,誕生無限個這樣地球,無限個地球中又誕生出人類,這無數個人類中又誕生出與我完全一樣結構的人,我是不是又重生了呢?只要有概率,重複無數次就是必然會發生,但是我們並不知道這個世界是不是無限的,是不是可以迴...

從經濟學角度看,雙十一什麼也不買,是種損失嗎?

Chuck 我覺得方法上是得算一下你雙十一想買的都買了給你帶來的效用,和假設沒有雙十一你正常買的東西給你帶來的效用做對比。按理說會有一些像洗衣液這種常買的,用完之前就沒有這麼低的折扣了,那就是虧的。但這個還沒考慮那些你本來不會買但是碰上打折你就買了的。 派派 這還是看人的,有的人可以買的很理性,比如...