喜歡 Data Visualization 這個概念的人如何在追求 資料之美 的同時避免 數字的陷阱 ?

時間 2021-05-31 17:02:00

1樓:小河

作為資料分析從業人員,資料的真實性和準確性是第一位的,其次才是資料之美或者Storytelling之類的。言下之意,某些時候可能可以選擇性Visualize,但是即使是選擇性的資料也不能錯,但通常這種做法會帶入主觀的想法。

2樓:陳甫鵃

對於做資料探勘和視覺化的人,我不認為「資料之美」是應該有的追求目標。事實上它甚至都不應該是目標。工程師首先追求的永遠是「正確」,然後才應該是「美」。

至於資料陷阱,我的看法是大家把這個東西神秘化了。說白了,所謂資料陷阱就是分析方法上有錯誤。人非聖賢,要求統計資料的人永遠不犯錯誤,未免太強人所難。

那麼,如何避免資料陷阱?基本有兩條:分析方法公開。

對於簡單資料,有時候只要收集起來列一張圖表就可以看到一切。而對複雜資料則經常要伴隨複雜的資料選擇和分析方法。公開分析方法能讓更多的人看到和分析方法本身,從而更快地指出錯誤所在。

原始資料公開。有時候原始資料太多,分析師為了圖省事,會只給出篩選過的資料。這是完全錯誤的,因為分析過的資料往往已經被分析方法篩選過。

錯誤的分析方法給出的資料沒有意義。我們可以不要求最終的結論報告上羅列原始資料,但原始資料必須可通過某種確實的方式訪問。

我們不能說做到了這兩條就能避免犯錯誤,但至少能保證錯誤能盡快被人發現和修正。

3樓:張寧 Neo

可能會造成「數字陷阱」的機會有兩個:樣本的選擇:資料量很大,或者獲取大量資料的成本較高的時候,就會採用抽樣的方法。

這裡面有不小的門道。不同的樣本會導致非常不同的結果,@caixiao 同學的回答也提到了類似的例子。不過,統計學提供了一些對抽樣有效性進行甄別的方法,可以避免一些「數字的陷阱」。

資料視覺化:資料視覺化的展現形式可以融入一些主觀的成分,從而強調某個區域性的資料特徵。對於同樣的分析結果,簡單的改變圖表的型別或者尺度,都可以改變受眾的觀感。

從這個角度講,沒有太好的辦法來限制。所謂「欲加之罪,何患無辭」。

在商業環境中,資料是被用來作為溝通和管理的依據的,已經變成了商業語言。自然會有不同的利益驅動,從而左右資料本來的意思。想要完全避免「數字的陷阱」,也沒什麼真正好的辦法。

問題中引號內的部分是兩本書的名字嗎?我只看過前面一本「資料之美」(O'Reilly Media 出版)。

喜歡就是喜歡,不喜歡就是不喜歡,這樣的做法對嗎,面對不喜歡的事或物,偏偏要裝作喜歡,是不是很虛偽?

小公尺 每個人都是多面,但方與圓 外面是圓滑的,不滑傷別人,也不滑傷自己。一些無傷大雅的事,比如誇乙個不喜歡的人漂亮又怎樣呢?自己知道自己的原則,知道自己的底線就好。無傷大雅的事不必計較,觸及原則底線的事不能讓步。但這個度總是需要自己慢慢摸索,不要把底線變得太高太低。總之,舒服就好 亞柏絲網 知世故...

喜歡自己的自己不喜歡,自己喜歡的不喜歡自己,我該怎麼辦?

藍色的豬先生 我是男生,我也有和你一樣的感受,但慢慢我想通了 出現這種狀況說明你還需要去提公升自己,而不是整天去思考和嘆氣,這樣時間也浪費了,人還是那個樣子。 橙子味的橘子 等寧缺毋濫這個詞應該聽過吧,感情也是一樣,寧願沒有,也不要將就。人這一生,遇到對的人的機會,其實還是很少的。但是當你遇到他,就...

你喜歡的人不喜歡你,喜歡你的人你不喜歡。這會是一直什麼樣的感覺?

今天我真好看 哈哈哈乎友真會提問題。盡提些戳心的問題。我有過n個喜歡的人,也有過n個喜歡我的人,但從客觀層面來看,這就是2n段感情,沒有得到回應與期望回應都是讓人痛苦的吧 乙個很瀟灑的學姐跟我說過,她能很快識別自己不喜歡的,但不能一下子確定自己是否喜歡。我覺得我唯一比這個學姐厲害的地方就在於,我對於...