在大資料時代,抽樣統計還有存在的必要嗎?

時間 2021-05-31 11:46:06

1樓:江楚

瀉......藥,居然是3年前的問題。資料分析其實是個很靈活的事情,什麼方法好用就用什麼,反正方法多工具也多。

以前做抽樣是因為很難做到全樣本採集,要耗費巨大的人力物力時間成本,具體可參考全中國人口普查,沒辦法才會去用抽樣,從資料採集角度來說從來都是越多越詳細越好。

那麼現在還會用到抽樣嗎,會。受不同垂直行業的業務原因,不是所有公司都能拿到使用者的職位,年齡,性別,收入這種偏使用者畫像的資料的。電視台收視率這種資料採集似乎跟以前也沒什麼區別吧

另外還有一種情況會用抽樣,就是資料量太大,在做分析的時候,不一定要用到全量資料,這樣對資料計算壓力很大,反而會影響到工作效率。以前跟某家手裡有好幾億使用者的大公司的人聊過,他們做abtest只會抽出一小部分使用者做就好,完全不需要過多資料。

2樓:Mr.Wildkid

是需要的。

選擇抽樣說白了兩個原因:1)無法得到樣本整體;2)或者得到樣本整體的成本太高。

大資料時代讓資訊收集的成本「相對」降低,但如果你面對的情況無法解決獲取樣本整體的成本問題,依然需要使用抽樣統計。

大資料給了我們新的思路和新的手段,但抽樣統計依然是一種有智慧型的、應用面很廣的方法。

3樓:DataFish

有必要。在資料和業務對接的時候,資料分析和處理並不是唯一的產能瓶頸。

例如我們要對客戶做分類。客服做回訪的方式來分類的話,如果做全量回訪,乙個月幾十萬使用者,根本不可能做完。但如果是抽樣,加上相關指標去訓練模型,就有可能把待分類的客戶,根據他們的行為資料來做模型。

所以抽樣還是很有必要的,大資料不是為了大而大,也不是不用抽樣,不用管因果,要看清背後的本質。

4樓:NINGTAO WANG

必不可少!

如果你的研究目的只是獲得一些描述性的統計量,比如中位數,平均值,百分比。那麼在能夠獲得並處理總體資料的前提下,具體的抽樣方法確實就沒有什麼意義了。

但是對於絕大多數研究來說,他們的目的在於現象背後的機理,在於因果關係的推斷。在這樣的意義下抽樣統計是必不可少的。一般來說,對於大資料的挖掘只能得到相關性的結論,而不能得到因果關係的推斷.

要得到因果推斷,必須要消除其他因子對結果的潛在影響,要做到這一點就必須設計實驗,設計抽樣。

Correlation does not imply causation 這個鏈結裡解釋了相關性與因果關係的不同。

在大資料時代我們還有隱私嗎?

小戈 只要你有一張身份證,使用過手機和電腦,就沒有任何隱私了不信你欠個網貸試試,連你自己都忘了和誰認識,有過哪些同事,和誰睡過覺,去過哪些地方都保證一清二楚的給你翻出來 你自己只能查六個月的聯絡歷史,人家能查你一輩子你自己沒權利知道的人家都能知道 搞大資料的許塵 大資料技術通過分類 聚類 回歸分析 ...

在現在這個時代大資料背景下,隨著大資料加網際網路的發展未來技術型人才的需求量是會增多,還是會減少

社會對底層技術人才的需求會減少,同時底層技術人才的待遇會降低 更多的底層技術人才迫於壓力向上爬,導致中層技術人員的競爭加劇,議價能力降低,收入水平下降 高層技術人才依靠的是天賦,所以不需要太擔心來自中低層技術人員的競爭壓力,畢竟天賦上的差距不是 普通的後天努力 所能彌補的,而能做到 不普通的後天努力...

大資料時代對統計學和經濟學有何影響?

在下的美式不加糖 影響還是挺大的,好的方面是獲得資料的難度降低不少,很多之前苦於沒有資料不能做的選題,現在有可能通過購買資料來實現了。但同時也帶來了乙個很大的問題,資料越詳實,給人感覺真實性就越高,但真實性高不代表反應的問題就客觀,選擇性偏差問題在大資料下會顯得特別突出,這就對研究者的社會理解能力提...