資料科學家 統計學家應該養成哪些好習慣?

時間 2021-05-06 22:02:24

1樓:小心假設

An Accidental Statistician: The Life and Memories of George E. P. Box

2樓:Fang Wang

我背景數學加統計一開始在乙個做資料公司作statistician 後來轉作data scientist 感覺statistician或modeler階段對原始資料的加工少於data scientist階段很多都是it弄好的資料過來分析就行了主要用sas 轉為data scientist後確實有statistics和computer science結合的感覺資料從選擇處理整合分析要求一路做完因為用的資料很多都是新的 it的人也無法幫你弄使用工具也以開源軟體r Python Hadoop spark等為主處理資料量更大因為用sas cluster太貴公司一般不願意搭建Sas cluster的這就是為啥都用開源軟體感覺如果不喜歡處理data 作ds會比較痛苦因為這個不是純建模的工作更多時候希望你挖掘資料作一些dirty work 純屬個人經歷 ds現在五花八門幹什麼的都有也有一部分人主作建模的就日常來說 ds新tool層出不窮真的是每天都需要學新東西 Hadoop hive pig剛用熟忽然公司又轉去更快的spark了資料量似乎每天都在更大每天有新的困難

3樓:徐小白

本人統計學畢業,談到這類問題,我個人意見是,統計學家最好的習慣應該就是無時無刻謹記資料的真實性才是資料分析結果可靠性的最大保證,還有一點就是最基本的統計學一定會存在的去真和取偽的小概率事件,所以不要篤定任何分析得到的結果一定是社會活動的一般規律,只能說任何的分析結果都是符合樣本的一般規律。只要做到多資料保持一顆懷疑、謹慎的心態,和對結果有著辯證的看法,成為統計學家並不是一件難事

4樓:

1. 從資料出發,不做超出資料的結論,要做的話,明確限制條件與風險;

2. 不要輕易相信你下的結論,用常識來檢驗你的結論,與常識違背的結論,錯誤可能性越大;

3. 統計學理論與程式設計知識是基礎,資料分析與結論展現是上層建築,基礎不穩,大廈難維持;

4. Talk is cheap, show me the code.

5樓:

想起幾點從老師那裡聽來的:1.培養自己對資料的感覺 2.

學會解釋結果給不具備很多統計知識的人聽 3.idea有時候比數學推導更為重要,我們有simulation 4.過於完美的結果往往是不可靠的,想想是不是overfit了

大資料工程師 資料科學家(或資料探勘科學家) AI演算法工程師,這三個方向,哪個會在未來平均薪資更高?

資料的追隨者 資料科學家職位基本上資料分析 資料倉儲 資料爬蟲清洗 演算法 資料探勘 資料產品等5個領域中的乙個或者多個專家。個人觀點資料科學家至少是以上5個領域中的1個領域的大神,另外還要是2個領域方面的專家,而且 並且對業務有獨到的見解 趨勢判斷,這樣才能對得起小時候理解的 科學家 這三個字。資...

Data Scientist 資料科學家 和 Quant 數量金融分析師 之間該如何選擇?

xuran 如果quant是比如JP Morgan或者Citadel的quantitative researcher,不是quant developer,那幾乎可以不用看data scientist了。data scientist這個title覆蓋面太寬,從事research scientist,s...

怎麼看待統計學家與機器學習專家之間的互相鄙視?

orinker 鄙視鏈是很神奇的事情,純數瞧不起應數,應數瞧不起統計,統計瞧不起ML,ML瞧不起參俠。玩得開心就好,鄙視來鄙視去的沒啥意思 babyquant 不同資料集適用於不同的模型,比如做金融的很多都不會用到深度學習,基本上簡單的linear regression,lasso,svm,grad...