如何快速入門kaggle呢?

時間 2021-06-08 14:23:52

1樓:a2Mia姐

把裡面一些內容摘錄過來:

學習合適的程式語言

工欲善其事,必先利其器。Kaggle比賽最流行的程式語言是Python,很多案例以及kernel上的baseline都是用python寫的;其次是R語言或其他。所以我們更推薦學Python。

關於入門Python的教程,《Kaggle入門,看這一篇就夠了》裡已經列出了很多學習資源。

掌握至少一種機器學習框架

常用的機器學習或深度學習框架包括Tensorflow,Pytorch,scikit-learn,Theano,Caffe,Keras等等,只要對其中1個有比較深入的了解,打Kaggle比賽基本沒有任何問題。掌握一種機器學習框架最有效的學習方式就是參照它的技術文件,親手把上面的例子過一次。案例看得再多,都不如自己親自動手做一次。

相關教程可以參考知乎話題或專欄:

《Keras,Theano,pytorch,caffe2 哪個更好一些,應該怎麼嘗試學習?》

《TensorFlow 如何入門,如何快速學習?》

;《Caffe系列教程》

;《新手如何入門pytorch?》

選擇合適的比賽型別

目前Kaggle上的比賽型別分為以下幾種,對參賽選手的門檻有不同層級的要求

1.面向初學者:

★.Getting Started

專案難度低,非常適合入門級的參賽者用來練手,但沒有獎牌或獎金,只能看到自己的排名。常年進行中的比賽有3個:

(1) Titanic

(2) House prices

(3) Digits Recognizer

這三個比賽由於常年掛在Kaggle上,資料集也未做任何更新,已經有很多baseline可以借鑑,很多參賽隊伍拿到了滿分或接近滿分的成績。

★.Playground

專案難度比Getting Started稍難,主要是一些趣味性的比賽,看創意而不是解決具體的研究問題,獎勵可能是獎金、榮譽,不能獲得獎牌。

2.面向競賽者:

★.Featured

是Kaggle上主要的競賽型別,為解決商業問題而設立的比賽,獎金高競爭激烈,有金銀銅牌獎勵,對參賽選手的能力有一定的要求。

★.Research

致力於解決科研界學術界的前沿問題,偏向於實驗性質,較難;競爭沒那麼激烈,通常也有獎金和金銀銅牌,但有的比賽只給榮譽獎勵,或者是提供參加頂會的機會。

3.面向求職者:

★.Recruitment

贊助商為招聘資料科學家而設立的比賽,獎勵就是贊助商提供的工作機會

4.其他比較冷門的比賽型別:

★.Annual

不是嚴格意義上的比賽,每年兩次,一次是美國大學籃球錦標賽期間的三月機器學習比賽,一次是聖誕節期間的聖誕主題優化比賽

★.Limited participation如果你是初學者,建議從入門級的Getting started或playground的比賽開始,能夠從中了解到打Kaggle比賽的一些基本思路/套路,也能獲得乙個比較好的成績,給自己建立信心。上面說完了比賽的型別,接下來介紹下比賽題目都有哪些類。

有針對性地選擇比賽題目。Kaggle上的比賽題目主要有這幾種:data mining(資料探勘),computer vision(計算機視覺), natural language process(自然語言處理), optimization(優化)。

如果你對計算機視覺有興趣,並且以後想申請相關方向的研究生或是職位,最好就專注於計算機視覺的比賽題目。同一種型別的比賽題目大多有套路可循,打的比賽多了,摸清了套路,自然成績會越來越好。此外還可以有針對性地選擇賽題細分領域,比如同樣是計算機視覺的題目,有的是和生物醫學相關(例如蛋白質圖譜分類),有的是和動物保護有關(例如座頭鯨的識別)。

如果你急於利用Kaggle比賽的經歷提公升自己的背景,但自學起來比較困難,不知道該怎麼規劃打比賽的路徑,找乙個經驗比較豐富的老司機帶一帶也是一種非常有效的方式。但大牛也不是那麼好找的,即使找到了人家也不一定有充足的時間教你。

現在市面上出現了很多針對Kaggle比賽的培訓班或訓練營,一般都是2-3個月的時間。推薦選擇具有真實比賽實操的輔導專案,以便能更高效率和高價效比地獲得一手且真實的Kaggle比賽經歷與優秀的排名成績,更直接地幫助你在無數競爭者中差異化背景,實現留學求職目標。

總而言之,打Kaggle比賽需要「無所不用其極」,除了要熟悉解決相關問題的方法,還需要在實踐中不斷優化解題思路。如果說科研考察的是乙個人對問題的洞察力,那麼Kaggle比賽考察的就是乙個人對資料的洞察力。Kaggle比賽不光培養乙個人的科研審美,還能夠幫助參賽者深刻理解資料科學的內涵,例如什麼是過擬合,什麼是泛化能力,你的模型能否經受得住別的資料集的考驗。

說到底,想斬獲更亮眼的名次,提高自己的技能包和實踐力才是終極解決方案!

2樓:losstie

嗯。可以看一些kaggle比賽案例。多在kaggle逛逛,有不少乾貨。想要快速入門其實還是實踐,參加乙個入門級別的比賽就能夠快速入門

Kaggle如何入門?

其他答案說的很詳盡,但是感覺篇幅很長,作用很小。我覺得入門分幾步 1 了解基本機器學習概念和演算法 可以上一下任何機器學習的公開課 2 在 1 的基礎上進一步了解各個演算法適合什麼樣的問題 可以看看傻瓜版再深入了解,Machine Learning For Dummies Cheat Sheet 了...

新手如何快速入門電音製作呢?

被迫改名的使用者 建議你先去學習一些宿主軟體的操作,fl live什麼的都行,新手的話推薦fl,然後教程的話B站有很多 看那種教fl使用的,不是做電音的 多看一看,然後等你你能明白這個軟體的操作然後就可以嘗試做了。然後了解一下各種各樣的電音風格house dubstep futureBass Dru...

銷售入門小白如何快速入門?

做任何事情要是能快速的掌握事務的本質,找到其規律,然後持續去做,就會容易很多,只可惜的是很多人都沒有掌握這個規律,銷售的具體的規律可以檢視下面的這個圖。多學習,多看,多交流,積累經驗,學會使用工具,CRM系統能夠將工作流自動化處理,根據所配置的規則自動流轉任務,節省工作時間。在操作層面,CRM系統能...