Kaggle 2017 1 百萬美金的肺癌檢測競賽的難點哪兒?

時間 2021-05-11 14:30:22

1樓:zhan feng

難在找到病灶吧,肺結節鑑別診斷沒什麼問題啦,國內中科院資料有肺癌4000多例了,搞點紋理分析,幾百個特徵效能就有80多,不過他們都是先找大夫把病灶畫出來。

沒看影象,如果都是早期磨玻璃結節,就好辦了。

2樓:地主

作為放射科醫生,我比較關注的是資料的採集,有沒有具體的引數要求,是否也像功能磁共振資料一樣要經過配準、建模的步驟?二者是否一樣!作為一線醫生,如果想做一些相關研究,有沒有什麼好的建議!

3樓:

QQ已不用好多年,我還是習慣悶聲發大財。。

前幾天剛剛Fork了乙個Kernel, 關於讀取CT資料的。凡是涉及醫學的資料,都是量很大,麻煩的很。光洗資料就需要呼叫很多模組。

我沒有注意到有多少賞金,正好年輕時候做過這方面的事,就關注了。

其實現實中放射科醫生判斷病灶屬性有很大程度還是靠結合病史來的。畢竟腫瘤這東西生長不典型的情況太多了。浸潤性肺癌跟大葉性肺炎、侷限性肺癌跟肺膿腫,有時候影象上就是一模一樣的,說不上邏輯的區別,必須結合病史,或者穿刺活檢。

而且肺癌的診斷並不是很依賴放射影象的。現在最先進的手段是支氣管鏡。放射影象有時候只是乙個預定位的作用,我從醫院下崗前曾經翻譯過一篇手術機械人的文獻,裡面CT也只是在預定位過程中用了一下,手術過程是用胸腔鏡做的(靶點靠近胸膜)。

但是有些神經科的腫瘤或者骨科的腫瘤的確可以僅憑放射影象就下診斷。比如星形膠質瘤,一是神經科的病史往往很不清楚,問了也沒什麼用。二是顱內活檢很難做。

但是國外醫學資料分析總是拿肺癌做例子。大概是因為CT的資料相對容易洗一些吧。

所以我覺得,要麼多新增幾個影象以外的Feature, 要麼做出的結果僅供參考。其實我也是剛剛關注,純小白,要是真有人做出來了絕對是醫學和資料科學界的幸事。

Kaggle如何入門?

其他答案說的很詳盡,但是感覺篇幅很長,作用很小。我覺得入門分幾步 1 了解基本機器學習概念和演算法 可以上一下任何機器學習的公開課 2 在 1 的基礎上進一步了解各個演算法適合什麼樣的問題 可以看看傻瓜版再深入了解,Machine Learning For Dummies Cheat Sheet 了...

怎麼著手玩kaggle

大衛的小屋 作為曾經的資料競賽圈老司機,給大家分享過乙份資料科學競賽的究極進化秘笈。我想這篇文章可以手把手地教你如何學習機器學習與資料探勘的相關知識,如何做資料分析,如何做特徵工程,如何訓練模型,如何調參,如何斬獲比賽獎項。如果你想從0到1地上手國內外的資料科學競賽如Kaggle競賽 天池大資料競賽...

如何快速入門kaggle呢?

a2Mia姐 把裡面一些內容摘錄過來 學習合適的程式語言 工欲善其事,必先利其器。Kaggle比賽最流行的程式語言是Python,很多案例以及kernel上的baseline都是用python寫的 其次是R語言或其他。所以我們更推薦學Python。關於入門Python的教程,Kaggle入門,看這一...