Kaggle 2017 1 百萬美金的肺癌檢測競賽的難點哪兒？

1樓：zhan feng

難在找到病灶吧，肺結節鑑別診斷沒什麼問題啦，國內中科院資料有肺癌4000多例了，搞點紋理分析，幾百個特徵效能就有80多，不過他們都是先找大夫把病灶畫出來。

沒看影象，如果都是早期磨玻璃結節，就好辦了。

2樓：地主

作為放射科醫生，我比較關注的是資料的採集，有沒有具體的引數要求，是否也像功能磁共振資料一樣要經過配準、建模的步驟？二者是否一樣！作為一線醫生，如果想做一些相關研究，有沒有什麼好的建議！

3樓：

QQ已不用好多年，我還是習慣悶聲發大財。。

前幾天剛剛Fork了乙個Kernel, 關於讀取CT資料的。凡是涉及醫學的資料，都是量很大，麻煩的很。光洗資料就需要呼叫很多模組。

我沒有注意到有多少賞金，正好年輕時候做過這方面的事，就關注了。

其實現實中放射科醫生判斷病灶屬性有很大程度還是靠結合病史來的。畢竟腫瘤這東西生長不典型的情況太多了。浸潤性肺癌跟大葉性肺炎、侷限性肺癌跟肺膿腫，有時候影象上就是一模一樣的，說不上邏輯的區別，必須結合病史，或者穿刺活檢。

而且肺癌的診斷並不是很依賴放射影象的。現在最先進的手段是支氣管鏡。放射影象有時候只是乙個預定位的作用，我從醫院下崗前曾經翻譯過一篇手術機械人的文獻，裡面CT也只是在預定位過程中用了一下，手術過程是用胸腔鏡做的（靶點靠近胸膜）。

但是有些神經科的腫瘤或者骨科的腫瘤的確可以僅憑放射影象就下診斷。比如星形膠質瘤，一是神經科的病史往往很不清楚，問了也沒什麼用。二是顱內活檢很難做。

但是國外醫學資料分析總是拿肺癌做例子。大概是因為CT的資料相對容易洗一些吧。

所以我覺得，要麼多新增幾個影象以外的Feature, 要麼做出的結果僅供參考。其實我也是剛剛關注，純小白，要是真有人做出來了絕對是醫學和資料科學界的幸事。