大資料時代下的生物資訊學專業與生物資訊學職業?

時間 2021-05-07 03:27:26

1樓:

生物資訊從大面上至少可以分成,開車的和造輪子的,搞汽車裝修的這幾類。除了開車的,其餘很少能夠接觸T以上的資料。

我最近在實驗室做一些分析,我也不知道算不算大資料,反正一周樣本都跑下來,快10個T了。現在測序很便宜,乙個樣本測個幾百G,然後平行幾個樣本的事情以後肯定會越來越多。什麼是真正的生物大資料時代,我不知道,我只知道現在800G的儲存成本是3000RMB左右,只能測30G的資料,什麼時候這3000RMB可以測500GB的資料時,才是真正的海量資料。

另外,生物資訊學資料量,每5個月翻一翻,這個資料量,你想想吧,有哪個能比?

2樓:田魯亦

和網際網路不同,我覺得現在的生物還不算是進入了所謂的「大資料」 時代。

第乙個不同是,在網際網路行業,我們可以很容易的用各種api獲得成T的資料,然而生物行業,測量大量生物資料需要很多花費。即便是現在的二代測序發展迅速,獲得資料的花費大大減少的情況下。我們獲取大量資料的能力依舊不夠強。

第二個不同是,來自不同研究產生的資料很難整合。因為即便是相同型別的資料(比如轉錄組),用不同的方法,不同的測序深度,獲取的資料也會有不同的噪音。另外生物樣本有內在的噪音,比如基因突變以及表達噪音。

不同研究中的相同型別細胞,可能有很不一樣的特徵。所以我們很難把來自不同研究的資料輕鬆的整合起來。1+1不一定等於2。

所以我認為,現在生物中所謂的「大資料」,現在還只是炒概念而已。當然你要認為100G就算大資料了,那我也沒話說。

為什麼說生物資訊學是真正的大資料專業?

路西 就談一點資料質量,現在組學相關資料只有genome sequence是相對準確的,其它具備時空性質的組學資料,比如轉錄組,蛋白質組,表觀遺傳組等不具備可重複性,在將來都會被顛覆。這些都受限於生物學系統的複雜性,實驗技術和產出資料平台的不完備。如果資料是不可重複的,只是量大是毫無意義的。 徐卓菲...

什麼是生物資訊學?生物資訊學中計算機和大資料各扮演什麼樣的角色?

張旭東 當研究樣本量小 研究物件只是一兩個基因的時候,實驗結果用個小本記一下就行了,不用統計學方法,更用不上計算機程式設計,高效能計算。但是隨著高通量測序技術的發展和人類基因組計畫的完成,大資料 大樣本量的時代來了。樣本量大了,你需要科學的統計學方法 資料量大了,你需要高效的計算機程式設計。數學 計...

如何評價西交利物浦大學的生物資訊學專業?

Thegreenarrow 作為一名生科人,大體介紹可看上面的,我會做些細節介紹。生信的老師規模不大 目前primary faculty不算生科的老師有4個 選這個的學生也不算多 一年大概10幾個 可以算是精小班了。師資背景非常的出色,主要是系主任會有很多機會介紹 工作,科研,學校 本科的時候如果和...