什麼是生物資訊學?生物資訊學中計算機和大資料各扮演什麼樣的角色?

時間 2021-05-05 22:52:02

1樓:張旭東

當研究樣本量小、研究物件只是一兩個基因的時候,實驗結果用個小本記一下就行了,不用統計學方法,更用不上計算機程式設計,高效能計算。

但是隨著高通量測序技術的發展和人類基因組計畫的完成,大資料、大樣本量的時代來了。樣本量大了,你需要科學的統計學方法;資料量大了,你需要高效的計算機程式設計。數學 + 計算機 + 生物學的交叉學科,就成了生物資訊學。

2樓:飯餅餅

美國科學家在2023年提出人類基因組計畫(Human Genome Project,簡稱HGP),目的在於闡明人類基因組核苷酸序列,破譯人類全部遺傳資訊。隨著HGP產生的海量資料,生物資訊學作為一門新興的學科,應運而生。

什麼是生物資訊學?Wikipedia(https://

en.wikipedia.org/wiki/B

ioinformatics

)給的定義是:

Bioinformatics is an interdisciplinary field that develops methods and software tools for understanding biological data. As an interdisciplinary field of science, bioinformatics combines biology, computer science, information engineering, mathematics and statistics to analyze and interpret biological data. Bioinformatics has been used for in silico analyses of biological queries using mathematical and statistical techniques.

簡單說來,生物資訊學是一門交叉學科,結合生物學、電腦科學、資訊工程、數學和統計學來分析和解釋生物資料。

聽起來是不是有點抽象?

簡單說來,人類基因組有30億個鹼基對,可以理解為這是一本由30億個ATCG字母構成的「書」。如何從這本書中翻譯出生命的奧秘呢?目前主流的方法是使用二代測序來測整個人全基因組。

按照經驗,乙個標準的人全基因組測序原始資料可以達到100GB。二代測序技術是將DNA的長鏈分子隨機打斷,然後用化學方法一批批地將小片段DNA擴增和讀取出來。

我們可以這樣簡單理解:

測序相當於將生命之「書」投進碎紙機,變成了一條條碎紙片段(序列打斷),每個片段一般只有幾百個字母。由於碎紙片段實在細碎繁多,可能遺漏某些重要片段,所以通常會把碎紙片影印(聚合酶鏈式反應,PCR)多份,再進行掃瞄(基於螢光標記dNTP的光學檢測),把這些碎紙片段的字母讀取出來。

拿到這些掃瞄後的片段資料(短序列),我們需要用計算機去處理(生物資訊分析),盡可能拼回原來完整的書,並尋找書中獨特的詞(基因變異)。然後去查字典(變異資料庫),看看究竟這些詞表達什麼意思(資訊注釋)。

從大體量的資料中,找到基因突變資訊,這就是生物資訊分析的工作。

生物資訊分析:從入門到精(fang)通(qi) 第0期生信分析是個什麼玩意兒?

3樓:明迪生命線

很多人理解錯了大資料在生物的應用方向,往往將群體的生物行為特徵的資料統稱為生物大資料,卻有意無意地將個體多樣化生物行為特徵的大資料視而不見!原因何在?

一句話,真正的大資料應用在生命科學領域還沒開始!支援這種資料分析的理想工具不會是現有的模型和軟體!原因在於找不到合適的多元非線性分析工具。

我們看看現代生物大資料最熱門的兩個研究方向:

乙個是基因的序列對應基因的表達功能的方向,由於最近高通量測序的興起,測序成本的下降,效率的提高,相關生物體基因序列資料呈幾何級數般遞增,這些資料當然成了大資料。但專業的生物學家關注的僅僅是傳統模式下的基因構成元素鹼基突變所對應表達的生物活性或功能變化,試問生命體果真是由某個或某些鹼基組就對應該生命體的某種生物功能嗎?這是一種以部分或單個的研究替代整體的研究模式在現代生物科學研究中大行其道。

這種研究成果有嗎?有,例如某些罕見的家族遺傳病。但,但是其它常見的內源性疾病呢?

這樣的對應關係存在嗎?所以說這些資料再多有什麼用?

另乙個熱門話題是蛋白質的結構分析,但多數人認為不同的蛋白質結構其作用於其它的蛋白質的結果肯定不同,因為巨集觀上的物質結構不同其作用效果就不同嘛!你能肯定微觀上單個蛋白質分子間作用模式和群體間蛋白質作用模式一致?那麼這些單個分子的外部結構資料形成的結論(例如特異性功能)可以推演成群體間外部的作用結論嗎?

這種由某些外部屬性推導另一些外部屬性的邏輯是什麼邏輯?由某一物質運動的表象推導至另一些物質運動錶象的結論你相信嗎?但這在生物學領域是天天都發生的事情(因為現代生物學只負責記錄和描述觀察或實驗結論),這種資料或結論多又可以成什麼大事?

科學真的發展了嗎?事物運動的本質根本無人知曉。

4樓:

有些人把「分子模擬」也叫成生物資訊學,其實是不一樣的吧。

生物資訊學處理的是大量的資料(比如基因組的資訊),所以才叫資訊學,分子模擬關注的是結構(分子的三維結構)。

通常講的生物資訊學應該不包含分子模擬吧?

大資料時代下的生物資訊學專業與生物資訊學職業?

生物資訊從大面上至少可以分成,開車的和造輪子的,搞汽車裝修的這幾類。除了開車的,其餘很少能夠接觸T以上的資料。我最近在實驗室做一些分析,我也不知道算不算大資料,反正一周樣本都跑下來,快10個T了。現在測序很便宜,乙個樣本測個幾百G,然後平行幾個樣本的事情以後肯定會越來越多。什麼是真正的生物大資料時代...

如何自學生物資訊學?

路西 1 自學生物資訊學遇到的最大問題就是缺乏實戰經驗,只是學習理論和紙上談兵的話,不會真正進入狀態。尤其是程式設計,弄懂原理和邏輯不難,可是不用很快就會徹底忘乾淨。保持不間斷的與資料進行接觸成為保持生物資訊技能的必由之路。2 雖然網上有大量的免費資料可供分析練手,但是只憑興趣愛好恐怕難以堅持。還需...

請問生物資訊學如何?

熱門研究領域,前沿研究領域的密集區。適合 1.數理化生農計電背景的科技狂人,科技宅 2.數理化生農計電背景的,不喜歡社會,喜歡學校的人3.生化環農本科,想找個相對不那麼坑的方向的人4.本科生化環農想轉cs 資料科學,又被客觀條件制約難以硬轉的人不適合 1.一心想找工作,憧憬社會的人 2.理科差的人,...