如何自學生物資訊學?

時間 2021-05-14 13:53:04

1樓:路西

1)自學生物資訊學遇到的最大問題就是缺乏實戰經驗,只是學習理論和紙上談兵的話,不會真正進入狀態。尤其是程式設計,弄懂原理和邏輯不難,可是不用很快就會徹底忘乾淨。保持不間斷的與資料進行接觸成為保持生物資訊技能的必由之路。

2)雖然網上有大量的免費資料可供分析練手,但是只憑興趣愛好恐怕難以堅持。還需要乙個外部環境的督促,比如資料分析是讀學位或者工作的一部分,那就會很有動力,不斷堅持。

3)如果你要問我有沒有乙個世界公認的生物資訊學的系列課程,只要學會,就能夠立於不敗之地。很遺憾,我還沒發現。作為乙個新學科,整合學科,交叉學科,工具學科和快速發展的學科,一切都變化的太快了,很多東西都在積累,很多東西也不完善。

這也是我們正在努力的方向。加油!

2樓:

這裡大部分都是大神級回答,我從小白的角度回答一下吧。

個人推薦孟浩巍的教程和鹼基礦工的教程,功底深厚,思想深邃,反覆看,會有不同的收穫。

入門的時候,推薦生信媛的教程,很不錯。不過現在的生信媛就不行了,我想這也早就不是生信媛小姐姐的初衷了,她已經潛水很久了。

個人極其不推薦那種零碎的教程,什麼幾小時入門呀,幾小時掌握呀,沒有系統知識,只會販賣焦慮和秀優越,沒有任何幫助。

3樓:歲月靜好

有專案的,不論是為了寫文章臨時抱佛腳,還是真的感興趣。都可以來我們公司。

公司內部培訓課程,經驗豐富的人手把手,一對一教學,時間在二到三個月,每週都有考核,考不過就重考,兩次不過就退回~~換人學。

學的差不多了,就有人帶著你做自己的專案,任何問題隨便問,有人會就有人解答。沒人會,那更好,大家一起學習~

真正讓你感受到了,什麼叫重回高三,什麼叫想起了被考試支配的恐懼

4樓:

我的理念是先學好一些實用的知識和技術,可以順利上手做專案,然後再不斷拓展自己的知識面和理論基礎。這個先實踐,後理論的策略有利於克服開始階段的生疏感和恐懼感。生物資訊學範圍廣泛,平時學習和工作能常用到的理論和方法只是整個系統中的一小部分,因此沒必要載一開始的時候就貪多求全。

最終的目的是達到「一專多精」。一專是要有特長,同事同學有這方面的問題,會第乙個想到你:「找張某某解決生物網路問題」。

這樣才能有特色,被記住。多精是要熟悉多種目前常用的「組學」資料分析:RNA-seq, ChIP-seq, ATAC-seq,metabolomics等等。

具體的學習方法,我建議以RNA-seq為入手專案。一則這種資料非常常見,各種project和publication裡都會用到。二則其中的一些統計知識的方法可以適用到其他型別的資料分析。

RNA-seq我覺得有以下幾個方面:

2. Differential expression。要對DEseq等常見的軟體包用到的統計知識有一定的了解:

poisson distribution,negative binomial,over-dispersion,zero inflation。還要對multiple hypotheses testing有深刻印象,因為這是資料分析裡常會犯的錯誤。

3. principal component analysis。這是乙個很常見也很重要的方法。

可以用來做quality check,看看有沒有novel,unexpected pattern。這些pattern有什麼意義等等。

4. pathway analysis。這也要求對幾種不同種類的enrichment test所用到的統計方法有深刻體會理解,知道每種方法的優劣。

5. data visualization。這是非常關鍵一環。

乙個好的圖勝過千言萬語。我覺得在R裡面ggplot2作圖最好。載Python裡面seaborn最好。

特別推薦一本叫《R graphics cookbook》的書,實用例子很多。作圖是要反覆試反覆改的,要有耐心。

最後,要多看文獻,找到乙個自己感興趣的生物資訊學方向深耕,試著去發明乙個自己的新的計算方法。

5樓:走在畫中

不知道你是什麼背景的。建議看看coursera的課程,裡面data scientist 的課程很實用,生物資訊的課程也很多,可以順便考個證書。

另外,http://

bioinformatics.ca

裡面有很多workshop配合r code,直接上手,針對不同主題,我覺得很有幫助。

如果想開發演算法,那就要有計算機,統計和資料探勘的背景。

生物資訊現在也分很多不同側重的方向,首先知道自己的目標,然後再設計課程吧。想全部都學會時間很長,至少精通也要個三五年,如果只是想應用,不必從全部基礎學起,比如傳統的序列比對,也不是必須要學的了。如果是NGS分析,有很多專題可以學。

6樓:

生物基礎: 生化和分子生物,蛋白質結構和功能,遺傳學。

計算機基礎: python,Linux, R語言。

光靠生信是沒法研究生物的。

7樓:榮聯科技集團

首先需要生信的基礎知識開始學習,然後學習生信常用語言linux、R、perl、python等,最後再進一步學習各種資料的分析。推薦系列書籍https://

8樓:「已登出」

去ENCODE上對照著文件,把每一種資料的處理流程都跑通,得到和官方給出的接近結果,你就已經可以秒至少80%的生物資訊學學生了。

9樓:唄兒唄兒

比較難,你認為學數學的人學生物難,還是學生物的去推數學公式難?生物資訊這個專業的重點不在生物,而在資訊,生物出身,沒有數學沒有統計學基礎,想自己搞明白生物統計,以我菜鳥的水平這個連想都不敢想

10樓:冰室

稍微補充一點......咬文嚼字的話,生物資訊學(bioinformatics)可以理解為生物的(bio-)資訊學(informatics)。也就是說這是一種資訊學。

那麼的話應該以資訊理論的角度來理解問題。雖然說某種程度上這更接近一種"哲學",但是對於理解問題來說非常重要。有閒暇的話推薦閱讀Jeremy Ramsden的Bioinformatics an Introduction第三版,裡面花了很大篇幅在這上面。

例(CB21 p16)"資訊"由兩個部分組成:乙個是先驗部分,是資訊原本存在的結構,比方說對於乙個生物學實驗的測量方式決定了資訊的結構,可以視為Kolmogorov information。乙個是後驗部分,是在先驗部分以外的"未知"部分,即是在給定先驗部分之後系統仍然存在的自由度,可以用Shannon index來量度 。

在乙個生物學實驗的觀測中,後驗資訊的不確定性降低,並以某種方式被觀測者接收 。這時候我們得到的資訊 。這就是乙個基本的資訊理論模型。

為什麼這種理解對於生物學重要呢,這是因為生物學實驗是具有高度不確定性的實驗,也就是說即使精心設計了實驗,依然會面臨極大的不確定性。資訊理論是加深對這種不確定性理解的乙個途徑。當然,如果你只在意統計上的技巧的話,也可以無視這種理論,但是最終要解決的問題是生物學問題的話,最好稍微考慮到生物學資訊的本質。

畢竟生物學最終還是要歸於對某種"編碼"的研究。

11樓:Jiao

建議學 linux (biolinux) + python + R. Perl雖然處理字串挺好,但是應用範圍比較窄,Python好學應用也廣,處理字串不弱於perl,還可以矩陣運算,統計,畫圖,機器學習. 統計方面R是免費的,在生物資訊裡面用的也很多.

12樓:吳俊

上面的生物資訊學人才三層概括起來應該是:

一,需解決的生物學問題已經有解決的框架並且成熟,有軟體可以實現求解,用軟體去解決問題。

二,需解決的生物學問題沒有解決的框架或框架並不成熟,需要開發新的或完善的軟體實現求解。

三,基於資料或實驗提出生物學理論,並從中找出需解決的問題,提出解決框架,實現知識的發現。

13樓:李一佳

個人認為,先會做人的重測序分析。從下機資料BCL轉FASTQ,然後BWA,通過GATK做出VCF。把VCF做出後,確認關鍵的SNP,然後分析這些SNP的,一點一點積累。

這樣對大部分學生物的或者使用到臨床的人就初步可以了。所以先把Linux學好,推薦使用CentOS,搭好平台,把需要的軟體都學會自己裝。同時學會illumina的BaseSpace,可以遠端再做個分析對比。

14樓:高文輝

自己以前是學數學和計算機的(資訊與計算科學),本身專業就帶有些資料分析的目的,所以碩士時就做生物資訊學,個人認為生物資訊學主要分偏資料分析的應用方向(生物資訊分析員)和偏演算法理論的軟體開發方向(生物資訊工程師)。所以在碩士階段我就很蛋疼,想做理論演算法及軟體開發吧,乙個人搞不來(演算法背景不夠深),有本科階段學習的數學和計算機基礎,所以搞搞資料庫開發和基因組資料分析了,個人還是比較崇拜那些玩統計和演算法的生物資訊學人, 無賴自己對這些都不夠深入,所以從生物資訊學資料分析這個應用性的角度總結了該具備的基礎知識以及學習生物資訊學的基本路線。http:

。 基礎打牢固了後,後面的具體分析方向還是很好掌握的。

15樓:SutinCC

現在MOOC那麼火,去裡面逛一圈,幾乎相關需要都涵蓋其中。最關鍵的還是把生物資訊學的來龍去脈,用到的工具等做個掌握。系統和細緻兼具吧

16樓:王煥威

現在有諸多的網路課程,所以你可以自學的。

PLOS Computational Biology: An Online Bioinformatics Curriculum

這個鏈結很全,很實用

這個目前已經有v2了:http://

journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003662

17樓:

生物資訊學有兩方面意義:

基於生物問題導向的和基於設計演算法解決某類抽像過的生物問題的。

基於生物問題導向,主要還以訓練對生物問題的理解為主,同時了解些簡單的程式設計,如R, python,了解那些演算法可以處理你當前的問題。

另乙個方向是基於演算法設計的,需要把一些抽像過的生物問題解決的更好,比如eqtl,gwas,sequence alignment 等等,這些需要比較過硬的數學和演算法基礎。

請問生物資訊學如何?

熱門研究領域,前沿研究領域的密集區。適合 1.數理化生農計電背景的科技狂人,科技宅 2.數理化生農計電背景的,不喜歡社會,喜歡學校的人3.生化環農本科,想找個相對不那麼坑的方向的人4.本科生化環農想轉cs 資料科學,又被客觀條件制約難以硬轉的人不適合 1.一心想找工作,憧憬社會的人 2.理科差的人,...

什麼是生物資訊學?生物資訊學中計算機和大資料各扮演什麼樣的角色?

張旭東 當研究樣本量小 研究物件只是一兩個基因的時候,實驗結果用個小本記一下就行了,不用統計學方法,更用不上計算機程式設計,高效能計算。但是隨著高通量測序技術的發展和人類基因組計畫的完成,大資料 大樣本量的時代來了。樣本量大了,你需要科學的統計學方法 資料量大了,你需要高效的計算機程式設計。數學 計...

大資料時代下的生物資訊學專業與生物資訊學職業?

生物資訊從大面上至少可以分成,開車的和造輪子的,搞汽車裝修的這幾類。除了開車的,其餘很少能夠接觸T以上的資料。我最近在實驗室做一些分析,我也不知道算不算大資料,反正一周樣本都跑下來,快10個T了。現在測序很便宜,乙個樣本測個幾百G,然後平行幾個樣本的事情以後肯定會越來越多。什麼是真正的生物大資料時代...