生物資訊學現在有哪些難題

時間 2021-05-13 02:21:51

1樓:張大狗

BWT最多能忍受2%的錯誤率,三代測序現在還在10%左右。有必要把現有的BWT的演算法改一改,讓它可以承受更高的錯誤率。不過速度必然是變慢的。

要是有乙個全新的演算法能把10%錯誤率的長序列又快又好的map回genome上去,肯定能發到NBT/NM(當然更有可能會投到bioinformatics)。

2樓:奶油煎蛋紅燒肉

其實有很多難題,這裡舉個很冷的例子,權當拋磚引玉。

生信裡有個經典問題是序列聯配,這裡我們只考慮二序列聯配。DNA 和 DNA 聯配以及蛋白質和蛋白質聯配都有經典的演算法也可以找到相應的概率模型,參見 [1, 2]。而 DNA 和蛋白質聯配的問題卻非常複雜。

我們很難定義乙個DNA-蛋白質的「好的」聯配,對於聯配本身的定義也不止一種 (這裡有一種有趣的定義[3]);

所有現存的DNA蛋白質聯配演算法都含有很多假設,常見的比如 [3], 或者是 BLASTX 都是為了聯配編碼蛋白的DNA且序列短且錯誤少的情形而設計的;

對於 frameshift 的處理方式不明確,當然這裡涉及到演算法設計的用途;

很難在兼顧速度的同時,保持演算法的靈活性(用盡量少的假設);

缺乏對應的概率模型。

[1] A. Krogh, R. Durbin, S.

Eddy and G. Mitchison.Biological sequence analysis.

CambridgeUniversity Press, 1998.

[2] M. C. Frith.

How sequence alignment scores correspond to probability models.Bioinformatics, Jul 2019.

[3] W. R. Pearson, Z.

Zhang and W. Miller. Aligning a DNA sequence with a protein sequence.

J.Comput. Biol.

, 4(3):339–349, 1997.

不太適應用中文寫這個話題,請見諒。

PS 這個問題我們剛剛有了些成果放在了 biorxiv上,也投了AICoB。

Improved DNA-versus-Protein Homology Search for Protein Fossils

3樓:生物家

我是做應用生物資訊學的,做了9年了,有一些感悟分享給大家。

隨著這十多年高通量測序技術的迅猛發展,應用生物資訊學也得到了蓬勃發展。雖然說肯定有相互促進,但是個人感覺還是測序技術在推著生物資訊學往前走。所以,目前仍然有非常多的生物資訊學難題和問題等待解決。

基因組組裝,肯定要算乙個難題,二代的組裝結果裝得散,三代的組裝結果單鹼基錯誤率高(說錯誤率低的我不想槓)。雖然說一條read一條染色體的科幻般的未來終將會到,路還有很長要有。

再來說基因注釋,這是我認為是乙個嚴重忽視了的,但是卻有很多問題亟待解決的領域(不是難題,是問題)。可能大家要麼被「基因組隨便做做就能發文章」的這種幻覺驅動,要麼是處在「趕緊搶乙個基因組」的緊迫階段,似乎對基因注釋的要求就是基因數合理、確實BUSCO評估完整度高。但是,實踐中,會發現不同的流程,注發布來的基因雖然數目差不多,但是基因結果差異很大,哪個是對的還是都錯?

如何優化?等等問題,還需要有志之士去解決。

資料的壓縮儲存。高通量測序資料太大了,太多了,儲存起來太佔空間,這是個難題。

其他的如果有人讀。後面有空了再加吧。

大資料時代下的生物資訊學專業與生物資訊學職業?

生物資訊從大面上至少可以分成,開車的和造輪子的,搞汽車裝修的這幾類。除了開車的,其餘很少能夠接觸T以上的資料。我最近在實驗室做一些分析,我也不知道算不算大資料,反正一周樣本都跑下來,快10個T了。現在測序很便宜,乙個樣本測個幾百G,然後平行幾個樣本的事情以後肯定會越來越多。什麼是真正的生物大資料時代...

請問生物資訊學如何?

熱門研究領域,前沿研究領域的密集區。適合 1.數理化生農計電背景的科技狂人,科技宅 2.數理化生農計電背景的,不喜歡社會,喜歡學校的人3.生化環農本科,想找個相對不那麼坑的方向的人4.本科生化環農想轉cs 資料科學,又被客觀條件制約難以硬轉的人不適合 1.一心想找工作,憧憬社會的人 2.理科差的人,...

生物資訊學 Bioinformatics 和醫學 健康資訊學 Heath Informatics 哪個就業前景好?

狐狸少爺 樓主所說的健康資訊學,在國內應該是醫學資訊學。目前國內醫學資訊學本科專業主要是在醫學院校開設的資訊管理與資訊系統 醫藥方向 大概有40幾所醫學院校都開設此專業。主要課程就是計算機和醫學相關課程,就業目標就是醫院資訊科,醫療軟體公司。隨著移動醫療,醫療大資料,網際網路健康的興起,該專業畢業生...