人體30億個鹼基對的基因組,容量有多少兆?

時間 2021-05-11 23:52:15

1樓:江駿

高票答案關於 3G 的解釋,我覺得有問題。

不應該因為 00,01,10,11 有四種,所以就把 750M 乘以 4 得到 3G。這個運算是沒有意義的,計算機不是這樣儲存資料的。

30億鹼基對,只需記錄單鏈:

按計算機二進位制的方法記錄:750MB

按純文字記錄:3GB

詳細來說

按計算機二進位制記錄:

因為一共只有 ATCG 四種情況(可以轉換成計算機的 00、01、10、11),所以每乙個鹼基,要用 2 位二進位制(2 個 bits)記錄。

30億 x 2 = 60億bits

然後就是單位換算。計算機裡,我們通常說的 KB、MB、GB 都是指「大B」, 1B = 8bits。

60億bits / 8 = 750,000,000 B =750 MB

按純文字記錄:

上面二進位制的檔案,機器能讀,而且體積小,傳輸用它就可以了,但人是不方便閱讀的。

人能讀的是 ASCII 碼,是直接記錄「A」、「T」、「C」、「G」這樣的字元。

乙個 ASCII 字元,大小是 1B。

所以,如果按純文字儲存 30億個字母,

30億字母 = 3,000,000,000 B =3 GB

2樓:

總共3G。一般做全基因組測序需要30-40x的覆蓋度(保證一定的測序質量),因此測序一次全基因組得到的資料量將有90-120G

3樓:Xi Yang

首先,你不用儲存鹼基對。

然後,真實的完成圖,儲存的東西遠遠多於序列本身。你起碼得把蛋白注發布來吧?這就得儲存一堆位置座標、注釋文字等等。

然後,作為高等真核生物,有N多的調控序列、非編碼RNA基因,這又是一大堆注釋。你要是存成檔案,這怎麼也得是序列本身的三倍以上。

4樓:徐志超

每個鹼基對有2個鹼基,所以共有60億個鹼基。

不可以這麼算,因為鹼基配對是有原則的,A對T,C對G。確定了一邊的鹼基,另一邊的鹼基不會有其他可能。所以不能算兩個。

如果鹼基對可以隨便配,那才可以算兩個。

細胞裡的沒有表達的鹼基對,如果表達了會怎樣?

頓河畔羅斯托夫莊園主 推薦去看一下 自私的基因 這本書,生物的軀體,細胞可能就是基因用來保護自己的工具罷了,如果我們以鹼基對為中心去看待這個問題的話。 想多了。沒表達的這些鹼基,可能有一些假基因還有些表達意義,其他絕大多數,基本可以認為表達後不具備生物學功能 並不是說這些鹼基本身沒有生物學功能,請注...

如何看待基因對人體的作用,以及人生而平等與基因優劣的關係?

Nothing 基因是人與生俱來的生命資訊,決定著人的生老病死,然而基因隨環境的改變是滯後的。環境改變以後,基因不可能馬上就跟著改變。這也是非常合理的,如果環境一改變基因就改變的話。那麼基因就會變來變去,失去了遺傳的穩定性。基因沒有優劣。現在看來對人有優勢的基因,在過去或者未來都可能失去優勢。比如鐮...

現代人體內的尼安德特人的基因在遠古時期對適應環境起到那些好處?

十八子 血栓 當時他們的環境容易造成身體受傷,比如男人狩獵時 比如女人採集時,血液粘稠便於減少失血。同樣程度的傷,血粘的人活下來的機率大。自體免疫疾病如紅斑狼瘡 喝的水不乾淨,吃的肉不乾淨,到處寄生蟲和細菌 病毒 自體免疫力一定要繃緊弦,不能輕易放過病原體,便於抵抗病魔,從疾病裡痊癒。但現在的人吃的...