如何形象地理解數字音訊中位深 動態範圍 噪底,以及三者的關係?

時間 2021-06-03 07:02:30

1樓:jamesr

這些都是數字音訊才有的概念。

位深(bit depth)就是說用多少個位元表示某乙個時間點上的振幅。位元數越多,可以表示的振幅變化就越精確。位元是二進位制的位數,對應到十進位制下可以這麼看,表述0-10之間的變化,如果位深(十進位制下)是1,則有0 1 2 3 ..

9十種可能,而如果位深是2,則有0.0 0.1 0.

2 ...9.8 9.

9一百種可能。CD的PCM格式位深是16bit,也就是可以表示的振幅精度在。

動態範圍(dynamic range)指的是記錄的最大值和最小值之間的距離,這個翻譯其實不夠好,應該翻譯成可活動範圍(變成convention的東西真是沒辦法改)。如果給定同樣的尺度下,動態範圍則由位深決定,比如CD的PCM格式下,動態範圍是,對應的聲壓還要乘以2,即96.33dB。

一般的音響裝置裡面會有乙個動態範圍(通常叫靈敏度)的引數,如果這個引數大於96.33dB,則CD中的動態可以被無損地還原出來;否則就會出現動態的丟失(clipping),表現為低於某乙個值或高於某個值得聲音再不會變化。

所謂底噪(background noise)是指那些完全沒有辦法避免而被記錄的噪音,不一定是環境中的噪音,在控制環境的條件下,更多的是來自於電磁干擾。我們希望我們記錄的非噪音(訊號)要很明顯,而噪音要很不明顯;由於這部分噪音沒有辦法避免,我們只能提高訊號的強度,從而提高訊號和噪音的比值。由於更高的位深,提供了更廣闊的動態範圍,可以在不損失資訊的前提下,放大訊號卻不放大噪音(對於錄音來說最有效的方法就是把錄音裝置湊近點)。

如果沒有更高的動態範圍,則使用這種方法會造成細節丟失。

舉個例子:我們要記錄的訊號是0-10的強度,噪音是2,我們用動態範圍為10,採用精度為1的裝置去記錄,則記錄到的訊雜比是10/2=5。如果我們把裝置湊近點,訊號變成了0-20,如果用同樣動態範圍的裝置去記錄,精度不變,則只能記錄0-10、或者1-11 2-12 ....

,發生clipping,丟失一半的動態;如果要不丟失動態,依然記錄0-10,相當於原來的0 2 4 ..,噪音也相對變成1,訊雜比看似提高了,卻丟失了精度。

P.S. 對於人耳來說,CD的16bit位深基本可以滿足要求,更高的位深意義並不大,但是對於數字音訊工作流來說,更高的位深則是必要的,因為額外的位深可以保證各種音訊處理下原有細節更少的丟失。

同理,取樣率也是如此,CD的44.1kHz採用率,根據Nyquist–Shannon取樣理論是可以完美記錄下人的頻率聽閾(20-20kHz),而且還有4.1Khz的額外頻率用於處理高頻混疊,在具體物理實現上,給低通濾波器足夠的頻率空間。

但是,對於數字音訊工作流來說,48kHz的取樣率使得各種音訊處理下的的細節更多的保留,給處理高頻混疊額外的頻率空間。

一句話,更高的位深和更高的取樣率,並不是為了給人聽的,而是為了給機器處理的時候預留足夠多的動態空間和頻率空間,減少因為處理造成的質量損失。

如何形象地理解選擇公理

陳斌 任何非空集存在真子集。簡單的說,如果乙個裝水果的袋子裡不是空的,總能從袋子裡扔掉乙個水果。我感覺在是說集合裡的元素都是乙個個的,斷不會有0.5個,或者根號2個。 李澤龍 假設你面前有兩堆蘋果每堆九個,要求你每一堆選乙個放到乙個地方形成第三堆,那麼你可以把每堆每個蘋果標號從一到九,選其中標號三的...

如何形象地理解四元數?

陳童 奇妙的四元數 上 陳童的文章 知乎 https zhuanlan p 152568981 奇妙的四元數 中 陳童的文章 知乎 https zhuanlan p 152569453 奇妙的四元數 下 陳童的文章 知乎 https zhuanlan p 152578978 SNAKE Visual...

你們是怎麼理解數字遊民的?

SteveX 我從去年開始試著這麼做了,目前看來一切還好。但是疫情把我的計畫打亂了,本來準備春節後回國,現在航班中斷,估計最快七月才能回去了。對了,我這個不能算標準的數位化工作,在新地點有傳統模式工作,只是比較自由,可以隨時中斷。 文開 NB的嶄新的生活方式!新技術帶來了新的可能性。有一些人的技能導...