您現在的位置是:首頁 > 綜合

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

  • 由 三叉貓 發表于 綜合
  • 2021-05-16
簡介影響音質的另外一個因素是位數深度, 我們剛才不是說電腦在聲音檔案裡面會用一個數字就代表每個取樣點的高度嘛

尼奎斯特頻率是多少

今天我們要來聊的是聲音答案的解析度。 不過因為聲音檔案是一個看不見摸不到的東西, 如果你不是經常在做音樂的人,

可能會很難體會。 所以我要先用圖片檔案的解析度來做類比。這樣子你才會比較好懂。 關於圖片答案解析度的名字, 大家最熟悉的大概就是畫素這兩個字。所謂的畫素就是組成畫面的最小的元素, 所以你在電腦上可以看到的圖片或是影片都是有像這樣子的一個一個小方格組成的。 這邊的每一個小方格,我們就叫它是一個畫素, 電腦儲存圖片的方式就是把每個畫素的顏色都轉換成一個數字寫在檔案裡面。

有了每個畫素的顏色。 資訊, 電腦就可以在螢幕上面出現一張圖片,一張圖片檔案含有的畫素數越多, 基本上就表示它含有越多細節, 也就是說你可以把它放很大的,會不會變成一格一格的六十好像是這張照片

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

它是我的單反相機拍的, 他從左到右有5184個畫素,從上到下有3456畫素, 所以整張圖片就是5184x3456差不多樂器版本我畫素, 所以我可以把它放到很大很大清楚的看到她眼睛的細節

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

那是我這張圖片被上傳到朋友圈的話,因此, 為了節省空間, 會把轉檔成大約只有一百萬畫素的格式,那你放大的時候就很容易看到一格一格的很多細節都不見得比較下差很多吧。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

除了畫素的多少之外, 很多人不知道的事情是用來敘述每個畫素顏色的數字範圍也是很重要的。

我剛才不是說電腦儲存圖片的方式就是把每一個畫素的顏色都轉換成一個數字, 寫在檔案裡面嗎? 在2019年,我們所用的圖片多半都是採用24位數的色彩格式。 就是說 在每一個畫素電腦是用一個從零一直到二的24次方減一這個範圍當中的一個數字來代表那個畫樹的顏色。再換句話說, 也就是我們總共可以有二的24次方種, 也就是16777216種不同的顏色。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

但你有那麼多種顏色可以用。 當然可以表達很細微的顏色差距。 那如果我們來把描述色彩的為位數數降低試試看,

若降到8位格式, 我們就只剩下2的8次方, 一共256種顏色可以使用了那個圖片就會變成像是這樣子。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

你可能覺得250多種顏色還是很多的吧, 對不對這個圖片看起來好像也是還好啊, 但是我把顏色說更降低了。

7位原格式的話就剩下128種音色。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

接下來是6位原格式就剩下64種顏色

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

這是5位原格式,也就是隻有二的五次方32種可能的顏色到這邊

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

你應該會發現漸漸有一塊一塊的色塊出現的。 這是因為在只能有32種顏色的情況下,已經 沒有辦法表達顏色的細微差距,所以所有的顏色都要被四捨五入進32種顏色之中的其中一種。 那我們繼續調低色彩數試試看。

這個是四位原格式整張圖片只有16種顏色

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

三位原格式整張圖片只有八種顏色,

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

要是二位原格式只能圖片只有四種顏色。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

最後是一位原格式, 也就是整張圖片, 只能有兩種顏色。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

最後整理下在非壓縮的圖片檔案格式裡面影響畫質的因素主要有兩種, 一個是畫素的數量, 影響形狀的解析度。

另外一個是色彩的位數, 它會影響色彩的解析度。 說了這麼多圖片檔案的事情。

現在我終於要來到聲音檔案檔案了。 在非壓縮的聲音檔案當中, 影響音質的因素有兩個,一個是取樣頻率。 另外一個是位數深度。 接下來我要跟你解釋這兩件事情的影響聲音檔案裡面的取樣就像是圖片檔案裡面的畫素一樣。如果在錄影轉裡面把聲波放大。 你就可以看到在電腦裡面升檔也是跟圖片答案一樣, 用一個一個小點點儲存起來的電腦。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

在聲音檔案裡面, 就是用一個數字代表每個取樣點的高度。 他知道的每個點點的高度之後,電腦就可以還原整段聲波,那所謂的取樣頻率, 就是再說一秒鐘電腦繪畫幾個點點來記錄聲波。再說, 理論上畫越多個點, 就越可以記錄瞬間的聲波變化。

但是跟圖片答案不同的是, 人可以把圖片放大來看, 但是你沒有辦法把升檔按放大來聽,以更多的取樣點三理論上可以進入更高頻率的細節。 但是人聽不到, 所以完全沒有用武之地。

根據所有的尼奎斯特定理, 要保留某個頻率的聲波, 你必須用兩倍以上的取樣頻率才能把它記錄下來。那一般認為人類的耳朵可以聽到的最高頻率是2萬Hz, 但要記住所有人類聽得見的聲音, 頻率,範圍, 你只需要用兩倍, 也就是每秒四萬個以上的取樣點就可以了。

在2019年, 在油管上面聽到的大部分影片的聲音都是每秒四萬八千個取樣點(48kHz)的取樣頻率錄製的。 而一般音樂專輯或者CD唱片國內影片網站的取樣頻率還會稍微再低一點點。常見的規格是每秒四萬四千一百個(44。1KHz)取樣點, 不過這兩種格式都已經比四萬還要高, 所以都可以完全進入到人類聽得見的頻率。

影響音質的另外一個因素是位數深度, 我們剛才不是說電腦在聲音檔案裡面會用一個數字就代表每個取樣點的高度嘛。 在一般入門等級的USB麥克風,它裡面那個把聲波轉換成數字訊號的那個轉換器, 多半都是16位數的又叫做16 bit ADC。也就是說, 它可以讓每個取樣點有二的16次方, 一共65536種可能的高度。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

那時候, 你實際上的那個聲波沒有剛好落在那個轉換器可以記錄的那六萬多種高度上面的話怎麼辦呢? 那就想前面圖片檔案的時候要四捨五入了。

你看種假設我有一個聲波是這個樣子,然後我要在這五個時間點坐騎一樣。 但是我的取向點並不是可以掛在任何一個地方。

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

取樣點是有刻度的, 以16位的錄音來說, 要畫到哪六萬多個刻度當中的其中一個,所以說, 你的聲波在取樣的那個時間點當時沒有正好落在刻度上的話, 我們就只好四捨五入取最接近的那個取樣點來記錄。那你看我們記錄的聲波不就跟原來的聲波有誤差了, 這樣子的誤差就叫做量化誤差, (Quadratuer Error)

怎麼樣才能有好音質,音訊的取樣頻率和位數是什麼意思?

量化誤差在實際上面的表現就是會產生雜音, 那你的轉換器每多一個位數大約就可以減少六分貝的量化誤差的雜音, 16位數的錄音的量化誤差雜音,大約可以比最大訊號小聲96分貝2,而4位數錄音的量化誤差造成的噪音會比最大型號小升144分貝。

當你用16位模式錄音的時候, 因為麥克風裡面的那個轉換器把聲波轉成檔案時量化誤差產生的雜音比較大,所以你會想要在錄音的時候就把音量開大一點點來儘量改掉那些雜音。 但是錄音的時候音量太大的話又會有音量爆掉的風險。如果你用24位模式錄音的時候,你可以把麥克風的音量關很小都沒有關係。 因為就算你再錄完音之後, 再把檔案整個調大個二十分貝到三十分貝你都還是完全聽不到因為量化誤差而產生的雜音。 當然我還是要提醒你以上說的雜音都是你的麥克風,把聲音轉換成數位檔案的時候, 因為數字計算的四捨五入而產生的雜音, 而不是說你錄音的時候環境的雜音。那個環境的雜音是不管你用幾位的模式錄音都沒有辦法去除的。

Top