計算機基礎:聲音的相關知識筆記

計算機基礎:聲音的相關知識筆記

1、聲音的相關概念

模擬聲音訊號:聲波在時間和幅度上都是連續的模擬訊號。

1。1 聲音的組成

幅度:聲波的振幅。計量單位是分貝(dB)

頻率:聲波每秒變化的次數,用Hz表示。人耳能聽到的聲音訊號的頻率範圍20Hz~20KHz。該範圍內的訊號稱為音訊訊號。小於20Hz稱為亞音訊號。高於20KHz稱為超聲波。根據聲音包含的頻率成分的構成特徵可以分為音樂和噪音。

2、聲音訊號的數字化

聲音訊號屬於模擬訊號,計算機需要把它轉換為數字訊號才能進行處理。需要用二進位制數字的編碼形式來表示聲音。聲音訊號數字化要經歷:取樣、量化、編碼三個步驟。

取樣

:就是把時間連續的模擬訊號在時間軸上離散化的過程。在某些特定時刻獲取聲音訊號幅值稱為取樣。

量化

:量化處理就是把在幅度上連續取值(模擬量)的每一個樣本轉換為離散值(數字量)來表示。量化後的資料時用二進位制的數來表示的,二進位制數位數的多少反映了度量聲音波形幅度的精度,稱為量化精度或者量化解析度。量化精度越高,聲音質量越高,佔用的儲存空間也就越大。

編碼

:為了便於計算機的儲存、傳輸、處理,需要按照一定的格式進行資料編碼,再按照某種規定的格式將資料組織成檔案。也可以採用方法對資料進行壓縮,減少對儲存空間的佔用。

3、數字聲音的主要引數

取樣頻率:表示每秒的取樣數。3個標準頻率為:44。1kHz、22。05kHz、11。05kHz。

量化位數:聲音波形幅度的精度,一般是8位、12位、6位。

聲道陣列:單聲道、雙聲道。

資料率:每秒資料量,一般用bps為單位。

壓縮比:單位時間內的未壓縮音訊資料量與壓縮後的資料量之比。

4、波形聲音

4。1 波形聲音介紹

波形聲音是對聲音訊號直接採用的資料。

資料傳輸速率(bps)=取樣頻率(Hz)*量化位數(bit)*聲道數

聲音訊號資料量(Byte)=資料傳輸速率(bps)*持續時間(s)/8

聲音波形的資料量非常大。在編碼的時候常常要進行壓縮從而減少儲存空間的佔用和傳輸速率。

4。2 波形編碼技術

可以直接對波形取樣資料進行壓縮的處理方法。常用的有差分脈衝編碼調製(DPCM)、自適應差分脈衝編碼調製(ADPCM)和子帶編碼(SBC)等。

波形編碼特點:通用性強,對所有波形表示的數字聲音都有效、聲音質量很高、但很難有高壓縮比。

4。3 感知聲音編碼

感知聲音編碼也是一種常用的編碼技術,它利用波形本身的相關性和人類的聽覺系統特性來 達到壓縮聲音的目的。MPEG系列的音訊壓縮編碼就是典型的感知編碼。

5、聲音合成

5。1 語音合成

目前主要是針對文字轉語音的合成。

流程:文字→文字分析→韻律處理→語音合成→波形聲音

常用的合成技術:發音引數合成、聲道模型引數合成、波形編輯合成

5。2 音樂合成

音樂是用樂譜進行描述而由樂器演奏而成的。樂譜基本組成單元是音符。現代音樂體系中基本音階7個音組成、常用音符88個、電子樂器支援128個。

數字音樂合成方法:數字調頻(FM)合成法、波表法。目前電子音樂合成基本都採用波表法。

6、MIDI

MIDI 是指樂器數字介面國際標準。

7、常用的聲音檔案格式

1、Wave 檔案 (wav):微軟作業系統標準音頻格式屬於波形檔案。質量非常高,檔案資料量很大。

2、Sound檔案(。snd):NeXT Computer公司推出的數字聲音格式,支援壓縮。

3、Audio檔案(。au):用於UNIX系統的數字聲音檔案格式。

4、AIFF檔案(。aif):MAC OS 標準的音訊檔案格式。

5、Voice檔案(。voc):Creative公司的波形音訊檔案格式。

6、MP3:最常用的聲音檔案格式

7、RealAudio(。ra):具有較高壓縮比。

8、MIDI檔案(。mid 。rmi):用於儲存和交換MIDI訊息的一種數字音樂檔案,。rmi格式是Windows中對MIDI檔案格式的簡單擴充套件格式。

想了解更多精彩內容,快來關注資料庫技術筆記