聲音識別又稱聲紋識別,是生物識別技術的一種,也稱為說話人識別,有兩類,即說話人辨認和說話人確認。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵范圍時可能需要辨認技術,而銀行交易時則需要確認技術。聲紋識別就是把聲信號轉換成電信號,再用計算機進行識別。
一、聲音識別技術的原理
所謂聲紋(Voiceprint),是用電聲學儀器顯示的攜帶言語信息的聲波頻譜。人類語言的產生是人體語言中樞與發音器官之間一個復雜的生理物理過程,人在講話時使用的發聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。每個人的語音聲學特征既有相對穩定性,又有變異性,不是絕對的、一成不變的。
這種變異可來自生理、病理、心理、模擬、偽裝,也與環境干擾有關。盡管如此,由于每個人的發音器官都不盡相同,因此在一般情況下,人們仍能區別不同的人的聲音或判斷是否是同一人的聲音。
二、聲音識別技術的優缺點
聲紋識別的應用有一些缺點,比如同一個人的聲音具有易變性,易受身體狀況、年齡、情緒等的影響;比如不同的麥克風和信道對識別性能有影響;比如環境噪音對識別有干擾;又比如混合說話人的情形下人的聲紋特征不易提取;同時當人感冒,咽喉發炎等情況聲帶特性會發生變化而導致識別障礙……等等。盡管如此,與其他生物特征相比,聲紋識別的應用有一些特殊的優勢:
1)蘊含聲紋特征的語音獲取方便、自然,聲紋提取可在不知不覺中完成,因此使用者的接受程度也高;
2)獲取語音的識別成本低廉,使用簡單,一個麥克風即可,在使用通訊設備時更無需額外的錄音設備;
3)適合遠程身份確認,只需要一個麥克風或電話、手機就可以通過網路(通訊網絡或互聯網絡)實現遠程登錄;
4)聲紋辨認和確認的算法復雜度低;
5)配合一些其他措施,如通過語音識別進行內容鑒別等,可以提高準確率;……等等。這些優勢使得聲紋識別的應用越來越收到系統開發者和用戶青睞,聲紋識別的世界市場占有率15.8%,僅次于指紋和掌紋的生物特征識別,并有不斷上升的趨勢。