- 相關(guān)推薦
基于16位單片機(jī)的語音電子門鎖系統(tǒng)
摘要:介紹采用聲紋識(shí)別技術(shù)、在凌陽SPCE061A單片機(jī)上實(shí)現(xiàn)的一種語音電子門鎖身份認(rèn)證系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,系統(tǒng)性能穩(wěn)定,識(shí)別效果好,可以推廣使用。
關(guān)鍵詞:聲紋識(shí)別 基于周期 線性預(yù)測 模式匹配 DTW
生物識(shí)別技術(shù)是利用人體生物特征進(jìn)行身份認(rèn)證的一種技術(shù),是目前公認(rèn)的最為方便與安全的識(shí)別技術(shù)。由于每個(gè)人的生物特征具有與其他人不同的唯一和在一定時(shí)期內(nèi)不變的穩(wěn)定性,不易偽造和假冒,所以利用牲識(shí)別和技術(shù)進(jìn)行身份認(rèn)證,安全、準(zhǔn)確、可靠。
在生物識(shí)別領(lǐng)域中,聲紋識(shí)別,也稱為說話人識(shí)別,以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢受到世人矚目,并且益成為人們?nèi)粘I詈凸ぷ髦兄匾移毡榈陌踩J(rèn)證方式。聲紋識(shí)別是一種根據(jù)說話人語音波形中反映說話人生理和行為特征的語音參數(shù),自動(dòng)識(shí)別說明人身份的技術(shù)。
聲紋識(shí)技術(shù)可分為兩類,即說話人辨認(rèn)和說話人確認(rèn)。前者用以判斷某段語音是若干人中的哪一個(gè)所說的,是多選一的問題;而后者用以確認(rèn)某段語音是若干人中的哪一個(gè)所說的,是多選一的問題;而后者用以確認(rèn)某段語音是否是指定的某個(gè)人所說的,是一對(duì)一判別的問題。從另一方面,聲紋識(shí)別又有與文本有關(guān)和與文本無關(guān)兩種,根據(jù)特定的任務(wù)和應(yīng)用,應(yīng)用范圍不同。與文本有關(guān)的聲紋識(shí)別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,每個(gè)人的聲紋模型逐個(gè)被精確地建立,而識(shí)別時(shí)也必須按規(guī)定的內(nèi)容發(fā)音,因此可以達(dá)到較好的識(shí)別效果;而與文本無關(guān)的識(shí)別系統(tǒng)則不規(guī)定說話人的發(fā)音內(nèi)容,模型建立相對(duì)困難,但用戶使用方便,應(yīng)用范圍較寬。
本文介紹的語音電子門鎖是一種在凌陽16位單片機(jī)SPCE061A上實(shí)現(xiàn)的與文本有關(guān)的說話人確認(rèn)系統(tǒng)。該系統(tǒng)主要由說話人識(shí)別模塊、門鎖控制電機(jī)以及門鎖等部分組成。在訓(xùn)練時(shí),說話人的聲音通過麥克風(fēng)進(jìn)入說話人語音信號(hào)采集前端電路,由語音信號(hào)處理電路對(duì)采集的語音信號(hào)進(jìn)行特征化和語音處理,提取說話人的個(gè)性特征參數(shù)并進(jìn)行存儲(chǔ),形成說話人特征參數(shù)數(shù)據(jù)庫。在識(shí)別時(shí),將待識(shí)別語音與說話人特征參數(shù)數(shù)據(jù)庫進(jìn)行匹配,通過輸出電路控制門鎖電機(jī),最終實(shí)現(xiàn)對(duì)門鎖的控制。
1 算法原理
說話人識(shí)別算法原理框圖如圖1所示。
1.1 預(yù)處理
。1)去噪
對(duì)麥克風(fēng)輸入的模擬語音信號(hào)進(jìn)行量化和采樣,獲得數(shù)字化的語音信號(hào);再將含噪的語音信號(hào)通過去噪處理,得到干凈的語音信號(hào)后并通過預(yù)加重技術(shù)濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號(hào)的高頻部分,而且它還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的作用。
。2)端點(diǎn)檢測
本系統(tǒng)采用語音信號(hào)的短時(shí)能量和短時(shí)過零率進(jìn)行端點(diǎn)檢測。語音信號(hào)的采樣頻率為8kHz,每幀數(shù)據(jù)為20ms,共計(jì)160個(gè)采樣點(diǎn)。每隔20ms計(jì)算一次短時(shí)能量和短時(shí)過零率。通過對(duì)語音信號(hào)的短時(shí)能量和短時(shí)過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對(duì)求取基音、LPCC等特征參數(shù)非常有用的濁音信號(hào)。
1.2 特征提取
在語音信號(hào)預(yù)處理后,接著是特征參數(shù)的提取。特征提取的任務(wù)就是提取語音信號(hào)中表征人的基本特征。
1.2.1 特征參數(shù)的選取
特征必須能夠有效地區(qū)分不同的說話人,且對(duì)同一說話人的變化保持相對(duì)穩(wěn)定,同時(shí)要求特征參數(shù)計(jì)算簡便,最好有高效快速算法,以保證識(shí)別的實(shí)時(shí)性。
說話人特征大體可歸為下述幾類:
。1)基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。如譜包絡(luò)、基音、共振峰等。其中基音能夠很好地刻畫說話人的聲帶特征,在很大程度上反映了人的個(gè)性特征。
。2)基于聲道特征模型,通過線性預(yù)測分析得到的參數(shù)。包括線性預(yù)測系數(shù)(LPC)以及由線性預(yù)測導(dǎo)出的各種參數(shù),如線性預(yù)測倒譜系數(shù)(LPCC)、部分相關(guān)系數(shù)、反射系數(shù)、對(duì)數(shù)面積比、LSP線譜對(duì)、線性預(yù)測殘差等。根據(jù)前人的工作成果和實(shí)際測試比較,LPCC參數(shù)不但能較好地反饋聲道的共振峰特性,具有較好地識(shí)別效果,而且可以用比較簡單的運(yùn)算和較快的速度求得。
(3)基于人耳的聽覺機(jī)理,反映聽覺特性,模擬人耳對(duì)聲音頻率感知的特征參數(shù)。如美國爾倒譜系數(shù)(MFCC)等。MFCC參數(shù)與基于線性預(yù)測的倒譜分析相比,突出的優(yōu)點(diǎn)是不依賴全極點(diǎn)語音產(chǎn)生模型的假定,在與廣西無關(guān)的說話人識(shí)別系統(tǒng)中MFCC參數(shù)能夠比LPCC參數(shù)更好地提高系統(tǒng)的識(shí)別性能。
此外,人們還通過對(duì)不同特征參數(shù)量的組合來提高實(shí)際系統(tǒng)的性能。當(dāng)各組合參量間相關(guān)性不大時(shí),會(huì)有較好的效果,因?yàn)樗鼈兎謩e反映了語音信號(hào)的不同特征。
在計(jì)算機(jī)平臺(tái)的仿真實(shí)驗(yàn)中,通過各種參數(shù)的實(shí)際比較,采用MFCC參數(shù)比采用LPCC參數(shù)有更好的識(shí)別效果。但在SPCE061A平臺(tái)上做實(shí)時(shí)處理時(shí),與LPCC系統(tǒng)相比,MFCC系數(shù)計(jì)算有兩個(gè)缺點(diǎn):一是計(jì)算時(shí)間長;二是精度難以保證。由于MFCC系統(tǒng)的計(jì)算需要FFT變換和對(duì)數(shù)操作,影響了計(jì)算的動(dòng)態(tài)范圍;要保證系統(tǒng)識(shí)別的實(shí)時(shí)性,就只有犧牲參數(shù)精度。而LPCC參數(shù)的計(jì)算有遞推公式,速度和精度都可以保證,識(shí)別效果也滿足實(shí)際需要。
本系統(tǒng)采用了基音周期和線性預(yù)測倒譜系數(shù)(LPCC)共同作為說話人識(shí)別的特征參數(shù)。
1.2.2 LPCC參數(shù)的提取
基于線性預(yù)測分析的倒譜參數(shù)LPCC可以通過簡單的遞推公式由線性預(yù)測系數(shù)求得。遞推公式如下:
其中p為LPC模型的階數(shù),也是模型的極點(diǎn)個(gè)數(shù)。
(1)LPC模型階數(shù)p的確定
為使模型假定更好地符合語音產(chǎn)生模型,應(yīng)該使LPC模型的階數(shù)p與共振峰個(gè)數(shù)相吻合,其次是考慮聲門脈沖形狀和口唇輻射影響的補(bǔ)償。通常一對(duì)極點(diǎn)對(duì)應(yīng)一個(gè)共振峰,10kHz采樣的語音信號(hào)通常有5個(gè)共振峰,取p=10,對(duì)于8kHz采樣的語音信號(hào)可取p=8。此外為了彌補(bǔ)鼻音中存在的零點(diǎn)以及其他因素引起的偏差,通常在上述階數(shù)的基礎(chǔ)上再增加兩個(gè)極點(diǎn),即分別是p=12和p10。實(shí)驗(yàn)表明,選擇LPC分析階數(shù)p=12,對(duì)絕大多數(shù)語音信號(hào)的聲道模型可以足夠近似地逼近。P值選得過大雖然可以略微改善逼近效果,但也帶來一些負(fù)作用,一方面是加大了計(jì)算量,另一方面有可能增添一些不必要的細(xì)節(jié)。
。2)線性預(yù)測系數(shù)的求取
自相關(guān)解法主要有杜賓(Durbin)算法、格型(Lattice)算法和舒爾(Schur)算法等幾種遞推算法。其中在杜賓算法是目前最常用的算法,而且在求取LPC系數(shù)時(shí)計(jì)算量也量小,本系統(tǒng)采用該遞推算法。
1.2.3 基音參數(shù)的提取
基音估計(jì)的方法很多,主要有基于短時(shí)自相關(guān)函數(shù)和基于短時(shí)平均幅度差函數(shù)(AMDF)等基音估計(jì)方法。
。1)基于短時(shí)自相關(guān)函數(shù)的基音估計(jì)
短時(shí)自相關(guān)函數(shù)在基音周期的整數(shù)倍位置存在較大的峰值,只要找出第一最大峰值的位置就可以估計(jì)出基音周期。
(2)基于短時(shí)平均幅度差函數(shù)(AMDF)的基音估計(jì)
基于短時(shí)平均幅度差函數(shù)(AMDF)在基音周期的整數(shù)倍位置存在較大的谷值,找到第一最大谷值的位置就可以估計(jì)出基音周期。這種方法的缺點(diǎn)是當(dāng)語音信號(hào)的幅度快速變化時(shí),AMFD函數(shù)的谷值深度會(huì)減小,從而影響基音估計(jì)的精度。
實(shí)際上第一最大峰(谷)值點(diǎn)的位置有時(shí)并不能與基音周期吻合,第一最大峰(谷)值點(diǎn)的位置與短時(shí)窗的長度有關(guān)且會(huì)受到共振峰的干擾。一般窗長至少應(yīng)大于兩個(gè)基音周期,才可能獲得較好的估計(jì)效果。語音中最長基音周期值約為20ms,本系統(tǒng)在估計(jì)基音周期時(shí)窗長選擇40ms。為了減小共振峰的影響,首先對(duì)語音進(jìn)行頻率范圍為Hz的帶通濾波。因?yàn)樽罡呋纛l率為450Hz,所以將上限頻率設(shè)為900Hz可以保留語音的一、二次諧波,下降頻率為60Hz是為了濾除50Hz的電源干擾。
以上兩種方法都是對(duì)語音信號(hào)本身求相應(yīng)的函數(shù)。本系統(tǒng)采用的基音估計(jì)方法是:首先對(duì)帶通濾波后的短時(shí)語音信號(hào)進(jìn)行線性預(yù)測,求取預(yù)測殘差;再對(duì)殘差信號(hào)求自相關(guān)函數(shù),找出第一最大峰值點(diǎn)的位置,即得到該段語音的基音估計(jì)值。實(shí)驗(yàn)表明,通過殘差求取的基音軌跡比直接通過語音求取的基音軌跡效果更好,如圖2所示。圖2中橫坐標(biāo)為語音幀數(shù),縱坐標(biāo)為8000/f,其中f為基音頻率。
下一頁
【基于16位單片機(jī)的語音電子門鎖系統(tǒng)】相關(guān)文章:
鐵電存儲(chǔ)器在新型語音電子門鎖系統(tǒng)中的應(yīng)用03-19
基于ISD語音芯片的報(bào)警系統(tǒng)03-07
基于DSP的語音處理系統(tǒng)的設(shè)計(jì)11-22
基于凌陽單片機(jī)的語音信號(hào)實(shí)時(shí)采集03-18
基于單片機(jī)的實(shí)時(shí)傳真信息監(jiān)測系統(tǒng)03-18
基于單片機(jī)的液位測量系統(tǒng)設(shè)計(jì)03-07
基于TMS320VC5402的語音處理系統(tǒng)03-07
- 探討地方師范院校《計(jì)算機(jī)網(wǎng)絡(luò)》課程教學(xué)實(shí)踐與研究
- 尋找網(wǎng)絡(luò)質(zhì)量的峰值
- 鐵電存儲(chǔ)器在新型語音電子門鎖系統(tǒng)中的應(yīng)用
- 多媒體網(wǎng)絡(luò)安全技術(shù)在綜藝節(jié)目中的運(yùn)用
- 實(shí)現(xiàn)基于網(wǎng)頁的數(shù)據(jù)庫數(shù)據(jù)導(dǎo)入
- 淺談傳輸網(wǎng)絡(luò)及設(shè)備的故障定位處理方法
- 計(jì)算機(jī)開關(guān)電源技術(shù)研究
- 基于16位單片機(jī)的語音電子門鎖系統(tǒng)
- NGN產(chǎn)業(yè)鏈的探討
- 計(jì)算機(jī)網(wǎng)絡(luò)可靠性分析與設(shè)計(jì)分析
- 電子政務(wù)系統(tǒng)論文
- 單片機(jī)畢業(yè)論文總結(jié)
- 單片機(jī)實(shí)訓(xùn)報(bào)告范文
- 工商系統(tǒng)個(gè)人總結(jié)
- erp系統(tǒng)論文
- 電子簡歷
- 醫(yī)療系統(tǒng)招考
- 信息系統(tǒng)實(shí)施計(jì)劃
- 旅游管理系統(tǒng)論文
- erp系統(tǒng)畢業(yè)論文