聲紋識(shí)別防偽技術(shù)有兩個(gè)關(guān)鍵問題,一是特征提取,二是模式匹配,具體分別是:
1、特征提取:提取并選擇對說話人的聲紋具有可分性強(qiáng)、穩(wěn)定性高等特性的聲學(xué)或語言特征。這個(gè)與語音識(shí)別不同,聲紋識(shí)別的特征必須是“個(gè)性化”特征,而說話人識(shí)別的特征對說話人來講必須是“共性特征”,表征一個(gè)人特點(diǎn)的特征應(yīng)該是多層面的,包括:
(1)與人類的發(fā)音機(jī)制的解剖學(xué)結(jié)構(gòu)有關(guān)的聲學(xué)特征,如鼻音、帶深呼吸音、沙啞音、笑聲等;
(2)受社會(huì)經(jīng)濟(jì)狀況、受教育水平、出生地等影響的語義、修辭、發(fā)音、言語習(xí)慣等;
(3)個(gè)人特點(diǎn)或受父母影響的韻律、節(jié)奏、速度、語調(diào)、音量等特征。
根據(jù)不同的任務(wù)需求,聲紋識(shí)別防偽技術(shù)還面臨一個(gè)特征選擇或特征選用的問題,例如在刑偵應(yīng)用上,對“信道”信息希望弱化信道對說話人識(shí)別的影響,而在銀行交易上則希望信道對說話人識(shí)別有較大影響,從而可以剔除錄音、模仿等帶來的影響。
總之,聲紋識(shí)別防偽需要提取較好的特征,就應(yīng)該能夠有效區(qū)分不同的說話人,但又能在同一說話人語音發(fā)生變化時(shí)保持相對的穩(wěn)定,同時(shí)不易被他人模仿或能夠較好地解決被他人模仿問題;具有較好的抗噪性能,這樣才能實(shí)現(xiàn)聲紋識(shí)別防偽。
2、模式識(shí)別:模式識(shí)別有幾大類方法,分別是:
(1)模板匹配方法:利用動(dòng)態(tài)時(shí)間彎折(DTW)以對準(zhǔn)訓(xùn)練和測試特征序列,主要用于固定詞組的應(yīng)用(通常為文本相關(guān)任務(wù));
(2)最近鄰方法:訓(xùn)練時(shí)保留所有特征矢量,識(shí)別時(shí)對每個(gè)矢量都找到訓(xùn)練矢量中最近的K個(gè),據(jù)此進(jìn)行識(shí)別,通常模型存儲(chǔ)和相似計(jì)算的量都很大;
(3)神經(jīng)網(wǎng)絡(luò)方法:有很多種形式,如多層感知、徑向基函數(shù)等,可以顯式訓(xùn)練以區(qū)分說話人和其背景說話人;
(4)隱式馬爾可夫模型方法:通常使用單狀態(tài)的HMM,或高斯混合模型(GMM),是比較流行的方法,且聲紋識(shí)別防偽效果比較好;
(5)VQ聚類方法:這種模式的聲紋識(shí)別防偽效果比較好,算法復(fù)雜度不高,和HMM方法配合起來更可以收到更好的效果;
(6)多項(xiàng)式分類器方法:有較高的精度,但模型存儲(chǔ)和計(jì)算量都比較大。
聲紋識(shí)別防偽技術(shù)需要解決的關(guān)鍵問題主要有以上兩個(gè),但其實(shí)還有很多,諸如短話音問題,能否用很短的語音進(jìn)行模型訓(xùn)練等等,都需要技術(shù)的進(jìn)一步開發(fā)和完善。
深圳市兆信防偽技術(shù)有限公司有著從業(yè)20年的防偽經(jīng)驗(yàn),服務(wù)過多家知名企業(yè),具有專利性的技術(shù),對于防偽防竄貨有豐富的經(jīng)驗(yàn),可以提供多種個(gè)性化的防竄貨解決方案,如有需要或希望得到進(jìn)一步了解,可致電免費(fèi)熱線電話:0755-8883 0778,將有專人為您提供詳細(xì)的咨詢和服務(wù)。