摘要:針對前饋神經(jīng)網(wǎng)絡難以處理時序數(shù)據(jù)的問題,提出將雙向循環(huán)神經(jīng)網(wǎng)絡(BiRNN)應用在自動語音識別聲學建模中。首先,應用梅爾頻率倒譜系數(shù)進行特征提取;其次,采用雙向循環(huán)神經(jīng)網(wǎng)絡作為聲學模型;最后,測試不同參數(shù)對系統(tǒng)性能的影響。在TIMIT數(shù)據(jù)集上的實驗結(jié)果表明,與基于卷積神經(jīng)網(wǎng)絡和深度神經(jīng)網(wǎng)絡的聲學模型相比,識別率分別提升了1.3%和4.0%,說明基于雙向循環(huán)神經(jīng)網(wǎng)絡的聲學模型具有更好的性能。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機與現(xiàn)代化雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:算法設計與分析、數(shù)據(jù)庫與數(shù)據(jù)挖掘、軟件工程、操作系統(tǒng)、人工智能、圖像處理、計算機仿真、計算機控制、網(wǎng)絡與通信、信息安全、電子商務、計算機輔助設計、計算機輔助教學、信息系統(tǒng)與ERP、中文信息技術、多媒體技術、農(nóng)村信息化技術、應用與開發(fā)等等。于1985年經(jīng)新聞總署批準的正規(guī)刊物。