摘要:注意力機制逐漸成為目前深度學習領域的主流方法和研究熱點之一,它通過改進源語言表達方式,在解碼中動態選擇源語言相關信息,從而極大改善了經典Encoder-Decoder框架的不足。該文在提出傳統基于Encoder-Decoder框架中存在的長程記憶能力有限、序列轉化過程中的相互關系、模型動態結構輸出質量等問題的基礎上,描述了注意力機制的定義和原理,介紹了多種不同的分類方式,分析了目前的研究現狀,并敘述了目前注意力機制在圖像識別、語音識別和自然語言處理等重要領域的應用情況。同時,進一步從多模態注意力機制、注意力的評價機制、模型的可解釋性及注意力與新模型的融合等方面進行了探討,從而為注意力機制在深度學習中的應用提供新的研究線索與方向。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
中文信息學報雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:綜述、語言資源建設、機器翻譯、信息抽取與文本挖掘、情感分析與社會計算、自然語言理解與生成等。于1986年經新聞總署批準的正規刊物。