摘要:關系抽取是自然語言處理的重要研究內容,是知識圖譜構建的關鍵技術。目前,在神經網絡中引入注意力機制進行關系抽取成為主流方法,現有方法一般結合句子單詞和實體相關性計算注意力,沒有考慮短語和實體關系之間的相關性,并且對實體信息利用不夠充分。針對該問題,提出基于短語級注意力機制的關系抽取方法。首先用卷積層對詞向量做卷積,以滑動窗口的方式得到短語級的向量表示,然后利用短語與實體關系之間的相關性計算注意力。為了使實體信息利用更充分,用卷積層和池化層分別提取實體短語的深度特征表示,并引入TransE的思想表示兩個實體關系的特征。最后,采用分段池化方法得到深度特征。為了減少遠程監(jiān)督中錯誤標簽的干擾,使用標簽平滑正則化(LSR)把原來的“硬”標簽改為“軟”標簽。實驗結果表明,該方法能夠有效利用短語信息和實體關系信息,對實體關系抽取效果有較大的提升。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機技術與發(fā)展雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內容涉及的欄目:綜述評論、人工智能、信息安全、經驗交流、研究探討、開發(fā)應用、網絡通信、學習園地等。于1991年經新聞總署批準的正規(guī)刊物。