摘要:互聯網數據的爆炸式增長,使得研究熱點更多轉向Web內容結構化分析。如果將藏語知識以結構化形式表示,那么將會有利于藏語知識的結構化分析和深度挖掘。該文提出了一種優化詞向量的GRU神經網絡模型進行藏語實體關系抽取的方法。在模型的訓練中,加入了優化的詞向量,在傳統的詞向量模型中結合藏語音節向量、音節位置向量、詞性向量等特征對詞向量進一步優化,并且選取了藏語詞匯特征和藏語句子特征。實驗證明,通過使用改進詞向量F1值達到了78.43%。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
中文信息學報雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:綜述、語言資源建設、機器翻譯、信息抽取與文本挖掘、情感分析與社會計算、自然語言理解與生成等。于1986年經新聞總署批準的正規刊物。