摘要:特征詞提取算法大多以選取單個關鍵詞為主,存在詞與詞關聯(lián)度缺失,文本主題表達不準確的問題,為此提出一種基于詞共現(xiàn)的文本分類算法.通過計算詞間共現(xiàn)率,利用TextRank算法構(gòu)建共現(xiàn)圖得到共現(xiàn)詞組,建立文本向量表示模型,并利用SVM算法實現(xiàn)文本分類.實驗證明,共現(xiàn)詞作為文本特征項相對于傳統(tǒng)單個特征詞有更好的分類效果.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
河北省科學院學報雜志, 雙月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:學術論文、研究簡報、綜述等。于1984年經(jīng)新聞總署批準的正規(guī)刊物。