摘要:【目的】通過多視圖協同可視化的方式對時序文本挖掘過程進行可視化,以實現多角度多層面洞察文本數據背后隱藏的規律和信息。【方法】基于文本詞向量矩陣,對多政策主體的政策時序文本,通過數據清洗、計算TF-IDF值、構建向量空間模型、奇異值分解等文本挖掘技術進行信息提取和可交互的可視化探索分析。【結果】選取2016年1月–2017年8月北京市中關村示范區下屬子園區的相關委內信息文本為樣本,采用文本挖掘技術和多視圖協同可視化方法,探索政策文本背后的規律,驗證了本文方法和框架的有效性。【局限】針對大規模文本具體細節單數據點的展示效果不佳,文本挖掘技術有待進一步提升,模型數據吞吐量有待基于大數據架構進一步增強。【結論】本文方法和框架能夠對時序文本類數據做到充分的挖掘展示,更好地把握數據背后的信息,增強政策主體的決策依據。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
數據分析與知識發現雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:數學圖書館 、知識組織與知識管理、情報分析與研究 、應用實踐 、動態、特邀專欄、金融證券管理、企業信息管理技術等。于1980年經新聞總署批準的正規刊物。