摘要:在我們以前的工作中,提出了基于MapReduce的大數據主動學習算法。在本文中,將這一算法移植到Spark環境,提出了基于Spark的大數據主動學習算法,并對基于MapReduce和Spark的2種大數據主動學習算法從運行時間、文件數目、同步數目和內存耗費4個方面進行了比較研究,得出了一些有價值的結論,這些結論將為相關研究人員提供很好的幫助。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機工程與科學雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:算法研究、圖形與圖象、計算機網絡、神經網絡、仿真技術研究、人工智能、研究與實現、試題選載與博士論文摘要等。于1973年經新聞總署批準的正規刊物。