摘要:在我們以前的工作中,提出了基于MapReduce的大數(shù)據(jù)主動學習算法。在本文中,將這一算法移植到Spark環(huán)境,提出了基于Spark的大數(shù)據(jù)主動學習算法,并對基于MapReduce和Spark的2種大數(shù)據(jù)主動學習算法從運行時間、文件數(shù)目、同步數(shù)目和內(nèi)存耗費4個方面進行了比較研究,得出了一些有價值的結(jié)論,這些結(jié)論將為相關研究人員提供很好的幫助。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機工程與科學雜志, 月刊,本刊重視學術(shù)導向,堅持科學性、學術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:算法研究、圖形與圖象、計算機網(wǎng)絡、神經(jīng)網(wǎng)絡、仿真技術(shù)研究、人工智能、研究與實現(xiàn)、試題選載與博士論文摘要等。于1973年經(jīng)新聞總署批準的正規(guī)刊物。