摘要:跨語言句子語義相似度計算旨在計算不同語言句子之間的語義相似程度。近年來,前人提出了基于神經網絡的跨語言句子語義相似度模型,這些模型多數使用卷積神經網絡來捕獲文本的局部語義信息,缺少對句子中遠距離單詞之間語義相關信息的獲取。該文提出一種融合門控卷積神經網絡和自注意力機制的神經網絡結構,用于獲取跨語言文本句子中的局部和全局語義相關關系,從而得到文本的綜合語義表示。在SemEval-2017多個數據集上的實驗結果表明,該文提出的模型能夠從多個方面捕捉句子間的語義相似性,結果優于基準方法中基于純神經網絡的模型方法。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
中文信息學報雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:綜述、語言資源建設、機器翻譯、信息抽取與文本挖掘、情感分析與社會計算、自然語言理解與生成等。于1986年經新聞總署批準的正規刊物。