?
計算語(yǔ)言學(xué)家發(fā)現。機器翻譯對句子很有效。但在文檔層面卻變得不穩定。由于機器學(xué)習和人工智能的不斷突破。近年來(lái)使用神經(jīng)網(wǎng)絡(luò )將文本從一種語(yǔ)言翻譯成另一種語(yǔ)言的技術(shù)得到了突飛猛進(jìn)的提升。因此。機器接近人類(lèi)的表現并不奇怪。實(shí)際上。計算語(yǔ)言學(xué)家有充分的證據來(lái)支持這一主張。蘇黎世大學(xué)的Samuel Laubli和幾位同事表示測試協(xié)議沒(méi)有考慮到人們閱讀整個(gè)文檔的方式。經(jīng)過(guò)評估。機器明顯落后于人類(lèi)。人工翻譯問(wèn)題在于如何評估機器翻譯。目前這是通過(guò)兩項措施來(lái)實(shí)現的:充分性和流利性。翻譯的充分性由專(zhuān)業(yè)的人工翻譯決定。他們閱讀原文和翻譯。以了解它如何表達來(lái)源的意義。流利性由單語(yǔ)讀者判斷。他們只看翻譯并確定其在英語(yǔ)中的表達程度。計算語(yǔ)言學(xué)家同意這個(gè)系統提供有用的評級。但根據Laubli和co的說(shuō)法。當前的協(xié)議只比較句子級別的翻譯。而人類(lèi)也在文檔級別評估文本。因此。他們開(kāi)發(fā)了一種新協(xié)議。用于在文檔級別比較機器和人工翻譯的性能。他們要求專(zhuān)業(yè)翻譯人員評估機器和人類(lèi)在100多篇用中文寫(xiě)成英文的新聞文章中的表現。審查員對每個(gè)翻譯的句子級別的充分性和流暢性進(jìn)行了評分。但關(guān)鍵的是整個(gè)文檔的級別。結果有趣的閱讀。首先。Laubli和co發(fā)現專(zhuān)業(yè)翻譯人員對機器翻譯和人工翻譯句子的充分性評價(jià)沒(méi)有顯著(zhù)差異。通過(guò)這種方法。人和機器都是同樣出色的翻譯者。這與之前的研究結果一致。然而。在評估整個(gè)文檔時(shí)。人工翻譯被評為比機器翻譯更充分和更流暢。他們說(shuō):“人們評估充分性和流暢性時(shí)。評估文件時(shí)。人們對機器翻譯的偏好比孤立句子要強。”研究人員認為他們知道原因。他們說(shuō):“我們假設文檔級別的評估揭示了錯誤。例如模糊詞的誤譯?;蛘吲c文本凝聚力和連貫性相關(guān)的錯誤。這些錯誤在句子級評估中仍然很難或不可能發(fā)現。”例如。該團隊給出了一個(gè)名為“微信挪車(chē)”的新應用程序的例子。人們不斷將其翻譯為“微信移動(dòng)汽車(chē)”。但是在同一篇文章中。哪些機器通常以幾種不同的方式翻譯。機器將這句話(huà)翻譯為“推特移動(dòng)汽車(chē)”。“微信移動(dòng)”和“微信移動(dòng)”。這種不一致。如勞布利和合作。使文件更難以遵循。這表明機器翻譯的評估方式需要從機器單獨考慮每個(gè)句子的系統發(fā)展而來(lái)。“隨著(zhù)機器翻譯質(zhì)量的提高。翻譯將難以在質(zhì)量方面進(jìn)行區分。并且可能是時(shí)候轉向文檔級評估。這為評估者提供了更多了解原始文本及其翻譯的背景。并且還暴露了翻譯錯誤與話(huà)語(yǔ)現象有關(guān)。在句子層次的評價(jià)中仍然是看不見(jiàn)的。“Laubli和他說(shuō)。這一改變應有助于機器翻譯的改進(jìn)。
深圳翻譯公司-深圳譯雅馨無(wú)限