?
當今大學(xué)生現在使用翻譯軟件閱讀英語(yǔ)論文。海外旅行者已把翻譯App作為手機必備應用??礃幼訖C器翻譯就要取代譯員。如同機器在問(wèn)答、導航、收銀這些崗位做到的一樣。譯雅馨翻譯公司簡(jiǎn)單講述一下機器翻譯達到怎么樣的程度呢?
機器翻譯初具“理解”能力
理想豐滿(mǎn)?,F實(shí)亦可期。盡管現在機器翻譯距離人工翻譯還有一段距離。但隨著(zhù)技術(shù)的發(fā)展和人類(lèi)對語(yǔ)言認知的深入。機器翻譯取代人工翻譯很值得期待。
單詞翻譯是最為簡(jiǎn)單的。就是詞典在做的事情。單詞與單詞放在一起。成了短語(yǔ)也可以應付。短語(yǔ)和單詞構成句子。不同場(chǎng)景下有著(zhù)不同的意思。如果還要考慮這些句子在不同篇章中?;谏舷挛恼Z(yǔ)境的意思。這對機器翻譯而言就有點(diǎn)兒難度了。
舉個(gè)通俗的例子。電影字幕的翻譯大家都很熟悉。也都知道只有翻譯者理解了導演要說(shuō)什么。演員要講什么。理解了故事的來(lái)龍去脈。具備對應的專(zhuān)業(yè)背景知識。才能帶給觀(guān)眾好字幕。
工業(yè)界的翻譯技術(shù)與它有異曲同工之處。目前尚處于能夠準確翻譯短語(yǔ)和單詞。同時(shí)不斷提升句子翻譯質(zhì)量的階段。且逐步向精準的篇章翻譯靠齊。
句子翻譯兩大難題:消歧和調序
機器翻譯尚處于“句子翻譯“的初級階段。即準確地理解每一個(gè)句子的基本意思。據百 度NLP(自然語(yǔ)言處理技術(shù))技術(shù)人員介紹。盡管機器翻譯在句法理解上有所突破。但最大的難點(diǎn)還在于消歧和調序。
一個(gè)是順序問(wèn)題。長(cháng)句子。英文的語(yǔ)序和中文的是不一樣的。比如中文“在這張桌子上有一束花”。英文是“There are a bunch of flowers on the table”。這樣的不同是當前機器翻譯的一大難點(diǎn)。機器翻譯需要做到適當地調整順序。
第二個(gè)問(wèn)題是歧義問(wèn)題。一個(gè)詞有多個(gè)語(yǔ)義。比如“看”這個(gè)詞??床?、看書(shū)、看球。是不一樣的;打球、打賞、打牌、打臉中“打”的意思也非常不同。如果直接將句子中的“看”簡(jiǎn)單翻譯為L(cháng)ook自然不行。而這樣的情況又無(wú)法窮舉。
消歧和調序是機器翻譯要解決的最重要的兩個(gè)問(wèn)題。如果能夠突破。機器翻譯未來(lái)就可以幫助人們做更多事情。
機器翻譯突破的殺手锏——NLP技術(shù)
業(yè)界如何解決機器翻譯所面臨的問(wèn)題呢?不妨看看百度翻譯的思路。
百度翻譯的核心方案是依靠NLP技術(shù)。NLP技術(shù)能夠基于海量自然語(yǔ)言語(yǔ)料庫。通過(guò)機器學(xué)習自動(dòng)理解不同單詞、短語(yǔ)和句式。模擬人腦思考過(guò)程去理解自然語(yǔ)言。
比如。為了增加更多語(yǔ)種之間的互譯可能。百 度翻譯選擇中文或英文作為中間語(yǔ)言。在其他語(yǔ)種之間架起一座‘翻譯橋梁’。由于不同語(yǔ)種間的語(yǔ)料規模不一。并且一些小語(yǔ)種間的直接翻譯模型也較小。如果用戶(hù)想要將葡萄牙語(yǔ)翻譯成日語(yǔ)。通過(guò)這項中軸語(yǔ)技術(shù)。機器將自動(dòng)從葡語(yǔ)——中文——日語(yǔ)。葡語(yǔ)——英文——日語(yǔ)等模型中識別并過(guò)濾出最優(yōu)模型。進(jìn)而迅速呈現最優(yōu)翻譯結果。
憑借NLP技術(shù)的深厚積累和領(lǐng)先優(yōu)勢。百 度翻譯在很多方面超越同類(lèi)競品。大規模語(yǔ)料去噪和過(guò)濾技術(shù)、基于樞軸方法的翻譯知識橋接技術(shù)。使得資源匱乏的小語(yǔ)種翻譯成為可能。此外。憑借著(zhù)在中文資源上的先天優(yōu)勢。百 度翻譯還實(shí)現了普通話(huà)和粵語(yǔ)、文言文之間的互譯。
機器面對情緒豐富的人類(lèi)。會(huì )醉嗎?
什么才是好的翻譯?清末著(zhù)名學(xué)者嚴復曾提出三個(gè)字“信、達、雅”。信是指要準確;達是指說(shuō)人話(huà)接地氣;雅則是指譯文要詞語(yǔ)得體、簡(jiǎn)明、優(yōu)雅。最生動(dòng)的例子莫過(guò)于“Bigger Than Bigger”這個(gè)口號的翻譯。中國大陸版本被譯成“比更大還更大”。被廣為吐槽。只做到“信”。香港版本的翻譯“豈止于大”就備受好評。
機器翻譯應該會(huì )很容易翻譯出“比更大還更大”這樣的結果。而要翻譯出“豈止于大”這樣具有信達雅風(fēng)的語(yǔ)句自然還需要時(shí)間。
好在百度、Google等公司都在翻譯上投入大量資源?;谟嬎銠C、語(yǔ)言學(xué)等多種交叉學(xué)科不斷在取得突破。人工智能的技術(shù)基石正在快速發(fā)展。給機器翻譯帶來(lái)了新的契機。
未來(lái)NLP技術(shù)如果能在如何學(xué)習理解人類(lèi)語(yǔ)義方面取得更多技術(shù)突破。機器翻譯取代越來(lái)越多的人工翻譯崗位?;蛟S并非癡人說(shuō)夢(mèng)。
上一篇:英文合同翻譯價(jià)格