?
聯(lián)系我們 | SiteMaps| 服務(wù)城市
?
更多分享

熱點(diǎn)內容

關(guān)于譯雅馨

聯(lián)系我們

全國統一服務(wù)熱線(xiàn):

400-8808-295
市場(chǎng)部:400-8808-295
業(yè)務(wù)手機1:18025469690
業(yè)務(wù)手機2:18026945480
Email:info@yiasia.cn
投訴:+8613632989980

總部地址:深圳市龍崗區坂田街道楊美社區龍景小區2號三鼎電商大廈502

騰訊微博 新浪微博

文章內容

全國翻譯公司介紹深圳翻譯公司 李生:機器翻譯界的“愚公”

?

李生

  一個(gè)偶然的機會(huì )。將李生與機器翻譯聯(lián)系在一起。如今。李生從事這項研究已經(jīng)30余年。他帶領(lǐng)的團隊所研制的漢英機器翻譯系統CEMT-I于1989年成為我國第一個(gè)通過(guò)技術(shù)鑒定的漢英機器翻譯系統。爾后。他主要在計算機對句法、語(yǔ)義分析等自然語(yǔ)言處理的策略方面進(jìn)行了中國化的探索。

  本報記者 胡珉琦

  我的老師曾說(shuō)過(guò)要做我們的墊腳石。如今。我就是學(xué)生們的人梯。讓他們踩在肩膀上。

  國際計算語(yǔ)言學(xué)學(xué)會(huì )(ACL)代表了計算語(yǔ)言學(xué)的最高水平。有時(shí)會(huì )在其年會(huì )上頒發(fā)終身成就獎。獎勵在自然語(yǔ)言處理領(lǐng)域作出杰出貢獻的科學(xué)家。就在剛剛結束的第53屆國際計算語(yǔ)言學(xué)學(xué)會(huì )年會(huì )上。中國中文信息學(xué)會(huì )理事長(cháng)、哈工大計算機學(xué)院教授李生成為了第一位獲得此項殊榮的華人。李生是我國最早從事自然語(yǔ)言處理研究的學(xué)者之一。研究漢英機器翻譯已經(jīng)超過(guò)30年。

  學(xué)生“引入門(mén)”

  ACL年會(huì )上。在李生與觀(guān)眾的問(wèn)答環(huán)節里。一位嘉賓幾乎搶了所有人的風(fēng)頭。它就是幫助李生進(jìn)行“同聲傳譯”的實(shí)體智能機器人“小度”。它準確流暢的翻譯驚艷了全場(chǎng)。

  李生說(shuō)。按照普通人的理解。所謂的“機器翻譯”。就是把一種自然語(yǔ)言利用計算機翻譯成另外一種自然語(yǔ)言。事實(shí)上。自從有了數字計算機之后。作為計算機的第一個(gè)應用研究??茖W(xué)家早早就提出了這個(gè)概念。

  1949年。美國數學(xué)家、工程師沃倫·韋弗提出了以計算機進(jìn)行翻譯的設想。1954年美國喬治敦大學(xué)和IBM首次聯(lián)合實(shí)驗使用電腦的機譯系統。用250個(gè)詞將俄文材料譯成英文。這個(gè)實(shí)驗標志著(zhù)機器翻譯進(jìn)入一個(gè)新的發(fā)展階段。我國的科學(xué)家也是從這個(gè)時(shí)期開(kāi)始加入到這股研究熱潮的。據李生介紹。1959年中國就演示了第一部機器翻譯系統??蓪?種俄文句型譯成中文。

  然而。隨著(zhù)計算機技術(shù)發(fā)展的起起落落。機器翻譯的研究進(jìn)展在最初的二三十年里也跟著(zhù)起起落落。而此時(shí)的李生還是計算機信息檢索領(lǐng)域的一名教師。

  直到上個(gè)世紀八十年代。機器翻譯重新得到人們的重視。李生也在偶然的一次經(jīng)歷中。真正開(kāi)始了在該領(lǐng)域的研究生涯。李生說(shuō)。這要得益于自己的第一個(gè)博士研究生、現任微軟亞洲研究院首席研究員周明。

  1985年。李生為周明定下了一個(gè)課題。關(guān)于中文文獻關(guān)鍵詞的自動(dòng)抽取。周明調研結束后發(fā)現。當時(shí)國內還沒(méi)有自動(dòng)抽取關(guān)鍵詞的方法。如要借鑒國外的辦法??梢韵葘⒅形奈墨I翻譯成英文。提取以后再將關(guān)鍵詞翻譯成中文。顯然。這項研究對一個(gè)在讀的博士生而言工作量過(guò)大。于是。李生根據周明自己提出的策略。建議先將研究的重點(diǎn)放在前半部分。也就是文獻的中英文翻譯上。他并沒(méi)有想到。自己與學(xué)生會(huì )在此后30多年的時(shí)間里一直與“機器翻譯”在一起。

  充滿(mǎn)挑戰的機器翻譯

  近年來(lái)。隨著(zhù)網(wǎng)絡(luò )和國際化對翻譯需求的增大。以及翻譯軟件商業(yè)化日趨逼近。機器翻譯研究也進(jìn)入了一個(gè)新的時(shí)期。不過(guò)。李生坦言。與人工翻譯相比。至今機器翻譯譯文質(zhì)量就“忠實(shí)度”和“流利度”而言,都還很難達到理想的標準。這與計算機翻譯的方法、策略有關(guān)。

  最早的機器翻譯主要是基于規則的翻譯系統。它是由詞典和規則庫構成知識源。李生介紹說(shuō)。要想翻譯一個(gè)中文句子。計算機首先要學(xué)會(huì )分詞。就是將一句話(huà)或短語(yǔ)切分成一個(gè)一個(gè)單獨的詞語(yǔ)。同時(shí)確定這些詞語(yǔ)的詞性和語(yǔ)法結構的組合。然后對照漢英字典詞典。找出對應的英語(yǔ)單詞。并根據英語(yǔ)結構規則生成最終的句子。

  “問(wèn)題在于。不同語(yǔ)系的語(yǔ)言。詞序不一樣。語(yǔ)法不一樣。結構不一樣。翻譯容易引起歧義。”李生指出。比如在英文中。單詞以空格分開(kāi)。而中文詞語(yǔ)卻沒(méi)有形式上的分界符。也沒(méi)有形態(tài)變化。在語(yǔ)音層面。漢語(yǔ)中還存在大量同音字詞。又包含復雜的聲調系統和變音變調現象。在不同語(yǔ)義環(huán)境中。詞匯的詞義和詞性都無(wú)法輕易確定。這給計算機理解和分析自然語(yǔ)言帶來(lái)了很大的困難。另一方面。人的翻譯靠知識和經(jīng)驗的積累。常識性的積累越多。翻譯起來(lái)越容易。否則。就會(huì )影響翻譯的效果。

  爾后。隨著(zhù)計算機速度、存儲容量的提升?;谡Z(yǔ)料庫的翻譯系統開(kāi)始占據主流。這種方法以語(yǔ)料的應用為核心。由經(jīng)過(guò)劃分并具有標注的語(yǔ)料庫構成知識庫。最初。研究者希望借助最基礎的中文和英文句式做替換練習。因此。它主要的知識源就是雙語(yǔ)對照的實(shí)例庫。不過(guò)。人們很快發(fā)現。由于該方法需要一個(gè)很大的語(yǔ)料庫作為支撐。語(yǔ)言的實(shí)際需求量太過(guò)龐大。最終。國際上選擇了基于統計的翻譯系統作為最常用的方法之一。

  事實(shí)上。這些方法都曾是李生在30多年間研究機器翻譯的工具。更重要的是他為機器翻譯在國內的發(fā)展作出了開(kāi)拓性貢獻。他所帶領(lǐng)的團隊所研制的漢英機器翻譯系統CEMT-I于1989年成為我國第一個(gè)通過(guò)技術(shù)鑒定的漢英機器翻譯系統。爾后。他主要在計算機對句法、語(yǔ)義分析等自然語(yǔ)言處理的策略方面進(jìn)行了中國化的探索。

  一代又一代的堅持

  當李生從ACL本屆主席、斯坦福大學(xué)教授克里斯托弗D.曼寧手中接過(guò)獎杯的時(shí)候。他始終強調的是。國內自然語(yǔ)言處理研究的發(fā)展和成果。是一批學(xué)者奮斗與合作的成果。他說(shuō)。他所作出的最大努力是一直堅持在該研究領(lǐng)域。沒(méi)有放棄。

  人們有所不知的是。在李生的科研生涯中。他曾做過(guò)20多年的行政工作。為了盡量不分散精力。李生利用晚間、周末、各種假期。繼續干著(zhù)他愿意干且喜歡干的事。不為任何困難所動(dòng)。

  如今。李生已經(jīng)年過(guò)七旬。他卻想到借助深層語(yǔ)義分析來(lái)進(jìn)一步提高譯文的質(zhì)量。機器翻譯從一開(kāi)始就是一個(gè)跨學(xué)科的研究領(lǐng)域。涉及計算機、語(yǔ)言學(xué)、數學(xué)。如今又多了人工智能。

  機器翻譯的質(zhì)量始終無(wú)法得到質(zhì)的突破。近年來(lái)??茖W(xué)家開(kāi)始將目光轉向認知科學(xué)。人類(lèi)在日常生活中進(jìn)行的翻譯是經(jīng)過(guò)大腦神經(jīng)網(wǎng)絡(luò )的理解分析加工完成的。因此。最直接的方法。就是讓機器模擬人腦的信息加工處理過(guò)程。進(jìn)行深度學(xué)習。

  基于深度學(xué)習的翻譯系統的核心是一個(gè)擁有無(wú)數結點(diǎn)的多層神經(jīng)網(wǎng)絡(luò )。一種語(yǔ)言的句子被向量化之后。在網(wǎng)絡(luò )中層層傳遞。轉化為計算機可以理解的表示形式。再經(jīng)過(guò)多層復雜的傳導運算。生成另一種語(yǔ)言的譯文。

  但李生表示。這種全新的研究方向并不意味著(zhù)拋棄過(guò)去的研究和應用成果。而是必須與自然語(yǔ)言處理以及統計機器翻譯技術(shù)等結合起來(lái)才能實(shí)現。

  至今。李生已經(jīng)帶出了42位博士。近200位位碩士。且大多數人依然堅持在最初的研究領(lǐng)域中。其中。不乏包括ACL首位華人主席、百度公司技術(shù)副總裁王海峰、微軟亞洲研究院首席研究員周明這樣的業(yè)界精英。

  李生擅長(cháng)挖掘每個(gè)學(xué)生的不同潛能并進(jìn)行個(gè)性化培養。同時(shí)為他們提供一切可能的學(xué)習與就業(yè)機會(huì )。相應的。李生的學(xué)生們在國內自然語(yǔ)言處理的研究與應用領(lǐng)域做出了大量出色的工作。

  “我的老師曾說(shuō)過(guò)要做我們的墊腳石。如今。我就是學(xué)生們的人梯。讓他們踩在肩膀上。”李生說(shuō)。盡管人類(lèi)對自身大腦在認知領(lǐng)域的探索還在初級階段。也許終其一生仍無(wú)法完成這項挑戰。“但我還有我的學(xué)生和學(xué)生的學(xué)生”。

  《中國科學(xué)報》 (2015-10-23 第5版 人物)

0

上一篇:翻譯哪家公司好的分享深圳翻譯公司 草嬰:一棵樸實(shí)剛毅的小草

下一篇:英文投標書(shū)翻譯說(shuō)說(shuō)深圳翻譯公司 2010-2015年中國翻譯行業(yè)專(zhuān)項調研及投資價(jià)值

?
中文字幕偷乱在线看_av区无码字幕中文_18禁止爆乳美女免费网站_未成18年禁止免费网站