不信謠不傳謠 講文明樹新風 網絡安全
首頁 經濟 通信科技

人工智能,能否助人類重建“巴比倫塔”

2016-12-19 09:51 來源:科技日報 責任編輯:fl
發送短信 zmdsjb 10658300 即可訂閱《駐馬店手機報》,每天1毛錢,無GPRS流量費。

摘要: 原標題:人工智能,能否助人類重建“巴比倫塔”  假如上帝真的存在,他最近可能有些心事。  在猶太人的古老傳說中,人類曾試圖修建一座通向天堂的“巴

 原標題:人工智能,能否助人類重建“巴比倫塔”

  假如上帝真的存在,他最近可能有些心事。

  在猶太人的古老傳說中,人類曾試圖修建一座通向天堂的“巴比倫塔”。為阻止這個瘋狂的計劃,上帝想出一個絕招——賦予不同族群不同語言,讓人們難以溝通。

  最終,語言的隔閡讓“巴比倫塔”計劃擱淺。直到今天,即便信息和交通技術把世界變成了“地球村”,語系之間的交流,依然只能依靠對彼此語言的專業學習。

  但是現在,人工智能在語言翻譯領域的突飛猛進,又讓人們重新看到了“巴比倫塔”竣工的希望。

  九成六級考生不如“它”

  這段時間,機器翻譯技術可謂高調。

  微軟剛剛在12月13日放出“大招”——推出實時語音翻譯應用Microsoft Translator,支持多人、多語言、跨設備交流。國內企業并未示弱。上個月底科大訊飛在其年度發布會上也展示了類似的技術,可以將中文會議演講實時翻譯成英、日、韓、維吾爾等多種語言顯示在大屏幕上。發布會上推出的語音翻譯機“曉譯”還瞄準了更廣闊的應用場景——出國游玩。

  平時不顯山不露水的在線翻譯應用也已華麗升級。今年9月,谷歌翻譯啟用了谷歌神經機器翻譯(GNMT)系統,在人工智能界引起騷動。而追溯至去年5月,則是百度翻譯發布基于神經網絡的機器翻譯(NMT)系統的時間。

  機器翻譯的高調,依賴于人工智能技術在這一領域的顯著進展。

  百度主任架構師何中軍介紹,自上世紀40年代起,基于規則、實例以及統計的機器翻譯方法漸次登場。2014年起,人工神經網絡開始在機器翻譯領域引領風騷。

  “最終的翻譯效果就是更加流暢了。”科大訊飛機器翻譯研究主管劉俊華告訴科技日報記者,科大訊飛所展示的會議實時翻譯系統和“曉譯”翻譯機便應用了基于神經網絡的機器翻譯方法。

  若問人工智能的到來把機器翻譯“提”到了什么水平,何中軍舉出一道大學英語六級翻譯真題。這道題需要把一句中文翻譯成英文,而百度翻譯應用給出的答案,從詞匯和語法來看都挑不出什么毛病。

  無獨有偶,科大訊飛在推介其“曉譯”翻譯機時也曾表示它可以達到大學英語六級水平。“大學英語六級的翻譯題目滿分為15分,目前機器翻譯答題可以達到11分。”劉俊華解釋說,這意味著機器翻譯技術大概可以超過90%的英語六級考生。

  “煉丹爐”取代了“流水線”

  就在兩三年前,“流暢”和“自然”還是讓機器翻譯研究人員感到頭痛的字眼。那時,基于統計的機器翻譯方法是大熱門。

  短短兩年多時間內,基于神經網絡的機器翻譯系統,就在多個公開測試集上超越了基于統計的機器翻譯系統。

  單從翻譯步驟來看,劉俊華的體會是,基于神經網絡的機器翻譯比其前任“簡潔了非常多”。比如,要把一句中文翻譯成英文,基于統計的機器翻譯方法首先要對句子的詞匯、短語進行切分,然后分別對每個單元進行翻譯,再把翻譯結果組合起來,最后還要進行調序等等。每個步驟都對應著十分復雜的模型。

  形象地說,如果基于統計的方法是一條長長的流水線,基于神經網絡之后只需一個“煉丹爐”。

  新方法被稱為“從端到端”的翻譯。“基本的神經機器翻譯模型包含兩個部分,編碼器和解碼器。”何中軍解釋說,編碼器將源語言句子表示為一個向量,解碼器根據此向量逐詞產生目標譯文。也就是說,一個句子經過一次“加工”就能夠直接輸出目標語言。

  不僅翻譯效率得到了極大提高,結果也更加流暢自然。這是因為,神經機器翻譯方法是對整個句子進行編碼處理,可以照顧到詞匯的上下文信息,因此翻譯出的答案不像統計機器翻譯方法那樣生硬。

  正是“流暢”和“自然”將機器翻譯技術推向更加實際的應用。而且在與其他人工智能技術相結合后,機器翻譯可以真正觸到人們語言不通的“痛點”,從而深度切入商務、旅行、學習等多個場景。

  例如,無論是微軟的Microsoft Translator,還是科大訊飛的會議實時翻譯系統以及“曉譯”翻譯機,都結合了語音識別技術來為語言交談架起橋梁。而融入了光學字符識別(OCR)技術的百度翻譯APP,則可以在國外購物或旅游的場景下,幫助人們翻譯看不懂的英文路牌、菜單和說明書等。

  等待打破“嘆息”之墻

  可以看到,人工智能正在一點一點“捅破”人與人之間的語言隔閡。有網友戲言,或許不久后的一天,揣著裝了高效語言翻譯APP的手機,鄰居大媽也能來一場說走就走的世界旅行。所有國家的學生將徹底掙脫外語課的“黑暗統治”。

  不過,要把重建“巴比倫塔”的美夢寄托給當前、乃至未來一段時間內的機器翻譯技術,還是有點不太現實。

  “基于神經網絡的翻譯技術雖然帶來了機器翻譯質量的較大提高,但是本身還存在諸多技術挑戰。”何中軍說。他把神經網絡比作一個“黑盒子”,中文句子進去,英文句子出來,但是這個“黑盒子”為何要這么翻譯,技術人員還難以對其進行合理的解釋。

  更重要的是,復雜、多變,我們自己都掌握不住的“人性”,仍然是所有人工智能發展的嘆息之墻。

  雖然對單個句子的翻譯可以實現流暢和自然,但是在整個篇章的上下文理解方面,機器翻譯并不給力。一旦涉及歇后語、詩句、雙關語甚至口語化的表達,機器翻譯更會毫不掩飾地掉鏈子。而對于如何將知識融合到機器翻譯系統中,讓機器真正“理解”人類的語言,目前還沒有較好的解決方案。

  從另一個角度來看,無論是基于統計的機器翻譯,還是基于神經網絡的機器翻譯,都以龐大的語料庫為基礎。然而劉俊華告訴科技日報記者,雖然中、英等主要語種的語料相對充足,一些小語種的翻譯,比如科大訊飛目前關注的國內少數民族語言的翻譯,依然會面臨語料短缺的問題。

  “目前的成果可以證明,神經網絡在語言翻譯領域的應用效果不錯,但它的潛力還沒有完全發揮出來。”劉俊華給出的方案是,可以考慮將其他技術路線與基于神經網絡的機器翻譯方法融合起來,使其各施所長,實現更好的翻譯效果。

 

  人工智能會不會取代專業的同聲傳譯?這個簡單的問題竟讓機器翻譯領域的專家們感到為難。何中軍用“任重道遠”作為回答,而在劉俊華看來,對照傳統的翻譯規則——“信、達、雅”,人工智能目前僅能實現“信”,離后二者尚有距離。

  這么說來,上帝或可放寬心:就算人工智能要幫助人類重建“巴比倫塔”,也不過剛剛撿起幾塊磚瓦而已。

  只是,未來呢?

 
(責編:魏艷、趙竹青)

 

責任編輯:fl

(原標題:科技日報)

查看心情排行你看到此篇文章的感受是:


  • 點贊

  • 高興

  • 羨慕

  • 憤怒

  • 震驚

  • 難過

  • 流淚

  • 無奈

  • 槍稿

  • 標題黨

版權聲明:

1.凡本網注明“來源:駐馬店網”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網書面授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:駐馬店網”。任何組織、平臺和個人,不得侵犯本網應有權益,否則,一經發現,本網將授權常年法律顧問予以追究侵權者的法律責任。

駐馬店日報報業集團法律顧問單位:上海市匯業(武漢)律師事務所

首席法律顧問:馮程斌律師

2.凡本網注明“來源:XXX(非駐馬店網)”的作品,均轉載自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如其他個人、媒體、網站、團體從本網下載使用,必須保留本網站注明的“稿件來源”,并自負相關法律責任,否則本網將追究其相關法律責任。

3.如果您發現本網站上有侵犯您的知識產權的作品,請與我們取得聯系,我們會及時修改或刪除。

返回首頁
相關新聞
返回頂部
主站蜘蛛池模板: 国产一区二区精品人妖系列| 老子影院午夜理伦手机| 奇米影视奇米四色888av| 好男人网官网在线观看| 奇米影视77777| 大伊香蕉在线观看视频wap| 在线a毛片免费视频观看| 国产高清无专砖区2021| 特级做a爰片毛片免费看一区 | 毛片a级毛片免费观看免下载| 欧美精品黑人巨大在线播放| 欧美性猛交xxxx黑人| 最好看最新日本中文字幕| 日本不卡一区二区三区最新| 性一交一乱一伦一色一情| 天堂网www在线资源| 国产精品视频一区二区三区无码 | 日产乱码卡一卡2卡3视频| 悠悠在线观看精品视频| 国产精品蜜芽tv在线观看| 国产成人h片视频在线观看| 成人免费在线视频网站| 怡红院精品视频| 国产精品视频第一区二区三区| 国产在线精品一区二区不卡 | www亚洲欲色成人久久精品| 18未年禁止免费观看| 韩国免费A级作爱片无码| 黄色三级免费看| 麻豆乱码国产一区二区三区| 翁房中春意浓王易婉艳| 永久免费毛片在线播放| 日韩欧美在线播放视频| 日韩a在线播放| 国产精品成人99一区无码| 久久久久大香线焦| 暖暖直播在线观看| 亚洲中久无码永久在线观看同| 欧美日韩精品一区二区三区在线| 亚洲蜜芽在线精品一区| 精品久久久久中文字幕日本|