澳大研發全球首個智能中葡英翻譯平台

文|余偉業
圖|何杰平,部分由受訪者提供

在機器翻譯技術愈趨成熟和普及的今天,不同語言交流中的障礙有望進一步被突破。美國關注全球語言的組織 Globalization and Localization Association GALA 的研究數據顯示,2018年全球翻譯市場高達450億美元,並預計於2021年飆升至562億美元,其中中國市場將佔53.9億美元。面對世界翻譯市場不斷升溫,澳門大學研發的中葡英三語機器翻譯系統也不斷推陳出新,為多語翻譯在質與量上的需求提供更專業的服務。

滿足企業翻譯需要

隨著人工智能和計算機技術的發展,澳大自然語言處理與中葡機器翻譯實驗室(NLP 2CT)取得了重大的研究成果,機器翻譯已成為澳大的重點研發項目之一。其中,NLP 2CT最新研發的「在線中葡英輔助翻譯平台」(UM-CAT),能為中葡英雙語或三語互譯提供更專業的、準確性更高的全文智能翻譯,具體手法包括建立企業專屬的行業用語資料庫,清晰疏理大型翻譯項目的分工安排,有效追蹤翻譯流程及審核進度,以及智能識別參考用語等等。此翻譯平台適合個人、政府部門及企業處理大量多語翻譯項目,提升翻譯效率。UMCAT自2018年12月推出至今,已有近百家國內外機構註冊使用。

據NLP 2CT主任、科技學院副教授黃輝介紹,UM-CAT設計從兩大方面提升翻譯效率:首先,精明翻譯、善用參考。該平台不僅配備核心的智能翻譯功能,更引入翻譯記憶、術語管理、協同翻譯、AI輔助提示等多元設置。「UM-CAT能把不同翻譯員曾經使用或建議的、最終採用的譯文清晰顯示,以供參考,確保行文用語的一致性和準確性。」其次,協助翻譯團隊分工作。UMCAT採用「翻譯/審核/排版」的介面工作模式,靈活對不同的翻譯項目分工,方便管理複雜多元的翻譯任務,同時有效追踪翻譯進度及檢視最終翻譯結果,提高團隊協作效率。另外,NLP2CT透過澳大創新創業中心,針對企業和公司需要,可把UM-CAT個性化,為翻譯員提供完整的解決方案。

黃輝教授的研究團隊

按地域性準確翻譯

對大眾而言,網上也有一些機器翻譯,如Google Translate 就可以翻譯不同語種。但黃輝教授表示,網上翻譯系統一般是通用領域文本的翻譯,細節上未能根據地域上文化差異作出準確翻譯,「例如,澳門的『大三巴』,網上系統就不會把它翻譯得那麼準確地道;又譬如『筷子基』,就會譯成『筷子』餐具和『基本的意思』,而非我們所知道的街名『筷子基』。」他解釋說:「這些系統所翻譯的是大體意思,開發者一般不會關注個別性的或地域性的翻譯效果。相對而言,UM-CAT有很強的澳門本土語文化邏輯,在街道名稱、部門名字、法律語言、常用詞彙等方面的翻譯具有較高的準確度。」

另外,網上翻譯系統不會保留和管理用戶每一次使用後的翻譯知識,UMCAT正好填補了這項功能。黃輝教授說:「例如著作翻譯,當你不滿意一個機器翻譯結果,對某一用語或句子作出調整,你會希望它以後按照你的修改,作同一表達。可惜,網上翻譯系統暫時沒有這種功能。而UM-CAT則可對你翻譯時的行文修改進行記憶儲存,方便日後重覆使用,以及給其他翻譯員參考。」黃輝教授認為,翻譯市場相當大,「大小企業都有自己不同程度的翻譯需求,往往需要有一個輔助翻譯管理系統去改善、加速翻譯工作,管理之前翻譯的文檔 ,而UM-CAT就可解決這方面的需求。」

黃輝教授的研究團隊獲首屆澳門科技獎技術進步獎

機器翻譯並不取代人工翻譯

也許,有人會問,機器翻譯的出現,會令翻譯員失業嗎?黃輝教授認為,這樣的擔心是對機器翻譯的不瞭解,「這項科技的原意是讓翻譯邁向自動化,向人們提供翻譯的建議,至於是否採納,就要按你自身的專業作判斷。」他指出,機器翻譯的結果是不能盡信的,必須由翻譯員作質量上的把關,否則很容易釀成翻譯上的笑話,如母乳餵哺室的一則通告就把中文「男士免進」,翻譯成葡文「Entrada livre does homens」(男士免費進入)。另外,黃教授還強調,人類語言是不斷進化的,機器翻譯也需要不斷的更新,這方面就需要有人不斷地去「教」它,因此,機器翻譯不可能完全取代人工翻譯。

黃輝教授說:「過去五年,機器翻譯的量至少翻了兩倍;而人工翻譯的市場,每年也保持著10%的增長速度。如果內地、澳門的國際化程度達到歐美的水平,翻譯需求將會倍增。人工翻譯,有質量保證,但所需時間較長,且難以應付多種語言之間的翻譯;機器翻譯剛好相反,可以滿足這方面的需求,但翻譯質量難以保證。面對著不可逆轉的世界全球化進程,人工翻譯、機器翻譯,均面對著龐大的挑戰和機遇,兩者只有相互取長補短,才能走向雙贏。」

黃輝教授

澳門機器翻譯第一人

賦予機器翻譯技巧,等同於要機器「能理解、會思考」語言,掌握人類認知智慧,是人工智能技術中最難研發的課題之一,澳門回歸前沒有這方面的研究。1999年,全球首部中葡電子辭典誕生,令黃輝教授成為了澳門機器翻譯研究的第一人。當時,該辭典一推出,就有800多間政府部門及民間企業註冊使用。「回歸前,澳門有大量的官方文件有待翻譯,但卻沒有任何軟件、系統去輔助翻譯,因此有需要開展相關項目的研發。」2007年,時任葡萄牙總理若澤•蘇格拉德訪問澳大,讚揚澳大中葡雙語翻譯研究的成果,相信研究有助推動中葡友好合作。今天,澳大多項機器翻譯研發已大力推動了中葡翻譯工作,有助中葡經貿文化的交往。從無到有,一切都得來不易,黃輝教授說:「目前,澳大已構建起一個跨學科的研究平台,專注於自然語言處理、機器翻譯、機器學習及文本推斷等相關領域研究與系統開發。」

澳大和中國科學院自動化研究所舉辦的聯合研討會上,黃輝教授報告UM-CAT的最新研發成果。

攻克語音翻譯領域的難關

2019年,適逢澳門回歸20周年,黃輝教授與NLP 2CT團隊的下一個目標是攻克中葡語音翻譯領域,「作為機器翻譯的衍生研發,語音翻譯也被認為是未來五年內最具商業潛力的。」目前,NLP2CT正積極研發「會議智能翻譯系統」,預計可做到精準識別及翻譯,滿足多場景同傳交互體驗。黃輝教授透露,相關系統目前仍在測試階段,預計不久的將來可供大眾使用。

第20期 | 2019年

同期更多故事

2019-11-22T13:13:27+08:00