翻譯平台UM-CAT研發團隊

文|余偉業、校園記者錢詩雲
圖|何杰平(部分圖片由受訪者提供)

「在線中葡英輔助翻譯平台」(UM-CAT)20年來能不斷的研發和推陳出新,迎合翻譯市場的需求,背後有賴一班現屆和歷屆參與研發的團隊緊密合作和日以繼夜的努力去完善和升級系統。

用戶為先

自然語言處理與中葡機器翻譯實驗室(NLP 2CT)研究助理歐志雄,為研發UM-CAT的骨幹成員之一。他參與設計的「神經機器翻譯系統」,在2017年全國機器翻譯大賽(CWMT2017)「英中機器翻譯評測」中突圍而出,與隊友一起包攬大賽的冠、亞、季軍;而該獲獎的系統,就是套用於現時UM-CAT機器翻譯的核心技術之一。目前,歐志雄擔當UM-CAT的「大管家」,負責UM-CAT系統架設和管理的工作,同時也兼顧為用戶提供良好的使用體驗。

UM-CAT 翻譯系統界面

歐志雄在澳大完成計算機科學學士和碩士學位後即加入實驗室當研究助理,快將近八年,他說:「經過多年的努力,最高興是見到UM-CAT項目能夠推出市場。UM-CAT著重中葡翻譯的品質,尤其針對澳門及葡語系國家慣用語,追求高準確度,且方便用戶使用,故具地區性的市場價值。甚至可以為翻譯公司設立專屬的管理模式,加速其工作流程和完善翻譯質量,這些服務對其他公司而言則較難做到。」

UM-CAT系統研究團隊

完善UM-CAT學習能力

另一參與研發UM-CAT的科技學院計算機科學博士研究生劉學博目前主要負責優化UM-CAT的機器學習演算法,進一步提升現有機器翻譯系統的翻譯品質,這也是他博士論文的研究方向。「目前,機器翻譯主要有兩個步驟:理解和生成,即理解待翻譯的語句,然後生成譯文;而我具體的研究,就是如何完善機器翻譯系統理解譯本的能力。」他解釋道:「只有提供準確度高、具參考價值的翻譯品質,才能真正輔助翻譯人員工作,這樣他們才會樂意使用。」

劉學博表示,UM-CAT與世界上絕大多數的機器翻譯系統一樣,都沿用2015年由加拿大蒙特利爾大學提出的一個框架;然而在2017年,Google公司推出新的框架,而且效果良好,顯著提升了譯文的品質,因此U M -CAT也需要與時俱進。「在優化演算法的領域上,只有不斷利用最新的框架和方法,才能確保機器翻譯的譯文質量得以提升,符合翻譯人員對準確度與流暢度的要求。」同年,黃輝教授率領NLP 2CT研究團隊,赴清華大學作科研交流。劉學博為其中一員,他與清華研究員一起分析Google最新的框架,「最大的收穫就是把這個框架給研究透了。」

2018年11月,研究團隊回到澳門,並開始著手把最新的技術逐步套到UMCAT系統上,以完善其機器深度學習的能力。劉學博說:「以前,機器翻譯系統的訓練,依賴於大規模的平行語料庫,即是幾百萬句中文譯本,與其相對應的葡文譯文,現在是不斷更新神經網路中每一神經元的參數。換言之,只要設計出更好的神經網路,那麼翻譯質量也會相應地顯著提高,可減少漏字的情況,或譯文語句變得更加流暢。」目前,澳大NLP 2CT團隊有兩篇與清華合著的學術論文正向國際學術期刊投稿中,還有一項專利正待審批中。

劉學博赴清華大學作科研交流

翻譯機器的市場潛力

澳大NLP2CT研究團隊在2018年12月推出UM-CAT,現在已經著力為新一代(第四代)UM-CAT作準備。歷代參與該系統研發的校友,如今在不同領域綻放異彩。他們既推動澳門整體發展,亦投身大灣區,參與內地領先全球的企業,如阿里巴巴、百度、騰訊,有的甚至創業當CEO。這班校友見證系統的落地使用,心感興奮。

2012年電腦及資訊科學系碩士畢業生的田亮,畢業後在NLP 2CT當了一年的研究助理,參與不同的機器翻譯研發。「在NLP 2CT團隊裡,我學習到人工智能應用的巨大潛力。」2013年他離開實驗室創立一所在內地註冊的科技公司,主攻人工智能語音及圖像技術市場。UM-CAT作為「澳門製造」產品,他認為UM-CAT具有本土特色和優勢,更重要是服務葡語系國家的營商平台,優先解決葡萄牙語、英語、粵語、普通話等翻譯需要。」看到澳門未來翻譯的市場需求,田亮近年把業務紥根澳門,「現時正值機器翻譯迅速發展的時代,我希望把機器翻譯的相關技術和產品反哺澳門及葡語國家市場。另外,澳大是我的母校,希望透過高校和企業合作,促進UM-CAT在內地市場推出。」

田亮希望促進UM-CAT在內地市場推出

人才輩出

另一位2012年電子商貿科學碩士畢業生曾曉東,在學期間也跨學系積極參與 NLP 2CT項目研發的工作,學習人工智能技術。2018年曾曉東躋身由《麻省理工科技評論》(MITTechnology Review)選出的「中國35歲以下科技創新青年35人」全球最權威的青年科技創新人才榜中,Google聯合創始人Larry Page和Sergey Brin、Facebook創始人Mark Zuckerberg 亦曾榜上有名。他說:「見到自己曾經參與研發的項目循序漸進落地,心情非常雀躍,UMCAT可使語言不再是溝通的障礙。」

曾曉東成為被麻省理工看好的科技創新青年發明家

曾曉東形容他在NLP 2CT學到的創新技術、到葡國當交換生的學習,為他畢業後創業打下強心針,令他明白到「要認真看待、尊重自己的興趣點,並加以發展」。目前,曾曉東在「螞蟻金服」技術實驗室,專注於物聯網與新零售跨領域結合的創新技術探索。他創造了中國首家無人店「淘咖啡」,實現「即走即付」新購物支付體驗的關鍵技術,開啟了內地無人值守的零售大門,成為被麻省理工看好的科技創新青年發明家。他感激澳大科技學院副教授黃輝和助理教授周沁的知識傳授,「澳大學習環境的開放,有機會接觸不同國家和地區的人,這樣的開放的環境能夠幫助鑄造綜合而開放的思維,而且每一位學生可獲得的教學資源可說是全國數一數二的。」

第20期 | 2019年

同期更多故事

2019-11-22T13:12:34+08:00