2017年9月初,數(shù)百名機器翻譯研究人員將降臨丹麥哥本哈根。他們在第二屆機器翻譯大會(WMT17)上找出了誰的機器翻譯系統(tǒng)最好。
競爭很激烈。2016年,從20多個機構(gòu)近200個MT系統(tǒng)提交并評估了10個不同的所謂任務(wù)。
自2006年以來,WMT每年舉行一次,首次以年度研討會的形式舉行。隨著近期MT研究的熱潮,2016論壇升級為會議。
WMT17是在2017年9月7日至11日召開的自然語言處理經(jīng)驗方法會議(EMNLP 2017)上召開的,由計算語言學(xué)協(xié)會組織。

對人工智能和自然語言處理等子領(lǐng)域的興趣激增對組織者來說是一個福音,他們說注冊量比最初的估計高出150%。
為了找出哪個系統(tǒng)是最好的,WMT17為研究人員提供了八個常見的任務(wù),包括新聞翻譯、生物醫(yī)學(xué)翻譯、自動后期編輯和神經(jīng)MT(NMT)系統(tǒng)的訓(xùn)練。事實上,2017年是研究人員提交NMT任務(wù)的第一年。2016年,NMT仍然只是作為一個“感興趣的話題”被提及。
新聞翻譯分享任務(wù)的初步結(jié)果是有的,無論是人工評測還是自動評測。一些組織者進行的自動評估結(jié)果也已公布。此外,會議文件草稿已在網(wǎng)上提供。所有共享任務(wù)的最終結(jié)果將在會議期間公布。
WMT 2017的主要組織者包括約翰·霍普金斯大學(xué)語言和語音處理組教授、全知科技首席科學(xué)家Philipp Koehn和愛丁堡大學(xué)高級研究員巴里·哈多。
在列出的21個組織者中,有來自海德堡大學(xué)、愛丁堡大學(xué)和布魯諾·凱斯勒基金會的代表。
在WMT規(guī)劃委員會的115名研究人員中,約有四分之三來自學(xué)術(shù)界,七名來自愛丁堡大學(xué),六名來自阿姆斯特丹大學(xué),四名來自卡爾斯魯厄理工學(xué)院。
蘇黎世大學(xué)的Martin Volcker最近獲得了他的NMT項目的研究資金,紐約大學(xué)的Kyunghyun Cho也將出席,他將在即將舉行的SlatorCon new york conference上發(fā)表演講。
大型技術(shù)公司已經(jīng)涉足WMT多年,2017年,如IBM、谷歌、亞馬遜、微軟。公司計劃委員會中有好的代表。臉書顯然不存在。2017年8月初,宣布徹底轉(zhuǎn)型為神經(jīng)MT。
WMT發(fā)布的成果已經(jīng)成為大規(guī)模的技術(shù)。公司學(xué)術(shù)研究人員和研究團隊評估其系統(tǒng)的關(guān)鍵基準。
然而,商業(yè)機器翻譯提供商往往遠離WMT的競爭,因為它涉及幾個月的準備,結(jié)果是不確定的。如果你的系統(tǒng)排在下半部分,它就不能上市。
然而,例如,商業(yè)提供商將使用WMT來對他們的系統(tǒng)進行基準測試,并在為新的語言組合開發(fā)系統(tǒng)時使用獲得的BLEU分數(shù)來進行完整性檢查。
在WMT之后的主要EMNLP會議上,機器翻譯,尤其是神經(jīng)機器翻譯的會議將被強調(diào)。這些會議將與關(guān)于機器學(xué)習(xí)、多語言自然語言處理(NLP)、NLP應(yīng)用和語言理論的討論一起舉行,僅舉幾例。
編者按:本文已更新,包括新聞翻譯分享任務(wù)的初步結(jié)果。把這個信息交給Tilde的研究員MārcisPinnis,交給我們。
編譯:語言學(xué)家上海翻譯公司