一插菊花综合网,丝袜美腿亚洲熟女 国产,成人天堂资源www在线,骚妇内射图

好育寶

好育寶

人工翻譯仍處于領(lǐng)先地位

admin 21 118
計算語言學(xué)家發(fā)現(xiàn),機器翻譯對句子是有效的,但在文檔層面變得不穩(wěn)定。

你可能錯過了香檳瓶塞和自動接收器的淋浴,但最近幾個月,計算語言學(xué)家開始聲稱,神經(jīng)機器翻譯現(xiàn)在的表現(xiàn)與人類翻譯相當(dāng)。

為你推薦

防止皮膚發(fā)皺的藥物這么火,就算這個有爭議的想法有投資人。

Theranos正在關(guān)閉。

臉書和推特,而不是谷歌,出現(xiàn)在國會面前。

準(zhǔn)備好原子收音機

委內(nèi)瑞拉的新加密貨幣似乎并不存在。

由于機器學(xué)習(xí)和人工智能的不斷突破,利用神經(jīng)網(wǎng)絡(luò)將文本從一種語言翻譯成另一種語言的技術(shù)近年來得到了突飛猛進的發(fā)展。所以機器接近人類的表現(xiàn)也就不足為奇了。事實上,計算語言學(xué)家有足夠的證據(jù)支持這一說法。

但是今天,蘇黎世大學(xué)的Samuel Laubli和幾個同事說香檳應(yīng)該重新開始。他們不會反對他們同事的結(jié)果,但他們說測試協(xié)議沒有考慮到人們閱讀整個文檔的方式。他們表示,經(jīng)過評測,機器明顯落后于人類。

問題是如何評價機器翻譯。目前,這是通過兩個衡量標(biāo)準(zhǔn)實現(xiàn)的:充分性和流暢性。翻譯的充分性是由專業(yè)的人類譯者決定的,他們閱讀原文和譯文以理解它如何表達源的意思。流利程度是由單語讀者來評判的,他們只看翻譯,決定用英語表達的程度。

人工翻譯仍處于領(lǐng)先地位

計算語言學(xué)家認(rèn)為這個系統(tǒng)提供了有用的評級。然而,根據(jù)Laubli和co的說法,當(dāng)前的協(xié)議只比較句子級別的翻譯,而人類也在文檔級別評估文本。

因此,他們開發(fā)了一種新的協(xié)議,在文檔級別比較機器和人工翻譯的性能。他們請專業(yè)翻譯對100多篇中英文撰寫的新聞文章中機器和人類的表現(xiàn)進行評價??脊僭u定每個翻譯句子水平的充分性和流利性,但關(guān)鍵是整個文檔的水平。

結(jié)果是有趣的閱讀。首先,Laubli和co發(fā)現(xiàn),專業(yè)翻譯人員對機器翻譯和人工翻譯的充分性的評價沒有顯著差異。這樣看來,人類和機器都是同樣優(yōu)秀的翻譯者,這和之前的研究結(jié)果是一致的。

然而,在評估整個文檔時,人工翻譯被評為比機器翻譯更充分、更流暢。他們說:“當(dāng)人們評估充分性和流暢性時,當(dāng)評估文檔時,人們更喜歡機器翻譯而不是孤立的句子?!?/p>

研究人員認(rèn)為他們知道原因。他們說:“我們假設(shè)文檔級評估揭示了錯誤,如模糊詞語的誤譯或與文本銜接和連貫有關(guān)的錯誤,這些錯誤在句子級評估中仍然很難或不可能發(fā)現(xiàn)?!?/p>

例如,團隊舉了一個新應(yīng)用的例子,叫做“微信移動汽車”,人們不停地把它翻譯成“微信移動汽車”,但在同一篇文章中,通常用幾種不同的方式翻譯哪些機器。機器把這句話翻譯成“Twitter移動汽車”、“微信移動”、“微信移動”。這種不一致,如Rabli和合作,使文件更難遵循。

這說明機器翻譯的評價方法需要從機器單獨考慮每一句話的系統(tǒng)發(fā)展起來。

“隨著機器翻譯質(zhì)量的提高,翻譯在質(zhì)量方面將難以區(qū)分,可能是時候轉(zhuǎn)向文檔級評估了,這為評估者提供了更多了解原文及其翻譯的背景,也暴露了翻譯錯誤與話語現(xiàn)象有關(guān),在句子級評估中仍然是隱形的,”勞布利和何說。

這種改變應(yīng)該有助于提高機器翻譯。這意味著它仍將超過人工翻譯——目前還不是。