一插菊花综合网,丝袜美腿亚洲熟女 国产,成人天堂资源www在线,骚妇内射图

好育寶

好育寶

「翻譯質(zhì)量」神經(jīng)機(jī)器翻譯存在的問(wèn)題

admin 24 130

不可否認(rèn),最熟悉和最容易獲得的神經(jīng)MT(NMT)引擎是谷歌翻譯。你可能經(jīng)常使用它。結(jié)果看起來(lái)非常好。句子讀起來(lái)非常流利,沒(méi)有機(jī)器翻譯的跡象。這是NMT最大的陷阱 - 看起來(lái)非常好看。

負(fù)責(zé)亞馬遜機(jī)器翻譯研究與開(kāi)發(fā)小組的Alon Lavie在最近的全球演講播客中表示,神經(jīng)機(jī)器翻譯“會(huì)產(chǎn)生非常非常奇怪的錯(cuò)誤......因?yàn)樗皇窃凑Z(yǔ)言和目標(biāo)之間的直接匹配語(yǔ)言的單詞和單詞的順序...“事實(shí)是,陌生感可以被平滑性掩蓋。

乍一看好看

最近我發(fā)現(xiàn)自己通過(guò)谷歌翻譯提供這一行文字。

對(duì)于這些產(chǎn)品,請(qǐng)根據(jù)以下URL中的定義使用視覚化不可視化:

它針對(duì)的是語(yǔ)言學(xué)家,根據(jù)具體情況指導(dǎo)他們使用術(shù)語(yǔ)shikakuka而不是kashika。這兩個(gè)詞都意味著“可視化”,但細(xì)微差別略有不同。而結(jié)果是如此幽默,我認(rèn)為不分享它們將是一種恥辱。

神經(jīng)齒輪發(fā)出嗖嗖聲,立刻給了我這個(gè):

您可能會(huì)認(rèn)為源中的兩個(gè)日語(yǔ)術(shù)語(yǔ)視覚化和可視化將通過(guò)目標(biāo)文本。畢竟,沒(méi)有必要翻譯它們。但不是。相反,它產(chǎn)生了視覺(jué)障礙,一個(gè)大紅旗。只需點(diǎn)擊反向翻譯按鈕(這總是一個(gè)好主意),看看它意味著什么......

好吧,這甚至接近我想說(shuō)的話嗎?避免視覺(jué)障礙?我想歧視某人嗎?當(dāng)然不是。問(wèn)題是,日文文本是如此流暢,它讀起來(lái)就像我真正的意思是真正的意思。

Alon是絕對(duì)正確的。很奇怪。他們的神經(jīng)網(wǎng)絡(luò)內(nèi)部發(fā)生了什么?我可以預(yù)先編輯源代碼以幫助MT產(chǎn)生更好的輸出嗎?也許在句子結(jié)尾處那種不自然的冒號(hào)會(huì)造成某種意想不到的破壞?讓我們把它改成一個(gè)時(shí)期。

不。它仍然給我們提供了有問(wèn)題的視覺(jué)障礙,但接著是一些不同的措辭。

呃,是的 因此,將兩個(gè)點(diǎn)(:)改為一個(gè)(。)會(huì)使我們從“避免視覺(jué)障礙”到“確認(rèn)沒(méi)有視覺(jué)障礙”。幫幫我!

伸出援助之手

好吧,很明顯MT引擎對(duì)英文源中的日文文本感到困惑,因此將這些日語(yǔ)術(shù)語(yǔ)與其他術(shù)語(yǔ)區(qū)分開(kāi)來(lái)可能會(huì)有所幫助,對(duì)嗎?如何將它們放在括號(hào)中:

太好了,不再是視覚病害!現(xiàn)在視覚化毫發(fā)無(wú)損地成為視覚化,而可視化則來(lái)自......第二視視化。是什么賦予了?那么NMT實(shí)際上是在翻譯成日語(yǔ)之前將兩個(gè)日語(yǔ)術(shù)語(yǔ)首先翻譯成相同的英語(yǔ)“可視化”,還是什么?

但除了房間里的大象之外,翻譯的其他部分都做得很好。它正確地認(rèn)識(shí)到在這種情況下使用“不”實(shí)際上意味著“而不是”。也許“下面的網(wǎng)址定義”將被更好地翻譯為“在下面的網(wǎng)址定義,”但比起我們?cè)跊](méi)版本看到了規(guī)模宏偉的問(wèn)題,似乎挑剔' T選用支架。

摘要:在當(dāng)前的Google NMT實(shí)現(xiàn)中,使用括號(hào)來(lái)引用源文本中嵌入的目標(biāo)語(yǔ)言術(shù)語(yǔ)可能有助于NMT更好地理解句子的含義,但是那些相同的目標(biāo)語(yǔ)言術(shù)語(yǔ)(理想情況下應(yīng)保留原樣) )從源頭到目標(biāo)的路上可能會(huì)變得不準(zhǔn)確。所以小心!

非神經(jīng)的情況?

想一想,也許基于短語(yǔ)的統(tǒng)計(jì)MT畢竟不是那么糟糕?我從來(lái)不知道錯(cuò)誤地翻譯已經(jīng)在目標(biāo)語(yǔ)言中的術(shù)語(yǔ)開(kāi)始。它只是做橫向傳球并從另一端出來(lái)。以下是我們?cè)谌毡境S玫膸讉€(gè)在線翻譯的結(jié)果。

首先,我去了 。

保持術(shù)語(yǔ)視覚化和可視化完全沒(méi)有問(wèn)題,但整體翻譯基本上是不可理解的。盡管如此,結(jié)果卻沒(méi)有讓我們感到愉快(喜悅)。

接下來(lái),我嘗試了 。

好吧,翻譯過(guò)程中未翻譯的“不”是一個(gè)好兆頭。在重新翻譯領(lǐng)域中完整拼寫(xiě)出來(lái)的網(wǎng)址似乎有些過(guò)分。但是如果被要求對(duì)這個(gè)輸出進(jìn)行后期編輯,這個(gè)看起來(lái)與以前的雅虎MT大致相當(dāng)(或者更像兩個(gè)都是雙轉(zhuǎn)向架)。

什么神經(jīng)機(jī)器翻譯?

在關(guān)于神經(jīng)MT的播客的第1部分中,微軟機(jī)器翻譯小組項(xiàng)目經(jīng)理Chris Wendt表示,當(dāng)神經(jīng)和統(tǒng)計(jì)機(jī)器翻譯進(jìn)行直接比較時(shí),“統(tǒng)計(jì)將贏得準(zhǔn)確性,神經(jīng)贏得流暢性“在我們的例子中,基于短語(yǔ)的確可以使兩個(gè)關(guān)鍵術(shù)語(yǔ)正確,而神經(jīng)則經(jīng)常使用風(fēng)格,流暢地混淆它們。

當(dāng)人類比較基于短語(yǔ)和神經(jīng)MT的輸出時(shí),自然傾向于認(rèn)為神經(jīng)MT版本“更好”,因?yàn)橥苿?dòng)我們?cè)u(píng)估的關(guān)鍵因素往往是流暢性超過(guò)準(zhǔn)確性。毫無(wú)疑問(wèn),神經(jīng)MT是一種強(qiáng)大而有用的工具。但是,由于流暢性,避免被誤導(dǎo)成一種虛假的安全感 - 或者你可能會(huì)滔滔不絕地使你的讀者,你的公司和你自己感到尷尬。