一插菊花综合网,丝袜美腿亚洲熟女 国产,成人天堂资源www在线,骚妇内射图

好育寶

好育寶

「行業(yè)趨勢」機器翻譯能為您提供多少幫助?

admin 156 32

云翻譯平臺的一個優(yōu)勢是數(shù)據(jù)集中。這意味著對一些語言行業(yè)趨勢的鳥瞰,例如機器翻譯(MT)的使用和有效性。目前翻譯工具中的“大數(shù)據(jù)”才剛剛開始出現(xiàn),開發(fā)者還在學習如何使用。我相信在未來,所有的云工具都會根據(jù)用戶統(tǒng)計數(shù)據(jù)來開發(fā)洞察和通知,類似于自由市場Upwork如何識別特定領域前10%的自由職業(yè)者。然而,我們已經(jīng)能做的是找到有用的趨勢,證實假設,摧毀神話。

作為一名研究人員,當我們在今年早些時候?qū)?shù)據(jù)工具引入Memsource時,我非常高興。以下是我們從這一系列行業(yè)數(shù)據(jù)中收集到的一些驚人信息。

MT水平:只有5-20%的MT產(chǎn)量“可以使用”

對于第一項研究,我和我的同事們決定看看機器翻譯(MT)對專業(yè)翻譯有多大幫助。行業(yè)研究機構一項調(diào)查顯示,高達30%的翻譯公司用MT這是可以理解的,因為息稅前利潤率有多低,怎么省每一分錢。公司盈利能力的影響。同時,在任何一個翻譯對話論壇上,機器的翻譯都是那么熱情,竟然把鍵盤都融化了。

我查看了收集的數(shù)據(jù),看是否能為任何一方的說法提供依據(jù)。

分析結果表明,一般MT引擎的建議中,只有5-20%的建議足夠好,可以不加任何改動地使用。編輯后,高達40%的建議是可以的,對于80%的細分市場,MT可以提供自動完成的數(shù)據(jù)。

上圖(點擊放大圖片)中,匹配號表示翻譯與MT引擎建議的相似度:

匹配100:與MT建議同款的專業(yè)人工翻譯。

比賽85-95: MT建議要足夠近才能剪輯。

匹配50-75: mt對于單個單詞的自動完成非常有用,但是對于整段就不太有用了。

匹配為0表示片段與人類翻譯的相關性為0-49。

請注意:您只能跟蹤用戶首先啟用機器翻譯的項目,然后執(zhí)行后期編輯分析。這意味著這里的樣本量大約是3800萬字。

法語、英語、西班牙語和葡萄牙語的機器翻譯更好。

結果顯示,法國、葡萄牙、西班牙和英國的MT發(fā)動機具有最高的潛在MT杠桿率。英轉(zhuǎn)法尤為突出,超過20%的譯文完全匹配MT的建議,其中近90%的譯文至少與MT有一定的連貫性。

相比之下,俄羅斯、波蘭、韓國的杠桿率要低得多,在40%以下,甚至20%,模糊匹配正好是5%。

這種差異可能是由于語言的形態(tài)類型。法語、葡萄牙語、西班牙語和英語是分析性語言,這意味著它們依靠詞序和助詞如“是”或“將”來傳達意思。另一方面,俄語、波蘭語和韓語是合成的,這意味著他們更多地使用變形。機器翻譯仍在努力處理這些細微差別。

對于32%的項目,機器翻譯處于“開啟”狀態(tài)

與其他CAT工具一樣,在Memsource中,用戶可以添加一個機器翻譯引擎,以便在逐段瀏覽文本時獲得快速建議。這個過程被稱為“交互式機器翻譯后期編輯”,它與“經(jīng)典”后期編輯的不同之處在于,譯者沒有義務為每一段使用機器翻譯建議。如果建議太遠,他們可以簡單地忽略它,從頭開始寫。

對于MT選項,翻譯人員通常使用通用引擎,如Google Translate或Microsoft Tran Translator。公司。因此,這項研究首先顯示這些引擎的效果,并不代表針對特定術語和主題領域進行微調(diào)的定制引擎。

「行業(yè)趨勢」機器翻譯能為您提供多少幫助?

如上所述,并不是所有人都是機器翻譯的粉絲。翻譯和語言服務公司人們認為,它有時會影響質(zhì)量或干擾語言學家的專注和自律,而這是提供完美翻譯所必需的。Memsource中只有大約32%的項目啟用了MT支持。即使這個數(shù)字很高,因為“on”選項被設置為默認值。

大約兩年前,我們報告了48%的項目由MT支持。從那時起,我們系統(tǒng)的平均吞吐量從每月1億字增加到6億到8億字,而啟用MT的項目的份額有所下降。我預測這意味著我們的用戶群正在成為整個翻譯行業(yè)的代表。Memsource曾經(jīng)是懂技術的小眾。公司主導工具,今天我們的用戶來自翻譯行業(yè)的各個方面。這有助于解釋百分比的下降。

下一步是什么?

MT使用量會增加嗎?這是毫無疑問的。如今的網(wǎng)絡對話需要快節(jié)奏的翻譯。客戶需要更快的周轉(zhuǎn)時間,而不是他們需要的高質(zhì)量。臉書的著名口號是“做得比完美更好”。

同時,MT的精度也在不斷提高。還不是人類,但是已經(jīng)有了。所以關于啟用mt的爭論更多。