最近,我讀了一篇文章,其中Facebook語言技術(shù)團(tuán)隊(duì)工程總監(jiān)Alan Packer談到了他的公司使用神經(jīng)機(jī)器翻譯(MT)。他說的其中一件事是,他們需要建立自己的MT引擎,而不是使用第三方服務(wù),因?yàn)槿藗冊贔acebook上的說法不同。
它讓我想知道這是否確實(shí)如此,并讓我想起了一些相關(guān)的問題。我們的社交媒體溝通如何影響語言?它如何影響翻譯?
FB的語言?不是真的在這篇文章中,Packer詳細(xì)闡述了不同的含義:它是使用俚語,口語,在旅途中制作的首字母縮略詞,以及在一個帖子中實(shí)現(xiàn)突然的病毒式傳播,主題標(biāo)簽,有時甚至超過一種語言。
如果將此與人們在其他社交網(wǎng)絡(luò)上的通信方式進(jìn)行比較,Packer可能會有所幫助。例如,人們在LinkedIn上并不是非正式的,因?yàn)樗麄兛赡軙庾R到他們的老板,同事和客戶。Twitter也不像Facebook這樣的圍墻花園,所以談話仍然需要破譯。
但是,如果您將Facebook的語言與我們與朋友和家人使用的語言進(jìn)行比較,您認(rèn)為它有多么不同?并不多,除了可能“frie”某人或“不喜歡”某些東西 - Facebook獨(dú)有的術(shù)語。在FB上,我們穿著睡衣,所以我們可以讓警衛(wèi)稍微放松一下,更加非正式地說話。
正是由于這個原因,F(xiàn)acebook無法使用現(xiàn)成的MT解決方案:這些引擎沒有Facebook必須學(xué)習(xí)的相同語料庫。相反,他們從政府文件和網(wǎng)絡(luò)上具有更多正式語言的其他內(nèi)容中學(xué)到了東西。因此,輸出不會模仿Facebook用戶期望的非正式性。
我們明白了。盡管如此,人們很難接受人們在Facebook上的獨(dú)特話語。讓我們退一步吧。如果你和我一樣老,你可能還記得雅虎!Messenger,MSN Messenger或ICQ。(確實(shí)聽起來很久以前,嘆了口氣。)那些日子你也會知道與陌生人熟悉的對話啟動:“ ASL(年齡,性別,地點(diǎn))?“想想看,在那些日子里,我們與互聯(lián)網(wǎng)上的許多陌生人交談過,而不是現(xiàn)在。
關(guān)鍵是我們在Facebook到達(dá)現(xiàn)場之前很久就開始了BRB-ing和G2G-ing,即使在今天,簡潔和不敬也不僅限于Facebook。
這不僅僅是英語英語不是人們在社交媒體上使用不同的唯一語言。人們在世界各地的調(diào)整和扭曲他們的語言來傳統(tǒng)主義的恐懼只是這樣他們就可以將他們的手指有點(diǎn)少。
還有一個更大的問題,即社交媒體和互聯(lián)網(wǎng)是否會破壞我們的語言,但“經(jīng)濟(jì)學(xué)人”認(rèn)為我們什么都不擔(dān)心,這可能是正確的。為了記錄,所有領(lǐng)先的社交網(wǎng)站(SNS)都非常重視語言。他們在翻譯和本地化方面投入巨資,并經(jīng)常以當(dāng)?shù)卣Z言引領(lǐng)市場推廣。在許多擁有新興語言的國家,互聯(lián)網(wǎng)上的語言內(nèi)容相對較少,F(xiàn)acebook和Twitter可以實(shí)現(xiàn)不需要英語的對話。

不太好,你可以猜到。眾所周知,非正式的口語和俚語難以翻譯。它要求你熟練地跨越兩種語言,即使對于那些了解語言但沒有沉浸在兩種文化中的人來說,這也是一項(xiàng)很高的要求。
現(xiàn)在,由于可擴(kuò)展性和速度的原因,大多數(shù)SNS都將此轉(zhuǎn)換委托給機(jī)器,這是可以理解的問題。沒有人能夠跟上一小時內(nèi)完成的社交媒體帖子的數(shù)量,在這種情況下,專業(yè)翻譯可能是一種矯枉過正。Gisting通常就足夠了。
但問題是,翻譯不再處于自己的角落。這不僅僅是語言問題。相反,翻譯將是人工智能(AI)能否改變我們生活的關(guān)鍵。越來越多的世界正在變得多語言化。我們自己的商業(yè)和個人網(wǎng)絡(luò)包括與我們說不同語言的人。因此,機(jī)器翻譯狀態(tài)消息,對話和主題標(biāo)簽的準(zhǔn)確性可能更重要。錯誤不僅僅意味著人們之間的誤解,還會影響AI本身的可行性。
如何在聲音時代改變?我們聽說,互聯(lián)網(wǎng)上的所有東西(這幾乎都是世界上的一切)將在不久的將來以語音為導(dǎo)向。社交媒體上的語音現(xiàn)象將如何影響語言?我的意思是,在我去喝咖啡之前,我可以只說“Skype我的老板”,并相信我的老板不認(rèn)為我已經(jīng)離開了嗎?那么使用表情符號呢,因?yàn)樗鼈冊诟魈幎紱]有傳達(dá)相同的含義?我的猜測是,我們會更恰當(dāng)?shù)卣f話,以便尚未成熟的AI系統(tǒng)能夠更好地理解我們。如果是這樣,對于即時翻譯解決方案來說將是個好消息。
我開始寫這篇文章,詢問Facebook的語言是否真的獨(dú)一無二。事實(shí)并非如此,盡管每一次新的技術(shù)浪潮,包括Facebook所屬的技術(shù),都會影響語言。語言將繼續(xù)發(fā)展和發(fā)展,技術(shù)將繼續(xù)發(fā)揮作用。并且,事情只會隨著聲音變得更有趣。