科技讓我們能夠隨時(shí)通過(guò)手機(jī)聯(lián)系到身處世界各地的人。它打破了距離與時(shí)間的限制,無(wú)論是朋友、家人,還是商務(wù)伙伴,我們都能輕松自如地和他們建立聯(lián)系。然而,直到現(xiàn)在,語(yǔ)言仍是我們面對(duì)面溝通的一個(gè)障礙。
盡管我們能夠向全球各地發(fā)送消息、撥打電話(huà)或是視頻聊天,但仍不能進(jìn)行跨語(yǔ)言的流暢交談?,F(xiàn)在,國(guó)內(nèi)領(lǐng)先的智能學(xué)習(xí)公司——有道,正利用AI來(lái)解決這一問(wèn)題。過(guò)去一年半的時(shí)間,Qualcomm持續(xù)與有道開(kāi)展合作,通過(guò)終端側(cè)的實(shí)時(shí)翻譯來(lái)幫助人們打破語(yǔ)言的限制、輕松自如地進(jìn)行溝通。
想象一下:你與海外客戶(hù)進(jìn)行電話(huà)會(huì)議。雖然你說(shuō)的是普通話(huà),但海外客戶(hù)能夠?qū)崟r(shí)地聽(tīng)到標(biāo)準(zhǔn)的英文翻譯,這種無(wú)縫、流暢的實(shí)時(shí)翻譯十分令人驚嘆。但是,這樣的實(shí)時(shí)翻譯對(duì)技術(shù)要求頗高,是此前技術(shù)無(wú)法實(shí)現(xiàn)的。Qualcomm驍龍8655G移動(dòng)平臺(tái)和其集成的第五代Qualcomm人工智能引擎AIEngine,其AI性能是前代平臺(tái)的2倍,能夠支持實(shí)時(shí)離線(xiàn)翻譯的實(shí)現(xiàn)。事實(shí)上,在2019年12月舉行的驍龍技術(shù)峰會(huì)期間,我們已經(jīng)在現(xiàn)場(chǎng)展示過(guò)部分用例。
實(shí)時(shí)翻譯是如何實(shí)現(xiàn)的
翻譯功能通常由CPU執(zhí)行,但對(duì)于特定應(yīng)用而言,CPU作為一個(gè)通用的性能模塊,不能提供足夠強(qiáng)大或?qū)嵱玫男阅苤С?。Qualcomm驍龍與有道合作,把翻譯移植到更合適的處理模塊——QualcommHexagonDSP上,以實(shí)現(xiàn)端到端的時(shí)延和性能優(yōu)化。這樣做的優(yōu)勢(shì)在于,能夠有效降低功耗并加大算力,以提高翻譯準(zhǔn)確性,為實(shí)時(shí)翻譯帶來(lái)更好的體驗(yàn)。
無(wú)論用戶(hù)正在進(jìn)行傳統(tǒng)的語(yǔ)音通話(huà)還是網(wǎng)絡(luò)通話(huà),當(dāng)用戶(hù)的語(yǔ)音進(jìn)入驍龍865終端的麥克風(fēng)并傳入驍龍865集成的第五代QualcommAIEngine時(shí),有道實(shí)時(shí)翻譯就會(huì)馬上開(kāi)始運(yùn)行。在翻譯的過(guò)程中,驍龍865會(huì)喚醒Qualcomm傳感器中樞(SensingHub)來(lái)消除噪聲和回聲,然后啟動(dòng)Hexagon處理器進(jìn)行神經(jīng)網(wǎng)絡(luò)處理,這主要包括以下三個(gè)階段:
1、自動(dòng)語(yǔ)音識(shí)別(ASR)——以英文來(lái)舉例,通過(guò)在Hexagon處理器上運(yùn)行卷積神經(jīng)網(wǎng)絡(luò)(CNN),用戶(hù)的英文語(yǔ)音可以被轉(zhuǎn)錄為英文文字。
2、神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)——接下來(lái),英文文字能夠通過(guò)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯轉(zhuǎn)換成中文文字。這不僅僅是逐字翻譯,而是結(jié)合語(yǔ)句結(jié)構(gòu)的翻譯。Hexagon處理器能夠助力有道算法更好的理解兩種語(yǔ)言之間語(yǔ)句結(jié)構(gòu)的區(qū)別,以及詞語(yǔ)在不同語(yǔ)境中可能具有的不同含義。
3、文字轉(zhuǎn)語(yǔ)音——最后,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯出的中文文字會(huì)轉(zhuǎn)化為普通話(huà)語(yǔ)音。
值得關(guān)注的是,上述處理過(guò)程全部都能夠在終端側(cè)實(shí)時(shí)地進(jìn)行,這讓跨語(yǔ)言交談?wù)嬲兊幂p松自如。
實(shí)時(shí)翻譯的未來(lái)
目前,有道實(shí)時(shí)翻譯技術(shù)支持包括普通話(huà)、英文在內(nèi)的多種語(yǔ)言。未來(lái),該技術(shù)甚至可以扮演口譯員的角色,在人們面對(duì)面交談時(shí)進(jìn)行翻譯。
武漢傳神翻譯有限公司介紹在5G技術(shù)的支持下,實(shí)時(shí)翻譯將會(huì)以更具沉浸感的方式呈現(xiàn)在人們的生活中。例如,由新一代無(wú)線(xiàn)通信和驍龍5G終端賦能的超低時(shí)延技術(shù)能夠在視頻電話(huà)中支持面部識(shí)別,這帶來(lái)的不僅僅只是聲音同步,而是逼真的口型同步,對(duì)方就連看起來(lái)也像是正在使用與用戶(hù)相同的語(yǔ)言進(jìn)行對(duì)話(huà)。
QualcommTechnologies希望幫助全世界進(jìn)行連接、計(jì)算和溝通。這也是為什么我們很高興能夠與有道合作,并打造能夠幫助人們克服語(yǔ)言障礙的技術(shù)。我們很榮幸可以與合作伙伴一起豐富用戶(hù)體驗(yàn),共同架起全世界溝通的橋梁。
Qualcomm驍龍、Qualcomm人工智能引擎AIEngine、QualcommHexagon和Qualcomm傳感器中樞是QualcommTechnologies,Inc.和/或其子公司的產(chǎn)品。