韓國(guó)語(yǔ)音助理強(qiáng)調(diào)科技對(duì)語(yǔ)言數(shù)據(jù)的需求爆發(fā)式增長(zhǎng)
2018-10-12 13:55:01
語(yǔ)言數(shù)據(jù)是大生意。這個(gè)涉及語(yǔ)言技術(shù)培訓(xùn)語(yǔ)料庫(kù)的子行業(yè),從自然語(yǔ)言處理到機(jī)器翻譯,由于人工智能而正在復(fù)興。
基本上每種語(yǔ)言相關(guān)的人工智能技術(shù)都在推動(dòng)需求,包括語(yǔ)音識(shí)別,情感分析,問(wèn)答和總結(jié),當(dāng)然還有神經(jīng)機(jī)器翻譯(NMT)。語(yǔ)言數(shù)據(jù)一直是統(tǒng)計(jì)MT等技術(shù)所必需的,但NMT和任何基于神經(jīng)網(wǎng)絡(luò)的解決方案都需要更多數(shù)據(jù)。更重要的是,這些技術(shù)需要高質(zhì)量,特定領(lǐng)域的語(yǔ)言數(shù)據(jù),以提供同樣高質(zhì)量的輸出。
語(yǔ)言數(shù)據(jù)的蓬勃發(fā)展已經(jīng)變得非常明顯,像Appen這樣的公司在2017年實(shí)現(xiàn)了“真正優(yōu)秀”,突破了數(shù)十億美元的估值。這家總部位于澳大利亞的悉尼證券交易所上市公司有兩個(gè)業(yè)務(wù)部門(mén):語(yǔ)言資源部門(mén),提供培訓(xùn)AI引擎的數(shù)據(jù)集(音頻,文本,圖像和視頻),以及幫助客戶培訓(xùn)AI驅(qū)動(dòng)產(chǎn)品的內(nèi)容相關(guān)部門(mén)(主要是搜索引擎)通過(guò)人工評(píng)估和反饋。Appen的增長(zhǎng)也沒(méi)有停止,2018年上半年的業(yè)績(jī)已經(jīng)達(dá)到歷史最高水平。
KT感覺(jué)語(yǔ)言數(shù)據(jù)緊縮
然而,正如韓國(guó)最大的電信公司KT Corp.所發(fā)現(xiàn)的那樣,語(yǔ)言數(shù)據(jù)的增長(zhǎng)也意味著到目前為止的需求超過(guò)供應(yīng)。
2017年1月,KT推出了AI-powered語(yǔ)音助手GiGA Genie。根據(jù)KT公司的經(jīng)理Kang Da-Som的說(shuō)法,該服務(wù)在2018年7月之前擁有100萬(wàn)用戶,他們打算在年底前將用戶數(shù)增加到150萬(wàn)。
GiGA Genie的重點(diǎn)不是搜索或電子商務(wù),不過(guò)像谷歌助手或亞馬遜Alexa,而是媒體服務(wù)。事實(shí)上,GiGA Genie首先通過(guò)安裝在酒店中來(lái)制作新聞。該服務(wù)響應(yīng)英語(yǔ)和韓語(yǔ)的命令,并為韓國(guó)合作的五星級(jí)酒店提供智能禮賓服務(wù),計(jì)劃推出更多語(yǔ)言。
“最大的困難是獲得足夠的語(yǔ)言數(shù)據(jù)” - KT公司的Kang Da-Som
根據(jù)Da-Som的說(shuō)法,翻譯是通過(guò)MT進(jìn)行的,但她沒(méi)有提供其他細(xì)節(jié)。然而,她確實(shí)提出“最大的困難是獲取足夠的語(yǔ)言數(shù)據(jù)?!?/span>
缺乏高質(zhì)量的語(yǔ)言數(shù)據(jù)是NMT研究界的主要關(guān)注點(diǎn),對(duì)于Facebook和谷歌等人來(lái)說(shuō)是一個(gè)實(shí)際問(wèn)題,當(dāng)然,已經(jīng)參與或打算進(jìn)入NMT的語(yǔ)言服務(wù)提供商也是如此。種族。對(duì)于低資源語(yǔ)言來(lái)說(shuō),這更是一個(gè)問(wèn)題,因?yàn)椴⑿杏?xùn)練語(yǔ)料庫(kù)很少。
聚光燈下的機(jī)器學(xué)習(xí)
與此同時(shí),機(jī)器學(xué)習(xí)在2017年9月語(yǔ)家翻譯公司的最新品牌重塑中占據(jù)突出地位?!霸摴菊谠黾訉?duì)其快速發(fā)展的機(jī)器智能部門(mén)的投資,以提供創(chuàng)新的解決方案,幫助客戶進(jìn)入新的全球市場(chǎng),”他們的新聞稿中寫(xiě)道。
谷歌在發(fā)布AutoML Translation時(shí)也直接促成了更多機(jī)器學(xué)習(xí)的嗡嗡聲,這本質(zhì)上是一種機(jī)器學(xué)習(xí)功能,允許其云客戶使用他們自己的語(yǔ)言數(shù)據(jù)來(lái)定制谷歌翻譯的NMT引擎培訓(xùn)。
這可能標(biāo)志著另一波需求增長(zhǎng)浪潮刺激了提供Appen等語(yǔ)言數(shù)據(jù)的公司,并創(chuàng)造了更多需要它的客戶,如KT公司。