Mozilla使用開(kāi)源Common Voice語(yǔ)音識(shí)別數(shù)據(jù)集進(jìn)行多語(yǔ)言操作
2018-06-08 08:02:41
Mozilla宣布它正在擴(kuò)大其眾包的Common Voice項(xiàng)目 - 一項(xiàng)旨在創(chuàng)建開(kāi)源語(yǔ)音識(shí)別數(shù)據(jù)集的舉措 - 包括更多語(yǔ)言。
該技術(shù)組織于去年6月首次發(fā)布Common Voice,邀請(qǐng)來(lái)自世界各地的志愿者通過(guò)網(wǎng)絡(luò)和移動(dòng)應(yīng)用程序,用他們的聲音記錄文本片段 。
上圖:記錄你的聲音

該項(xiàng)目與亞馬遜,谷歌,蘋果和微軟等正在開(kāi)發(fā)的專有語(yǔ)音識(shí)別技術(shù)的不斷增長(zhǎng)的軍火庫(kù)相反。上述巨頭正在大力投資于語(yǔ)音激活數(shù)字助理Alexa,谷歌助理,Siri和Cortana,但各自的數(shù)據(jù)集均由公司自己擁有。
Mozilla 于11月推出了英語(yǔ)Common Voice數(shù)據(jù)集的第一批成果,收錄了大約500小時(shí)的演講,并從20000個(gè)人中構(gòu)建了40萬(wàn)個(gè)錄音。今天,Mozilla 正式開(kāi)始收集另外三種語(yǔ)言的語(yǔ)音數(shù)據(jù) - 法語(yǔ),德語(yǔ)和 - 隨機(jī) - 威爾士語(yǔ) - 的過(guò)程。目前正在為數(shù)據(jù)收集過(guò)程準(zhǔn)備另外40種語(yǔ)言,巴西葡萄牙語(yǔ),中國(guó)(臺(tái)灣),印度尼西亞語(yǔ),波蘭語(yǔ)和荷蘭語(yǔ)等國(guó)家已經(jīng)準(zhǔn)備好啟動(dòng)眾包語(yǔ)音數(shù)據(jù)。
下一個(gè)大平臺(tái)
多年來(lái),語(yǔ)音將成為技術(shù)的下一個(gè)重要平臺(tái)。就在昨天,亞馬遜正式推出了新款相機(jī)注入,Alexa供電的Echo Look智能揚(yáng)聲器,告訴你應(yīng)該穿什么樣的衣服。我們?nèi)匀惶幱谶@場(chǎng)運(yùn)動(dòng)的早期階段,但顯然聲音只會(huì)變得更加普遍。
正是在這種背景下,Mozilla正在推進(jìn)創(chuàng)建開(kāi)源數(shù)據(jù)集的計(jì)劃,任何人都可以自由使用這些數(shù)據(jù)集來(lái)將語(yǔ)音識(shí)別智能構(gòu)建到各種應(yīng)用程序和服務(wù)中。
Mozilla首席創(chuàng)新官Katharina Borchert表示:“我們相信這些接口不應(yīng)該由少數(shù)幾家公司作為守門員來(lái)控制語(yǔ)音服務(wù),并且我們希望用戶能夠以他們自己的語(yǔ)言和口音持續(xù)理解用戶,”Mozilla首席創(chuàng)新官Katharina Borchert說(shuō)。博客帖子。
Common Voice項(xiàng)目的用途類似于其他用于打擊私人平臺(tái)的開(kāi)放許可證項(xiàng)目。OpenStreetMap 是類似眾包項(xiàng)目的一個(gè)很好的例子,該項(xiàng)目為開(kāi)發(fā)人員提供開(kāi)放且可自由使用的世界地圖,而無(wú)需谷歌地圖等競(jìng)爭(zhēng)對(duì)手服務(wù)的成本或限制。
在可訪問(wèn)性方面,英語(yǔ)可能在很多方面成為互聯(lián)網(wǎng)的通用語(yǔ),但事實(shí)是大多數(shù)人會(huì)說(shuō)英語(yǔ)以外的語(yǔ)言作為他們的母語(yǔ)。隨著語(yǔ)音識(shí)別AI革命的興起,為開(kāi)發(fā)機(jī)器學(xué)習(xí)模型提供開(kāi)發(fā)人員和技術(shù)人員多語(yǔ)言數(shù)據(jù)集的任何事情都只能是一件好事。
“使用多種語(yǔ)言標(biāo)志著Common Voice邁出了重要的一步,我們希望這對(duì)于整體語(yǔ)音技術(shù)來(lái)說(shuō)也是一大步,” Mozilla Common Voice項(xiàng)目的數(shù)字策略師Michael Henretty 補(bǔ)充道。“語(yǔ)音技術(shù)的民主化不僅會(huì)降低全球創(chuàng)新的障礙,而且也是獲取信息的障礙?!?/span>