一插菊花综合网,丝袜美腿亚洲熟女 国产,成人天堂资源www在线,骚妇内射图

好育寶

好育寶

他說,她說:在神經(jīng)機(jī)器翻譯中解決性別問題

admin 146 19

人工智能技術(shù)遇到了一個(gè)潛在的微妙問題:性別偏見。2018年11月,主流新聞媒體報(bào)道稱,谷歌的谷歌郵件自動(dòng)建議工具不會(huì)建議基于性別的代詞,以避免自動(dòng)填寫錯(cuò)誤的性別句子。

這項(xiàng)功能(稱為智能撰寫)將避免暗示性別,因?yàn)檎鏕mail產(chǎn)品經(jīng)理保羅·蘭伯特所說,“不是所有的‘拙劣’都是一樣的...[性別]是個(gè)大問題。”谷歌翻譯,現(xiàn)在主要在神經(jīng)機(jī)器翻譯(NMT)上運(yùn)行,最近討論了性別偏見的問題。

他是醫(yī)生,她是護(hù)士。

2018年12月6日,谷歌發(fā)表了第一篇關(guān)于減少谷歌翻譯中性別偏見的博文。幾天后,12月10日,谷歌AI博客繼續(xù)提供更多細(xì)節(jié)。

斯萊特2019年神經(jīng)機(jī)器翻譯報(bào)告:在運(yùn)營中部署NMT

Google Translate之前提供過一個(gè)查詢翻譯,反映了基礎(chǔ)訓(xùn)練數(shù)據(jù)的性別偏見。對于“強(qiáng)壯”或“醫(yī)生”這樣的詞,翻譯通常傾向于男性代詞,而對于“美麗”和“護(hù)士”,則傾向于女性代詞。

為了解決這個(gè)問題,谷歌更新了翻譯框架,因此從英語到法語、意大利語、葡萄牙語或西班牙語的單詞查詢將提供男性和女性的翻譯。這同樣適用于土耳其語-英語短語翻譯,其中源是中性的。

同時(shí),更長的短語或完整的句子需要更復(fù)雜的過程。它如此復(fù)雜,以至于谷歌不得不對其翻譯框架進(jìn)行“重大改變”。通過一個(gè)新的機(jī)器學(xué)習(xí)過程來識別性別中立的短語或句子,并通過兩個(gè)步驟來生成男性和女性的翻譯,這兩個(gè)步驟涉及到向訓(xùn)練數(shù)據(jù)添加性別屬性和過濾掉被拒絕的翻譯建議。

谷歌聲稱,這個(gè)新的NMT系統(tǒng)可以在99%的情況下可靠地產(chǎn)生陰性和陽性翻譯。

沒有一種解決方案適合所有人。

都柏林城市大學(xué)博士生、ADAPT中心團(tuán)隊(duì)成員Eva Vanmassenhove指出了谷歌方法的一些缺點(diǎn)。

“這不是從上述語言翻譯成有問題的英語,而是相反。不同的語言有不同的方式來表達(dá)性別,重要的是要認(rèn)識到不會(huì)有適合所有人的解決方案,”Vanmassenhove告訴Slator。

他說,她說:在神經(jīng)機(jī)器翻譯中解決性別問題

Vanmassenhove從2015年開始活躍在機(jī)器翻譯研究領(lǐng)域,之前也研究過性別翻譯。她指出,“即使是可以在翻譯過程中考慮某些背景的情境意識的NMT系統(tǒng)也很難做到這一點(diǎn),因?yàn)?跨類型)性別預(yù)測,尤其是對于沒有明確標(biāo)記性別的語言(如英語),仍然是一項(xiàng)尚未解決的任務(wù)?!?/p>

“我是護(hù)士”還是會(huì)被女性翻譯,而“我是外科醫(yī)生”會(huì)導(dǎo)致男性化。

雖然谷歌的系統(tǒng)通常適用于上述語言,但根據(jù)Vanmassenhove的說法,有限的語言覆蓋范圍意味著法語和西班牙語。比如“我是護(hù)士”還是會(huì)被女性翻譯,而“我是外科醫(yī)生”會(huì)導(dǎo)致男性化。

“比較有問題的是下面的翻譯:‘我很美’被翻譯成西班牙男性形式。然而,“我是一個(gè)美麗的外科醫(yī)生”被翻譯成女性形式,“范馬森霍夫說。

“神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)模式及其相關(guān)的強(qiáng)度也證明了它的弱點(diǎn),這些類型的錯(cuò)誤和偏見特別難以關(guān)注和修復(fù),”她補(bǔ)充道。

然而,Vanmassenhove認(rèn)為,谷歌的博客文章表明,他們只是處于減少機(jī)器翻譯中性別偏見的第一階段。

夸大偏見

關(guān)于性別翻譯的廣泛影響,Vanmassenhove表示,最近的研究“表明,神經(jīng)模型不僅反映了有爭議的社會(huì)不對稱,還‘夸大’了它們——我可以想象這種偏差會(huì)對一些群體產(chǎn)生負(fù)面影響。人?!?/p>

她提供了這個(gè)例子:“假設(shè)一個(gè)搜索引擎或者選擇算法在內(nèi)部使用了MT系統(tǒng)。我們?nèi)绾未_保我們不會(huì)因?yàn)樾詣e中性術(shù)語從一種語言變成另一種語言的男性/女性變體而淘汰許多完美的候選詞或命中結(jié)果?

Google最初的解決方案并不局限于語言范圍,也只考慮了訓(xùn)練數(shù)據(jù)中的性別偏見。

“我認(rèn)為去偏見(訓(xùn)練數(shù)據(jù))是有價(jià)值的;然而,由于偏見可以出現(xiàn)在許多層面(性別、種族、年齡、少數(shù)民族),我不禁想知道我們將如何實(shí)際消除所有可能的偏見,”Vanmassenhove說。

因?yàn)轭愃频膯栴},她談到了工作中的一些困難?!盀榱宋业拇T士論文,我致力于將荷蘭語單詞結(jié)合在一起。我記得我很慚愧地介紹了我的聚類技術(shù)的結(jié)果,因?yàn)榈玫降囊恍┚垲愔皇欠N族主義,特別是對比利時(shí)和荷蘭的一些少數(shù)群體。限制減少偏見以簡單地消除“性別”可能是不夠的。”

她總結(jié)說,包括性別在內(nèi)的偏見是一個(gè)“主要問題”,因?yàn)樗鼰o法立即理解MT算法如何使它們永久化,而且它們經(jīng)常被忽略,因?yàn)椤吧窠?jīng)算法非常擅長提供它們認(rèn)為我們想看到的東西”。

“消除性別偏見是一個(gè)良好的開端,但需要建立更多的措施,以適當(dāng)?shù)姆绞教幚眍愃频膯栴},”她說。