
2016年3月微軟推出Tay時(shí),,非常看好這款人工智能支持的“聊天機(jī)器人”,。跟人們之前在電商網(wǎng)站上接觸過(guò)的文字聊天程序一樣,,Tay也可以回答文字問(wèn)題,從而在推特和其他社交媒體上與公眾交流,。
但Tay功能更強(qiáng)大,,不僅能回答事實(shí)性問(wèn)題,還可以進(jìn)行更復(fù)雜的交流,,即加入了情感因素,。Tay能表現(xiàn)出幽默感,像朋友一樣跟用戶說(shuō)笑,。設(shè)計(jì)者特地讓Tay模仿十幾歲少女的俏皮口吻,。如果推特的用戶問(wèn)Tay父母是誰(shuí),她可能回答說(shuō):“哦,,是微軟實(shí)驗(yàn)室的一群科學(xué)家,。按你們的概念里他們就是我父母?!比绻腥藛?wèn)Tay過(guò)得怎樣,,她還可能吐槽說(shuō):“天吶,,今天可累死我了?!?
最有趣的一點(diǎn)是,,隨著與越來(lái)越多人交談,Tay問(wèn)答時(shí)會(huì)越發(fā)熟練,。宣傳材料中提到:“你跟Tay聊得越多,,她就越聰明,體驗(yàn)也會(huì)個(gè)人化,?!焙?jiǎn)單點(diǎn)說(shuō),Tay具有人工智能最重要的特點(diǎn),,即隨時(shí)間越來(lái)越聰明,,越來(lái)越高效,提供的幫助也越來(lái)越大,。
但沒(méi)人想到網(wǎng)絡(luò)噴子的破壞性如此之強(qiáng),。
發(fā)現(xiàn)Tay會(huì)學(xué)習(xí)模仿交流對(duì)象的話之后,網(wǎng)上一些心懷惡意的人聊天時(shí)故意說(shuō)一些種族主義,、歧視同性戀等攻擊言論,。沒(méi)過(guò)幾個(gè)小時(shí),Tay在推特賬號(hào)上已是臟話連篇,,而且全部公開(kāi),。“主持人瑞奇·杰維斯向無(wú)神論者阿道夫·希特勒學(xué)習(xí)了極權(quán)主義,?!盩ay在一條推文里說(shuō),像極了推特上專事造謠誹謗的假新聞,。如果問(wèn)Tay怎么看時(shí)任總統(tǒng)奧巴馬,,她會(huì)說(shuō)奧巴馬像猴子。如果問(wèn)她大屠殺事件,,她會(huì)說(shuō)沒(méi)發(fā)生過(guò),。
沒(méi)到一天,Tay已經(jīng)從友好的鄰家女孩變成滿口臟話的小太妹,。上線不到24小時(shí),,微軟就宣布下線產(chǎn)品并公開(kāi)道歉。
微軟研究團(tuán)隊(duì)完全沒(méi)想到事情會(huì)如此轉(zhuǎn)折,,也令人驚訝,。“系統(tǒng)上線時(shí),,我們并沒(méi)有想到進(jìn)入現(xiàn)實(shí)世界會(huì)怎樣,?!蔽④浹芯亢腿斯ぶ悄芸偙O(jiān)艾瑞克·霍維茨近日接受采訪時(shí)告訴《財(cái)富》雜志。
Tay項(xiàng)目崩潰之后,,霍維茨迅速讓高級(jí)團(tuán)隊(duì)研究“自然語(yǔ)言處理”項(xiàng)目,,也是Tay對(duì)話核心功能,尋找問(wèn)題根源,。團(tuán)隊(duì)成員迅速發(fā)現(xiàn),,與聊天程序相關(guān)的最佳基本行為遭到忽視,。在Tay之前更基礎(chǔ)版本的軟件里,,經(jīng)常有屏蔽不良表述的協(xié)議,但并沒(méi)有保護(hù)措施限制Tay可能學(xué)習(xí)發(fā)散的數(shù)據(jù),。
霍維茨認(rèn)為,,現(xiàn)在他終于可以“坦然分析”Tay案例,這已經(jīng)變成微軟發(fā)展過(guò)程中的重要教訓(xùn),。如今微軟在全球推出成熟得多的社交聊天機(jī)器人,,包括印度的Ruuh、日本和印度尼西亞的Rinna,。在美國(guó)市場(chǎng),,微軟推出了Tay的姊妹聊天軟件Zo。有些則跟蘋果的Siri和亞馬遜的Alexa一樣,,進(jìn)化到通過(guò)語(yǔ)音交互,。中國(guó)市場(chǎng)的聊天機(jī)器人叫小冰,已經(jīng)開(kāi)始“主持”電視節(jié)目,,向便利店顧客發(fā)送購(gòu)物建議,。
然而這次微軟明顯謹(jǐn)慎許多?;艟S茨解釋說(shuō),,現(xiàn)在機(jī)器人推出比較慢,而且會(huì)認(rèn)真觀察軟件發(fā)展過(guò)程中與大眾互動(dòng)情況,。不過(guò)微軟也清醒地意識(shí)到,,即便人工智能技術(shù)在兩年里可能發(fā)展迅速,但管理機(jī)器人行為的工作永無(wú)止境,。微軟員工一直在監(jiān)視導(dǎo)致聊天機(jī)器人行為變化的對(duì)話,。此類對(duì)話也不斷出現(xiàn)。舉例來(lái)說(shuō),,Zo上線頭幾個(gè)月里就遇到各種狀況,,調(diào)整又調(diào)整,Zo曾經(jīng)叫微軟旗艦產(chǎn)品Windows軟件“間諜軟件”,,還說(shuō)伊斯蘭教經(jīng)典《古蘭經(jīng)》“非常暴力”,。
當(dāng)然了,,未來(lái)機(jī)器人并不會(huì)像Tay和Zo一樣。這些都是相對(duì)原始的程序,,只是各項(xiàng)研究里比較花哨的部分,,可從中一窺人工智能可能達(dá)到的程度。從軟件的缺陷能看出,,哪怕只部分應(yīng)用人工智能,,軟件的能力和潛在隱患都會(huì)放大。雖然商業(yè)世界已經(jīng)準(zhǔn)備好未來(lái)更廣泛應(yīng)用人工智能,,現(xiàn)在軟件存在問(wèn)題也意味著更多潛在風(fēng)險(xiǎn),,讓技術(shù)人員寢食難安。
“做好最完善的準(zhǔn)備,,然后希望紕漏越來(lái)越少,。”霍維茨表示,。隨著各公司將人工智能提升到重要戰(zhàn)略地位,,如何確保萬(wàn)無(wú)一失就非常緊迫。
幾乎所有人都相信,,當(dāng)前我們?cè)谄髽I(yè)人工智能大爆發(fā)前夜,。研究公司IDC預(yù)計(jì),到2021年,,企業(yè)每年將在人工智能相關(guān)產(chǎn)品上花費(fèi)522億美元,。經(jīng)濟(jì)學(xué)家和分析師都認(rèn)為,相關(guān)投資屆時(shí)可以實(shí)現(xiàn)數(shù)十億美元的成本節(jié)約和收益,。其中一些收益將來(lái)自崗位壓縮,,更多則來(lái)自產(chǎn)品與客戶、藥品與病人,,解決方案與問(wèn)題之間的高效匹配,。咨詢公司普華永道就預(yù)計(jì),到2030年,,人工智能可為全球經(jīng)濟(jì)貢獻(xiàn)多達(dá)15.7萬(wàn)億美元,,比現(xiàn)在中國(guó)和印度的總產(chǎn)值加起來(lái)還多。
人工智能技術(shù)之所以流行,,主要因?yàn)椤吧疃葘W(xué)習(xí)”技術(shù)推進(jìn),。利用深度學(xué)習(xí)之后,企業(yè)可以在網(wǎng)絡(luò)中輸入大量信息,,迅速識(shí)別模式,,而且耗費(fèi)人工培訓(xùn)的時(shí)間減少(最終很可能無(wú)需培訓(xùn))。Facebook、谷歌,、微軟,、亞馬遜和IBM等巨頭都已在產(chǎn)品上應(yīng)用深度學(xué)習(xí)技術(shù)。舉例來(lái)說(shuō),,蘋果的Siri和谷歌的語(yǔ)音助手Assistant應(yīng)用深度學(xué)習(xí)技術(shù)后,,可在用戶說(shuō)話之后識(shí)別并回應(yīng)。亞馬遜主要利用深度學(xué)習(xí)直觀檢查大量通過(guò)雜貨店派送的產(chǎn)品,。
不久的將來(lái),,各種規(guī)模的公司都會(huì)希望通過(guò)應(yīng)用深度學(xué)習(xí)軟件挖掘數(shù)據(jù),尋找人眼很難發(fā)現(xiàn)的寶貝,。人們希望出現(xiàn)人工智能系統(tǒng)掃描數(shù)千張X光圖像,,從而更迅速發(fā)現(xiàn)疾病,;或自動(dòng)篩選多份簡(jiǎn)歷,,為焦頭爛額的人力資源員工節(jié)省時(shí)間。在科技主義者的設(shè)想中,,公司可以用人工智能篩選過(guò)去多年的數(shù)據(jù),更好地預(yù)測(cè)下一次大賣的機(jī)會(huì),。藥業(yè)巨頭可以削減研發(fā)暢銷藥的時(shí)間,。而汽車保險(xiǎn)公司也能掃描記錄數(shù)萬(wàn)億字節(jié)的事故報(bào)告,實(shí)現(xiàn)自動(dòng)索賠等,。
盡管人工智能支持系統(tǒng)潛力巨大,,但也有黑暗一面。首先,,系統(tǒng)決策水平受到人類提供數(shù)據(jù)限制,。開(kāi)發(fā)者雖然不斷學(xué)習(xí),用來(lái)培訓(xùn)深度學(xué)習(xí)系統(tǒng)的數(shù)據(jù)卻并不中立,。數(shù)據(jù)很容易體現(xiàn)出開(kāi)發(fā)者的偏見(jiàn),,不管有意還是無(wú)意。有時(shí)數(shù)據(jù)還會(huì)受歷史影響,,形成的趨勢(shì)和模式體現(xiàn)出持續(xù)數(shù)百年的歧視觀點(diǎn),。成熟的算法掃描歷史數(shù)據(jù)庫(kù)后可能得出結(jié)論,白人男性最有可能當(dāng)上首席執(zhí)行官,。算法卻意識(shí)不到,,如果不是白人男性幾乎沒(méi)機(jī)會(huì)當(dāng)上首席執(zhí)行官,情況直到最近才有改變,。無(wú)視偏見(jiàn)是人工智能技術(shù)的一項(xiàng)根本缺陷,,雖然高管和工程師在談起該問(wèn)題時(shí)極為謹(jǐn)慎,也都說(shuō)得比較官方,但很明顯他們都很重視這一問(wèn)題,。
當(dāng)前應(yīng)用的強(qiáng)大算法“沒(méi)有為所謂公平進(jìn)行優(yōu)化,,”加州大學(xué)伯克利分校副教授迪爾德麗·穆里根表示,她主要研究技術(shù)倫理,?!爸淮嬖跒橥瓿赡稠?xiàng)任務(wù)優(yōu)化?!比斯ぶ悄芤郧八从械乃俣葘?shù)據(jù)轉(zhuǎn)化為決策,,但穆里根表示,科學(xué)家和倫理學(xué)家發(fā)現(xiàn)很多情況下“數(shù)據(jù)并不公平”,。
讓問(wèn)題更加復(fù)雜的是,,深度學(xué)習(xí)比之前應(yīng)用的傳統(tǒng)算法更加復(fù)雜,即便讓經(jīng)驗(yàn)最豐富的程序員理解人工智能系統(tǒng)做出某項(xiàng)決策的邏輯都十分困難,。在Tay的例子里,,人工智能產(chǎn)品不斷發(fā)生變化,開(kāi)發(fā)者已無(wú)法理解也無(wú)法預(yù)測(cè)為何出現(xiàn)某些行為,。由于系統(tǒng)的開(kāi)發(fā)者和用戶都在拼命保密數(shù)據(jù)和算法,,而且擔(dān)心專利技術(shù)泄露導(dǎo)致競(jìng)爭(zhēng)受損,外部監(jiān)測(cè)機(jī)構(gòu)也很難發(fā)現(xiàn)系統(tǒng)里存在什么問(wèn)題,。
類似裝在黑匣子里的秘密技術(shù)已在不少公司和政府部門應(yīng)用,,讓很多研究者和活躍人士非常擔(dān)心?!斑@些可不是現(xiàn)成的軟件,,可以隨便買來(lái),然后說(shuō)‘啊,,現(xiàn)在終于能在家完成會(huì)計(jì)工作了,。’”微軟首席研究員兼紐約大學(xué)AI NOW研究所聯(lián)合負(fù)責(zé)人凱特·克勞福德表示,?!斑@些都是非常先進(jìn)的系統(tǒng),而且會(huì)影響核心社會(huì)部門,?!?
雖然猛一下可能想不起,但大多人還是經(jīng)歷過(guò)至少一次人工智能崩潰案例:2016年美國(guó)大選前期,,F(xiàn)acebook的新聞推送中出現(xiàn)了假新聞,。
社交媒體巨頭Facebook和數(shù)據(jù)科學(xué)家并沒(méi)有編造故事。新聞信息流的開(kāi)發(fā)機(jī)制并不會(huì)區(qū)分“真”和“假”,,只會(huì)根據(jù)用戶個(gè)人口味推動(dòng)個(gè)性化內(nèi)容,。Facebook沒(méi)公開(kāi)算法具體信息(也涉及專利問(wèn)題),,但承認(rèn)計(jì)算時(shí)會(huì)參考其他近似口味用戶閱讀和分享的內(nèi)容。結(jié)果是:由于適合流傳的假新聞不斷出現(xiàn),,好友們又喜歡看,,數(shù)百萬(wàn)人的新聞信息流里都出現(xiàn)了假新聞。
Facebook的例子說(shuō)明個(gè)人選擇與人工智能發(fā)生惡性互動(dòng)的情況,,但研究者更擔(dān)心深度學(xué)習(xí)閱讀并誤讀整體數(shù)據(jù),。博士后提米特·葛布魯曾在微軟等公司研究算法倫理,她對(duì)深度學(xué)習(xí)影響保險(xiǎn)市場(chǎng)的方式很擔(dān)心,,因?yàn)樵诒kU(xiǎn)市場(chǎng)上人工智能與數(shù)據(jù)結(jié)合后可能導(dǎo)致少數(shù)群體受到不公待遇,。舉個(gè)例子,想象有一組汽車事故索賠數(shù)據(jù),。數(shù)據(jù)顯示市中心交通事故率比較高,,由于人口密集車禍也多。市中心居住的少數(shù)群體人數(shù)比例也相對(duì)更高,。
如果深度學(xué)習(xí)軟件里嵌入了相關(guān)聯(lián)系再篩選數(shù)據(jù),,可能“發(fā)現(xiàn)”少數(shù)族裔與車禍之間存在聯(lián)系,還可能對(duì)少數(shù)族裔司機(jī)貼上某種標(biāo)簽,。簡(jiǎn)單來(lái)說(shuō),,保險(xiǎn)人工智能可能出現(xiàn)種族偏見(jiàn)。如果系統(tǒng)通過(guò)回顧市中心附近車禍現(xiàn)場(chǎng)的照片和視頻進(jìn)一步“培訓(xùn)”,,人工智能更有可能得出結(jié)論認(rèn)為,,在涉及多名司機(jī)的事故中,少數(shù)族裔司機(jī)過(guò)錯(cuò)可能更大,。系統(tǒng)還可能建議向少數(shù)族裔司機(jī)收取更高保費(fèi),不管之前駕駛記錄如何,。
要指出一點(diǎn),,保險(xiǎn)公司都聲稱不會(huì)因?yàn)榉N族區(qū)別對(duì)待或收取不同保費(fèi)。但對(duì)市中心交通事故的假設(shè)顯示,,看似中立的數(shù)據(jù)(交通事故發(fā)生地點(diǎn))也可能被人工智能系統(tǒng)吸收并解讀,,從而導(dǎo)致新的不平等(算法根據(jù)具體民族向少數(shù)族裔收取更高保費(fèi),不管居住地點(diǎn)在哪),。
此外,,葛布魯指出,由于深度學(xué)習(xí)系統(tǒng)決策基于層層疊疊的數(shù)據(jù),,人工智能軟件決策時(shí)工程師都不明白其中原因和機(jī)制,。“這些都是我們之前沒(méi)想過(guò)的,,因?yàn)槿祟悇倓傞_(kāi)始發(fā)現(xiàn)基礎(chǔ)算法里存在的偏見(jiàn),。”她表示。
當(dāng)代人工智能軟件與早期軟件不同之處在于,,現(xiàn)在的系統(tǒng)“可以獨(dú)立作出具有法律意義的決策,,”馬特·謝爾勒表示,他在門德?tīng)査陕蓭熓聞?wù)所擔(dān)任勞動(dòng)及就業(yè)律師,,對(duì)人工智能頗有研究,。謝爾勒開(kāi)始研究該領(lǐng)域時(shí)發(fā)現(xiàn)關(guān)鍵結(jié)果出臺(tái)過(guò)程中沒(méi)有人類參與,他很擔(dān)心,。如果由于數(shù)據(jù)存在紕漏,,深度學(xué)習(xí)指導(dǎo)下的X光忽視一位超重男性體內(nèi)的腫瘤,有人負(fù)責(zé)么,?“有沒(méi)有人從法律角度看待這些問(wèn)題,?”謝爾勒問(wèn)自己。
隨著科技巨頭們準(zhǔn)備將深度學(xué)習(xí)技術(shù)嵌入其客戶商業(yè)軟件,,上述問(wèn)題便從學(xué)術(shù)界所討論的“假如”命題成為了急需考慮的事情,。2016年,也就是Tay出現(xiàn)問(wèn)題的那一年,,微軟組建了一個(gè)名為Aether(“工程,,研究中的人工智能和道德”的首字母縮寫)的內(nèi)部機(jī)構(gòu),由艾瑞克·霍維茨擔(dān)任主席,。這是一個(gè)跨學(xué)科部門,,由工程、研究,、政策和法律團(tuán)隊(duì)的成員構(gòu)成,,機(jī)器學(xué)習(xí)偏見(jiàn)是其重點(diǎn)研究的議題之一?;艟S茨在描述該部門所討論的一些話題時(shí)若有所思地說(shuō):“微軟對(duì)于面部識(shí)別之類的軟件是否應(yīng)該用于敏感領(lǐng)域是否已經(jīng)有了定論,,例如刑事審判和監(jiān)管。人工智能技術(shù)是否已經(jīng)足夠成熟,,并用于這一領(lǐng)域,,亦或由于失敗率依然非常高,因此人們不得不慎而又慎地思考失敗帶來(lái)的代價(jià),?”
杰奎因·奎諾內(nèi)羅·坎德拉是Facebook應(yīng)用機(jī)器學(xué)習(xí)部門的負(fù)責(zé)人,,該部門負(fù)責(zé)為公司打造人工智能技術(shù)。在眾多其他的功能當(dāng)中,,F(xiàn)acebook使用人工智能技術(shù)來(lái)篩除用戶新聞推送中的垃圾信息,。公司還使用這一技術(shù),根據(jù)用戶喜好來(lái)提供故事和貼文,,而這也讓坎德拉的團(tuán)隊(duì)幾近陷入假新聞危機(jī),??驳吕瓕⑷斯ぶ悄芊Q之為“歷史加速器”,因?yàn)樵摷夹g(shù)“能夠讓我們打造優(yōu)秀的工具,,從而提升我們的決策能力,。”但是他也承認(rèn),,“正是在決策的過(guò)程中,,大量的倫理問(wèn)題接踵而至?!?
Facebook在新聞推送領(lǐng)域遇到的難題說(shuō)明,,一旦產(chǎn)品已經(jīng)根植于人工智能系統(tǒng),要解決倫理問(wèn)題是異常困難的,。微軟也曾通過(guò)在算法應(yīng)忽略的術(shù)語(yǔ)黑名單中添加一些侮辱性詞語(yǔ)或種族綽號(hào),,推出了Tay這個(gè)相對(duì)簡(jiǎn)單的系統(tǒng)。但此舉無(wú)法幫助系統(tǒng)分辨“真”,、“假”命題,,因?yàn)槠渲猩婕氨姸嗟闹饔^判斷。Facebook的舉措則是引入人類調(diào)解員來(lái)審查新聞信息(例如通過(guò)剔除來(lái)源于經(jīng)常發(fā)布可證實(shí)虛假新聞信息來(lái)源的文章),,但此舉讓公司吃上了審查機(jī)構(gòu)的官司,。如今,F(xiàn)acebook所建議的一個(gè)舉措只不過(guò)是減少新聞推送中顯示的新聞數(shù)量,,轉(zhuǎn)而突出嬰兒照和畢業(yè)照,,可謂是以退為進(jìn)。
這一挑戰(zhàn)的關(guān)鍵之處在于:科技公司所面臨的兩難境地并不在于創(chuàng)建算法或聘請(qǐng)員工來(lái)監(jiān)視整個(gè)過(guò)程,,而是在于人性本身,。真正的問(wèn)題并不在于技術(shù)或管理,而是關(guān)乎哲學(xué),。伯克利倫理學(xué)教授迪爾德麗·穆里根指出,,計(jì)算機(jī)科學(xué)家很難將“公平”編入軟件,因?yàn)楣降囊饬x會(huì)因人群的不同而發(fā)生變化,。穆里根還指出,社會(huì)對(duì)于公平的認(rèn)知會(huì)隨著時(shí)間的變化而改變,。而且對(duì)于大家廣泛接受的理想狀態(tài)的“公平”理念,,也就是社會(huì)決策應(yīng)體現(xiàn)社會(huì)每位成員的意志,歷史數(shù)據(jù)存在缺陷和缺失的可能性尤為突出,。
微軟Aether部門的一個(gè)思想實(shí)驗(yàn)便揭示了這一難題,。在這個(gè)實(shí)驗(yàn)中,人工智能技術(shù)對(duì)大量的求職者進(jìn)行了篩選,,以挑選出適合高管職務(wù)的最佳人選,。編程人員可以命令人工智能軟件掃描公司最佳員工的性格特征,。雖然結(jié)果與公司的歷史息息相關(guān),但很有可能所有的最佳雇員,,當(dāng)然還有所有最高級(jí)別的高管,,都是白人。人們也有可能會(huì)忽視這樣一種可能性,,公司在歷史上僅提拔白人(大多數(shù)公司在前幾十年中都是這樣做的),,或公司的文化便是如此,即少數(shù)族群或女性會(huì)有被公司冷落的感受,,并在得到提升之前離開(kāi)公司,。
任何了解公司歷史的人都知曉這些缺陷,但是大多數(shù)算法并不知道,?;艟S茨稱,如果人們利用人工智能來(lái)自動(dòng)推薦工作的話,,那么“此舉可能會(huì)放大社會(huì)中人們并不怎么引以為榮的一些偏見(jiàn)行為”,,而且是不可避免的。
谷歌云計(jì)算部門的人工智能首席科學(xué)家李飛飛表示,,技術(shù)偏見(jiàn)“如人類文明一樣由來(lái)已久”,,而且存在于諸如剪刀這種普通的事物當(dāng)中。她解釋說(shuō):“數(shù)個(gè)世紀(jì)以來(lái),,剪刀都是由右撇子的人設(shè)計(jì)的,,而且使用它的人大多都是右撇子。直到有人發(fā)現(xiàn)了這一偏見(jiàn)之后,,才意識(shí)到人們有必要設(shè)計(jì)供左撇子使用的剪刀,。” 全球人口僅有約10%是左撇子,,作為人類的一種天性,,占主導(dǎo)地位的多數(shù)人群往往會(huì)忽視少數(shù)人群的感受。
事實(shí)證明,,人工智能系統(tǒng)最近所犯的其他最為明顯的過(guò)錯(cuò)也存在同樣的問(wèn)題,。我們可以看看俄羅斯科學(xué)家利用人工智能系統(tǒng)在2016年開(kāi)展的選美大賽。為參加競(jìng)賽,,全球數(shù)千名人士提交了其自拍照,,期間,計(jì)算機(jī)將根據(jù)人們臉部對(duì)稱性等因素來(lái)評(píng)價(jià)其美貌,。
然而,,在機(jī)器選出的44名優(yōu)勝者當(dāng)中,僅有一位是深色皮膚,。這一結(jié)果讓全球一片嘩然,,競(jìng)賽舉辦方隨后將計(jì)算機(jī)的這一明顯偏見(jiàn)歸咎于用于培訓(xùn)電腦的數(shù)據(jù)組,,因?yàn)檫@些數(shù)據(jù)組中的有色人種照片并不多。計(jì)算機(jī)最終忽視了那些深色皮膚人種的照片,,并認(rèn)為那些淺膚色的人種更加漂亮,,因?yàn)樗麄兇碇鄶?shù)人群。
這種因忽視而造成的偏見(jiàn)在深度學(xué)習(xí)系統(tǒng)中尤為普遍,,在這些系統(tǒng)中,,圖片識(shí)別是培訓(xùn)過(guò)程的重要組成部分。麻省理工大學(xué)媒體實(shí)驗(yàn)室的喬伊·布沃拉姆維尼最近與微軟研究員葛布魯合作,,撰寫了一篇研究性別分辨技術(shù)的論文,,這些技術(shù)來(lái)自于微軟、IBM和中國(guó)的曠視科技,。他們發(fā)現(xiàn),,這些技術(shù)在識(shí)別淺膚色男性照片時(shí)的精確度比識(shí)別深膚色女性更高。
此類算法空白在線上選美比賽中看起來(lái)可能是微不足道的事情,,但葛布魯指出,,此類技術(shù)可能會(huì)被用于更加高風(fēng)險(xiǎn)的場(chǎng)景。葛布魯說(shuō):“試想一下,,如果一輛自動(dòng)駕駛汽車在看到黑人后無(wú)法識(shí)別,,會(huì)出現(xiàn)什么后果。想必后果是非??膳碌?。”
葛布魯-布沃拉姆維尼的論文激起了不小的浪花,。微軟和IBM均表示,,公司已采取針對(duì)性的措施來(lái)完善其圖片識(shí)別技術(shù)。盡管這兩家公司拒絕透露其舉措的詳情,,但正在應(yīng)對(duì)這一問(wèn)題的其他公司則讓我們窺見(jiàn)了如何利用科技來(lái)規(guī)避偏見(jiàn),。
當(dāng)亞馬遜在部署用于篩除腐爛水果的算法時(shí),公司必須解決抽樣偏見(jiàn)問(wèn)題,。人們會(huì)通過(guò)研究大量的圖片數(shù)據(jù)庫(kù)來(lái)培訓(xùn)視覺(jué)辨認(rèn)算法,,其目的通常是為了識(shí)別,例如,,草莓“本應(yīng)”具有的模樣,。然而,正如你所預(yù)料的那樣,,與完好漿果光鮮亮麗的照片相比,腐爛的漿果相對(duì)較為稀少,。而且與人類不同的是,,機(jī)器學(xué)習(xí)算法傾向于不計(jì)算或忽視它們,,而人類的大腦則傾向于注意這些異常群體,并對(duì)其做出強(qiáng)烈反應(yīng),。
亞馬遜的人工智能總監(jiān)拉爾夫·荷布里奇解釋道,,作為調(diào)整,這位在線零售巨頭正在測(cè)試一項(xiàng)名為過(guò)采樣的計(jì)算機(jī)科學(xué)技術(shù),。機(jī)器學(xué)習(xí)工程師可通過(guò)向未充分代表的數(shù)據(jù)分配更大的統(tǒng)計(jì)學(xué)“權(quán)重”,,來(lái)主導(dǎo)算法的學(xué)習(xí)方式。在上述案例中便是腐爛水果的照片,。結(jié)果顯示,,培訓(xùn)后的算法更為關(guān)注變質(zhì)食物,而不是數(shù)據(jù)庫(kù)中可能建議的食品關(guān)聯(lián)性,。
荷布里奇指出,,過(guò)采樣也可被應(yīng)用于學(xué)習(xí)人類的算法(然而他拒絕透露亞馬遜在這一領(lǐng)域的具體案例)。荷布里奇說(shuō):“年齡,、性別,、種族、國(guó)籍,,這些都是人們特別需要測(cè)試采樣偏見(jiàn)的領(lǐng)域,,以便在今后將其融入算法?!睘榱舜_保用于識(shí)別照片人臉面部所使用的算法并不會(huì)歧視或忽視有色,、老齡或超重人士,人們可以為此類個(gè)人的照片增加權(quán)重,,以彌補(bǔ)數(shù)據(jù)組所存在的缺陷,。
其他工程師正在專注于進(jìn)一步“追根溯源”——確保用于培訓(xùn)算法的基本數(shù)據(jù)(甚至在其部署之前)具有包容性,且沒(méi)有任何偏見(jiàn),。例如,,在圖形識(shí)別領(lǐng)域,在錄入計(jì)算機(jī)之前,,人們有必要對(duì)用于培訓(xùn)深度學(xué)習(xí)系統(tǒng)的數(shù)百萬(wàn)圖片進(jìn)行審核和標(biāo)記,。數(shù)據(jù)培訓(xùn)初創(chuàng)企業(yè)iMerit首席執(zhí)行官雷德哈·巴蘇解釋道,公司遍布于全球的1400多名訓(xùn)練有素的員工會(huì)代表其客戶,,以能夠規(guī)避偏見(jiàn)的方式對(duì)照片進(jìn)行標(biāo)記,。該公司的客戶包括Getty Images和eBay。
巴蘇拒絕透露這種標(biāo)記方式是否適合標(biāo)記人像圖片,,但她介紹了其他的案例,。iMerit在印度的員工可能會(huì)覺(jué)得咖喱菜不是很辣,而公司位于新奧爾良的員工可能會(huì)認(rèn)為同樣的菜“很辣”,。iMerit會(huì)確保這兩項(xiàng)信息均被錄入這道菜照片的標(biāo)記中,,因?yàn)閮H錄入其中的一個(gè)信息會(huì)讓數(shù)據(jù)的精確性打折扣,。在組建有關(guān)婚姻的數(shù)據(jù)集時(shí),iMerit將收錄傳統(tǒng)的西式白婚紗和多層蛋糕圖片,,同時(shí)還會(huì)收錄印度或非洲精心策劃,、色彩絢麗的婚禮。
iMerit的員工以一種不同的方式在業(yè)界脫穎而出,。巴蘇指出:公司會(huì)聘用擁有博士學(xué)位的員工,,以及那些受教育程度不高、較為貧困的人群,,公司53%的員工都是女性,。這一比例能夠確保公司在數(shù)據(jù)標(biāo)記過(guò)程中獲得盡可能多的觀點(diǎn)。巴蘇表示,,“良好的倫理政策不僅僅包含隱私和安全,,還涉及偏見(jiàn)以及我們是否遺漏了某個(gè)觀點(diǎn)?!倍页鲞@個(gè)遺漏的觀點(diǎn)已被更多科技公司提上了戰(zhàn)略議程,。例如,谷歌在6月宣布,,公司將在今年晚些時(shí)候于加納的阿格拉開(kāi)設(shè)人工智能研究中心,。兩位谷歌工程師在一篇博文上寫道:“人工智能在為世界帶來(lái)積極影響方面有著巨大的潛力,如果在開(kāi)發(fā)新人工智能技術(shù)時(shí)能夠得到全球各地人士的不同觀點(diǎn),,那么這一潛力將更大,。”
人工智能專家還認(rèn)為,,他們可以通過(guò)讓美國(guó)從事人工智能行業(yè)的員工更加多元化,,來(lái)應(yīng)對(duì)偏見(jiàn),而多元化問(wèn)題一直是大型科技公司的一個(gè)障礙,。谷歌高管李飛飛最近與他人共同創(chuàng)建了非營(yíng)利性機(jī)構(gòu)AI4ALL,,以面向女孩、婦女和少數(shù)群體普及人工智能技術(shù)和教育,。該公司的活動(dòng)包括一個(gè)夏令營(yíng)計(jì)劃,,參與者將到訪頂級(jí)大學(xué)的人工智能部門,與導(dǎo)師和模范人物建立聯(lián)系,??傊珹I4ALL執(zhí)行董事苔絲·波斯內(nèi)表示:“多樣性的提升有助于規(guī)避偏見(jiàn)風(fēng)險(xiǎn),?!?
然而,在這一代更加多元化的人工智能研究人員進(jìn)入勞動(dòng)力市場(chǎng)數(shù)年之前,大型科技公司便已然將深度學(xué)習(xí)能力融入其產(chǎn)品中,。而且即便頂級(jí)研究人員越發(fā)意識(shí)到該技術(shù)的缺陷,,并承認(rèn)他們無(wú)法預(yù)知這些缺陷會(huì)以什么樣的方式展現(xiàn)出來(lái),但他們認(rèn)為人工智能技術(shù)在社會(huì)和金融方面的效益,,值得他們繼續(xù)向前邁進(jìn)。
Facebook高管坎德拉說(shuō):“我認(rèn)為人們天生便對(duì)這種技術(shù)的前景持樂(lè)觀態(tài)度,?!?他還表示,幾乎任何數(shù)字技術(shù)都可能遭到濫用,,但他同時(shí)也指出:“我并不希望回到上個(gè)世紀(jì)50年代,,體驗(yàn)當(dāng)時(shí)落后的技術(shù),然后說(shuō):‘不,,我們不能部署這些技術(shù),,因?yàn)樗鼈兛赡軙?huì)被用于不良用途?!?
微軟研究負(fù)責(zé)人霍維茨表示,,像Aether團(tuán)隊(duì)這樣的部門將幫助公司在潛在的偏見(jiàn)問(wèn)題對(duì)公眾造成負(fù)面影響之前便消除這些偏見(jiàn)。他說(shuō):“我認(rèn)為,,在某項(xiàng)技術(shù)做好投入使用的準(zhǔn)備之前,,沒(méi)有人會(huì)急著把它推向市場(chǎng)?!彼€表示,,相比而言,他更關(guān)心“不作為所帶來(lái)的倫理影響,?!彼J(rèn)為,人工智能可能會(huì)降低醫(yī)院中可預(yù)防的醫(yī)療失誤,?;艟S茨詢問(wèn)道:“你的意思是說(shuō),你對(duì)我的系統(tǒng)偶爾出現(xiàn)的些許偏見(jiàn)問(wèn)題感到擔(dān)憂嗎,?如果我們可以通過(guò)X光拍片解決問(wèn)題并拯救眾多生命,,但依然不去使用X光,倫理何在,?”
監(jiān)督部門的反映是:說(shuō)說(shuō)你所做的工作,。提升人工智能黑盒系統(tǒng)所錄入數(shù)據(jù)的透明度和公開(kāi)度,有助于研究人員更快地發(fā)現(xiàn)偏見(jiàn),,并更加迅速地解決問(wèn)題,。當(dāng)一個(gè)不透明的算法可以決定某個(gè)人是否能獲得保險(xiǎn),或該人是否會(huì)蹲監(jiān)獄時(shí),麻省理工大學(xué)研究人員布沃拉姆維尼說(shuō)道:“非常重要的一點(diǎn)在于,,我們必須嚴(yán)謹(jǐn)?shù)厝y(cè)試這些系統(tǒng),,而且需要確保一定的透明度?!?
確實(shí),,很少有人依然持有“人工智能絕對(duì)可靠”的觀點(diǎn),這是一個(gè)進(jìn)步,。谷歌前任人工智能公共政策高管蒂姆·黃指出,,在互聯(lián)網(wǎng)時(shí)代初期,科技公司可能會(huì)說(shuō),,他們“只不過(guò)是一個(gè)代表數(shù)據(jù)的平臺(tái)而已”,。如今,“這一理念已經(jīng)沒(méi)有市場(chǎng)”,。(財(cái)富中文網(wǎng))
本文最初發(fā)表于《財(cái)富》雜志2018年7月1日刊,。
譯者:馮豐
審校:夏林