我想看一级黄色片_欧美性爱无遮挡电影_色丁香视频网站中文字幕_视频一区 视频二区 国产,日本三级理论日本电影,午夜不卡免费大片,国产午夜视频在线观看,18禁无遮拦无码国产在线播放,在线视频不卡国产在线视频不卡 ,,欧美一及黄片,日韩国产另类

首頁 500強(qiáng) 活動(dòng) 榜單 商業(yè) 科技 商潮 專題 品牌中心
雜志訂閱

半個(gè)世紀(jì)前發(fā)明的工具,,成為了人工智能的瓶頸

Jonathan Vanian
2020-12-19

如果能突破這個(gè)“瓶頸”,,多個(gè)行業(yè)都能從中受益

文本設(shè)置
小號(hào)
默認(rèn)
大號(hào)
Plus(0條)

電子表格是一種非常巧妙的發(fā)明,在誕生之初,,其使命是實(shí)現(xiàn)簿記的數(shù)字化,,自此而后的50年間,因?yàn)樗拇嬖?,研究人員與商業(yè)人士得以不受行,、列數(shù)量的限制而任意輸入各種數(shù)據(jù),然后再借助計(jì)算機(jī)對(duì)這些信息進(jìn)行分析,。如今,,電子表格被廣泛應(yīng)用于工作生活的各個(gè)方面,甚至連學(xué)童都可以像財(cái)務(wù)分析師管理預(yù)算一樣使用這一工具,。

神經(jīng)網(wǎng)絡(luò)是一種復(fù)雜的人工智能程序,,能夠模擬人腦的計(jì)算過程。近年來,,由于神經(jīng)網(wǎng)絡(luò)的發(fā)展,,頂尖人工智能研究人員關(guān)注的焦點(diǎn)已經(jīng)從結(jié)構(gòu)化數(shù)據(jù)(例如成行成列的文字和數(shù)字)轉(zhuǎn)向了圖像。換句話說,,功能強(qiáng)大的計(jì)算機(jī)可以通過瀏覽數(shù)百萬張貓咪的照片來了解這種小型貓科動(dòng)物的特征,,但同樣的軟件卻很難解讀簡(jiǎn)單的電子表格。

這讓醫(yī)學(xué)研究,、金融和運(yùn)營(yíng)等領(lǐng)域里的數(shù)據(jù)科學(xué)家們深感沮喪,,因?yàn)樵谶@些領(lǐng)域中,結(jié)構(gòu)化數(shù)據(jù)才是真正的“硬通貨”,。

金融公司Capital One的一位應(yīng)用型機(jī)器學(xué)習(xí)研究員巴彥·布魯斯(Bayan Bruss)說:“我們的數(shù)據(jù)大多是結(jié)構(gòu)化數(shù)據(jù),,或者至少是對(duì)這些數(shù)據(jù)進(jìn)行了某種結(jié)構(gòu)化處理。深度學(xué)習(xí)的進(jìn)展與我們的數(shù)據(jù)之間有著很大距離,,我們做的很多工作都是為了縮小這種距離?!?/font>

圖片來源:Lena Vargas

一些公司為解決這一問題也推出了自己的新項(xiàng)目,。以生物技術(shù)巨頭基因泰克(Genentech)為例,該公司的數(shù)據(jù)科學(xué)家最近花費(fèi)數(shù)月時(shí)間制作了一個(gè)包含55,000名癌癥患者健康記錄和基因組數(shù)據(jù)的電子表格,,既收錄了年齡,、膽固醇水平,、心率等信息,也收錄了一些更為復(fù)雜的屬性數(shù)據(jù),,比如分子特征和基因異常狀況等,。基因泰克計(jì)劃將這些信息輸入神經(jīng)網(wǎng)絡(luò),,并借此描繪出患者的健康屬性,,以期開發(fā)出突破性藥物,針對(duì)每位患者的情況對(duì)癥下藥,。

問題在于,,研究人員現(xiàn)在才剛開始訓(xùn)練神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)使用(像基因泰克制作的電子表格那樣的)結(jié)構(gòu)化數(shù)據(jù)?;蛱┛说膫€(gè)性化醫(yī)療保健數(shù)據(jù)科學(xué)分析業(yè)務(wù)全球主管瑞安·科平(Ryan Copping)表示:“包括臨床試驗(yàn)數(shù)據(jù)和電子病歷在內(nèi),,我們的大多數(shù)數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù)?!比绻?jì)算機(jī)網(wǎng)絡(luò)能夠分析并自主認(rèn)知病人資料中的相似性,,“那么我們就可以開始對(duì)結(jié)果進(jìn)行觀察,并考慮如何針對(duì)病人的具體情況選擇治療方案,。然而,,現(xiàn)在還做不到這一點(diǎn)?!?/font>

除醫(yī)療保健行業(yè)外,,很多其它行業(yè)也有機(jī)會(huì)從中受益。據(jù)研究公司IDC預(yù)測(cè),,今年,,商業(yè)領(lǐng)域?qū)a(chǎn)生5.8澤字節(jié)的銷售預(yù)測(cè)、客戶數(shù)據(jù)等生產(chǎn)力數(shù)據(jù),。一個(gè)澤字節(jié)大致相當(dāng)于全球所有海灘上沙粒的總數(shù),。也就是說,這是一個(gè)天文數(shù)字,,IDC的全球數(shù)據(jù)層項(xiàng)目(Global DataSphere,,該項(xiàng)目負(fù)責(zé)計(jì)算全球每年產(chǎn)生的數(shù)據(jù)量)的負(fù)責(zé)人約翰·里德寧(John Rydning)如是說。

這意味著,,只要能夠?qū)?shù)據(jù)壓縮成神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)的格式,,那么各種類型的企業(yè)都將有機(jī)會(huì)從中獲益。食品巨頭百事公司(PepsiCo.)的首席戰(zhàn)略和轉(zhuǎn)型官阿西娜·卡尼烏拉(Athina Kanioura)認(rèn)為,,預(yù)測(cè)能力的小幅提升也能夠帶來巨大的財(cái)務(wù)回報(bào),。她說:“準(zhǔn)確度的增加將會(huì)帶來數(shù)百萬美元的收益?!?/font>

接下來的挑戰(zhàn)則是要找到那些對(duì)商業(yè)活動(dòng)最有價(jià)值的數(shù)據(jù),,把它們提供給研究人員使用,。斯坦福大學(xué)(Stanford University)的教授、硅谷新創(chuàng)企業(yè)Sisu Data(該公司的主營(yíng)業(yè)務(wù)是為企業(yè)開發(fā)分析工具)的首席執(zhí)行官彼得·貝利斯(Peter Bailis)說:“深度網(wǎng)絡(luò)非??犰?,在汽車、推文理解等領(lǐng)域都大有可為,。但如果只是儲(chǔ)存在表格中的數(shù)據(jù),,那么對(duì)我們?cè)谡J(rèn)知風(fēng)險(xiǎn)、了解客戶滿意度等方面的幫助就非常有限了,?!?/font>

如果換成商業(yè)人士都可以聽懂的話,那么問題依然是:人工智能能否解決自己難以識(shí)別Excel內(nèi)容的問題,?

******

神經(jīng)網(wǎng)絡(luò)商業(yè)應(yīng)用的推廣進(jìn)度取決于其是否能夠像分析圖像一樣理解單詞的含義,。為解決這一問題,研究人員將目光轉(zhuǎn)向了一種名為Word2vec的技術(shù),。(“vec”代表向量,,是神經(jīng)網(wǎng)絡(luò)最擅長(zhǎng)理解的分析單元類型,。)Word2vec由谷歌(Google)的一個(gè)研究小組于2013年開發(fā),,并已經(jīng)作為開源軟件項(xiàng)目對(duì)外發(fā)布,,可以幫助計(jì)算機(jī)理解特定單詞之間的聯(lián)系,。Word2vec技術(shù)為更強(qiáng)大的語言系統(tǒng)的出現(xiàn)鋪平了道路,這些新推出的系統(tǒng)已經(jīng)能夠識(shí)別出與“汽車”一詞關(guān)系更密切的企業(yè)是寶馬(BMW),、日產(chǎn)(Nissan)這樣的汽車制造商,,而不是卡夫亨氏(Kraft Heinz)這樣的食品公司,。

Word2vec之所以具備神奇的計(jì)算能力,,是因?yàn)槠淇梢詫卧~轉(zhuǎn)換成神經(jīng)網(wǎng)絡(luò)能夠理解的數(shù)字串,,進(jìn)而識(shí)別出詞語之間的相關(guān)性。經(jīng)過一段時(shí)間的訓(xùn)練,,通過對(duì)更多文本進(jìn)行學(xué)習(xí),,神經(jīng)網(wǎng)絡(luò)便具備了根據(jù)單詞共同出現(xiàn)的頻率對(duì)其進(jìn)行打分的能力,并能夠根據(jù)分?jǐn)?shù)對(duì)單詞進(jìn)行分組,。與更早出現(xiàn)的所謂自然語言處理技術(shù)相比,,這些較新的系統(tǒng)提升了與人類思維典型相關(guān)的模式識(shí)別屬性。

借助這種計(jì)算機(jī)輔助的單詞聯(lián)想游戲,,計(jì)算機(jī)將可以理解表格中存儲(chǔ)的信息,。這個(gè)過程相當(dāng)于為神經(jīng)網(wǎng)絡(luò)創(chuàng)建了一套自己的摩爾斯電碼(Morse code):當(dāng)應(yīng)用程序在一份有關(guān)銷售情況的電子表格中遇到一列表示“日期”的數(shù)據(jù)時(shí),無需獲得明確指令,,只要借助足夠的數(shù)據(jù),,便能夠理解某些假日可能會(huì)對(duì)特定季節(jié)的銷售產(chǎn)生影響。

舊金山大學(xué)應(yīng)用數(shù)據(jù)倫理中心(University of San Francisco's Center for Applied Data Ethics)的主任,、非營(yíng)利教育機(jī)構(gòu)Fast.ai的聯(lián)合創(chuàng)始人雷切爾·托馬斯(Rachel Thomas)說:“這是底層的核心概念,。神經(jīng)網(wǎng)絡(luò)通過建模特定形態(tài)的模式創(chuàng)造了一種無限靈活的學(xué)習(xí)架構(gòu)?!?/font>

僅在投資領(lǐng)域就有大量通過文字分析創(chuàng)造價(jià)值的機(jī)會(huì),。

高盛集團(tuán)(Goldman Sachs)的一個(gè)研究小組正在對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使其獲得搜尋“家庭房產(chǎn)內(nèi)部轉(zhuǎn)讓”相關(guān)詞匯的能力,。在進(jìn)行非商業(yè)性質(zhì)的交易時(shí),,交易雙方很可能不會(huì)如實(shí)描述房產(chǎn)的真實(shí)價(jià)值,如果可以教會(huì)軟件在篩選資料時(shí)將相關(guān)信息排除在外,,自然能夠提高銀行的分析能力,。

“為此,我們訓(xùn)練了一個(gè)可以識(shí)別此類交易,、并減少對(duì)其關(guān)注程度的神經(jīng)網(wǎng)絡(luò),。”加州大學(xué)圣迭戈分校(University of California at San Diego)計(jì)算機(jī)科學(xué)專業(yè)的常任教授查爾斯·埃爾肯(Charles Elkan)表示,,直到最近,,他還在負(fù)責(zé)領(lǐng)導(dǎo)高盛集團(tuán)的機(jī)器學(xué)習(xí)項(xiàng)目。

復(fù)雜的詞語聯(lián)想對(duì)物流行業(yè)也有很大價(jià)值,。位于舊金山的外賣新創(chuàng)企業(yè)Instacart便使用了word2vec的一種變體技術(shù),,讓自己的算法能夠預(yù)測(cè)顧客的偏好,這一能力在公司無法提供顧客想要的產(chǎn)品時(shí)尤其有用,。為了方便神經(jīng)網(wǎng)絡(luò)處理相關(guān)信息,,該公司使用的程序會(huì)將超市庫存商品的“單詞”轉(zhuǎn)換成“數(shù)字形式的數(shù)據(jù)”,隨后,,神經(jīng)網(wǎng)絡(luò)會(huì)對(duì)相應(yīng)物品進(jìn)行分組,,以便理解這些數(shù)據(jù)的意義:例如,(通過分組,,神經(jīng)網(wǎng)絡(luò)會(huì)發(fā)現(xiàn),,)與咖啡相比,什錦干果與干果或堅(jiān)果的共同點(diǎn)更多,。Instacart的機(jī)器學(xué)習(xí)主管沙拉特·拉奧(Sharath Rao)表示,,使用這種技術(shù)幫助公司節(jié)約了時(shí)間和資金成本。他說:“不然我們就得思考所有可能的配對(duì),,還得保留一張(手填)表格,。”

*****

雖然在結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域里應(yīng)用深度學(xué)習(xí)技術(shù)已經(jīng)是大勢(shì)所趨,,但障礙依然存在,。

首先,這是一個(gè)全新的想法,,此前并未對(duì)其效果進(jìn)行過驗(yàn)證,,沒有人知道與更為傳統(tǒng)的統(tǒng)計(jì)方法相比,,這種技術(shù)可以有哪些優(yōu)勢(shì)。人工智能芯片生產(chǎn)公司英偉達(dá)(Nvidia)的數(shù)據(jù)科學(xué)家埃文·奧爾德里奇(Even Oldridge)說:“現(xiàn)在我們還不知道這個(gè)問題的答案,?!?/font>

的確,考慮到訓(xùn)練神經(jīng)網(wǎng)絡(luò)的費(fèi)用,,對(duì)于那些不具備人工智能專長(zhǎng)的企業(yè)來說,,原有的數(shù)據(jù)分析方法可能已經(jīng)夠用了。

百事公司的高管,、人工智能專家卡尼烏拉說:“我堅(jiān)信,,這個(gè)世界上絕不存在能夠解決所有問題的‘錦囊妙計(jì)’,對(duì)所有公司來說都是如此,?!?/font>

云服務(wù)巨頭亞馬遜(Amazon)、微軟(Microsoft)和谷歌在推銷自己的服務(wù)時(shí)實(shí)際上也隱含著這層意思:與其投入巨資,、招攬人才去爭(zhēng)取潛在的增量回報(bào),,還不如直接從我們這里購買人工智能服務(wù)。

與其它以“教會(huì)計(jì)算機(jī)具備‘思考’能力”為目的的項(xiàng)目一樣,,人類的偏見也會(huì)對(duì)項(xiàng)目的成功構(gòu)成威脅,。深度學(xué)習(xí)系統(tǒng)的優(yōu)劣取決于訓(xùn)練它們所用的數(shù)據(jù),數(shù)據(jù)太多或太少都可能會(huì)使軟件的預(yù)測(cè)產(chǎn)生偏差,。

以基因泰克的數(shù)據(jù)集為例,,該數(shù)據(jù)集收入了此前15年的癌癥病人的臨床數(shù)據(jù),但只收入了此前8年的基因組測(cè)試數(shù)據(jù),,也就是說,,在此之前的患者數(shù)據(jù)并不像研究人員所希望的那樣具有可比性。

供職于基因泰克的科平說:“如果我們對(duì)這些數(shù)據(jù)集缺乏了解,,那么據(jù)此建立起來的模型可能毫無可靠性可言,。”

科平表示,,盡管如此,,對(duì)這些電子表格中的內(nèi)容進(jìn)行強(qiáng)化分析依然具有很高的潛在價(jià)值,其意義完全不亞于獲得“預(yù)測(cè)一名病人在接受某種治療之后可以存活多久”的能力,。對(duì)一堆表格來說,,能夠做到這一點(diǎn)也算是不錯(cuò)的成績(jī)了。

*****

數(shù)家公司正在對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,,希望其能夠處理自己已有的結(jié)構(gòu)化數(shù)據(jù),,這些公司包括:

基因泰克

這家生物技術(shù)先驅(qū)企業(yè)制作了一份內(nèi)含繁雜健康數(shù)據(jù)、覆蓋數(shù)萬名患者的電子表格,從常規(guī)記錄到基因組圖譜,,不一而足,。這一研究具有重要意義:如果人工智能真可以通過正確方式來分析這些數(shù)據(jù),個(gè)體病患在未來或?qū)⒛軌颢@得針對(duì)其疾病制定的個(gè)性化治療方案,。

高盛集團(tuán)

人工智能為投資者提供了無限機(jī)遇,。受高盛集團(tuán)聘請(qǐng),一位機(jī)器學(xué)習(xí)專業(yè)的教授開發(fā)了一種訓(xùn)練工具,,借助這種工具,神經(jīng)網(wǎng)絡(luò)可以學(xué)會(huì)忽略那些可能使金融分析復(fù)雜化的詞語,,比如“家庭內(nèi)部轉(zhuǎn)讓”(出現(xiàn)這一詞語時(shí),,交易中的房產(chǎn)價(jià)值可能失真)。神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)識(shí)別,、忽略此類詞語能夠提升現(xiàn)有分析模型的效率,。

Instacart

這家外賣新創(chuàng)企業(yè)擁有一套易于理解的數(shù)據(jù)集,內(nèi)含員工需要為顧客選取的各種超市商品,。該公司正在訓(xùn)練算法進(jìn)行復(fù)雜單詞聯(lián)想的能力,,例如在看到什錦干果時(shí),可以聯(lián)想到堅(jiān)果和干果,,方便在顧客所需商品缺貨時(shí)為其提供替代選擇,。(財(cái)富中文網(wǎng))

譯者:Feb

財(cái)富中文網(wǎng)所刊載內(nèi)容之知識(shí)產(chǎn)權(quán)為財(cái)富媒體知識(shí)產(chǎn)權(quán)有限公司及/或相關(guān)權(quán)利人專屬所有或持有。未經(jīng)許可,,禁止進(jìn)行轉(zhuǎn)載,、摘編、復(fù)制及建立鏡像等任何使用,。
0條Plus
精彩評(píng)論
評(píng)論

撰寫或查看更多評(píng)論

請(qǐng)打開財(cái)富Plus APP

前往打開
熱讀文章