在資本市場(chǎng)熱捧ChatGPT概念的同時(shí),法律工作者也在評(píng)估ChatGPT自身可能會(huì)帶來(lái)哪些法律安全風(fēng)險(xiǎn)以及其法律合規(guī)路徑,。目前人工智能領(lǐng)域,尤其是自然語(yǔ)言處理技術(shù)領(lǐng)域正在快速發(fā)展階段,,該技術(shù)很可能會(huì)陷入所謂的“科林格里奇窘境”,,與此相對(duì)應(yīng)的法律監(jiān)管似乎并未“跟得上步伐”,而ChatGPT等AI聊天基礎(chǔ)存在的現(xiàn)實(shí)合規(guī)問(wèn)題也急需重視,。
ChatGPT等基于自然語(yǔ)言處理技術(shù)的聊天AI,就短期來(lái)看亟需要解決的法律合規(guī)問(wèn)題主要有三個(gè):
其一,,聊天AI提供的答復(fù)的知識(shí)產(chǎn)權(quán)問(wèn)題,,其中最主要的合規(guī)難題是聊天AI產(chǎn)出的答復(fù)是否產(chǎn)生相應(yīng)的知識(shí)產(chǎn)權(quán)?是否需要知識(shí)產(chǎn)權(quán)授權(quán),?
其二,,聊天AI對(duì)巨量的自然語(yǔ)言處理文本(一般稱(chēng)之為語(yǔ)料庫(kù))進(jìn)行數(shù)據(jù)挖掘和訓(xùn)練的過(guò)程是否需要獲得相應(yīng)的知識(shí)產(chǎn)權(quán)授權(quán)?
其三,,ChatGPT等聊天AI的回答機(jī)制之一是通過(guò)對(duì)大量已經(jīng)存在的自然語(yǔ)言文本進(jìn)行數(shù)學(xué)上的統(tǒng)計(jì),,得到一個(gè)基于統(tǒng)計(jì)的語(yǔ)言模型,這一機(jī)制導(dǎo)致聊天AI很可能會(huì)“一本正經(jīng)的胡說(shuō)八道”,,進(jìn)而導(dǎo)致虛假信息傳播的法律風(fēng)險(xiǎn),,在這一技術(shù)背景下,如何盡可能降低聊天AI的虛假信息傳播風(fēng)險(xiǎn),?
總體而言,,目前我國(guó)對(duì)于人工智能立法依然處在預(yù)研究階段,還沒(méi)有正式的立法計(jì)劃或者相關(guān)的動(dòng)議草案,,相關(guān)部門(mén)對(duì)于人工智能領(lǐng)域的監(jiān)管尤為謹(jǐn)慎,,隨著人工智能的逐步發(fā)展,相應(yīng)的法律合規(guī)難題只會(huì)越來(lái)越多,。
一,、ChatGPT并非是“跨時(shí)代的人工智能技術(shù)”
ChatGPT本質(zhì)上是自然語(yǔ)言處理技術(shù)發(fā)展的產(chǎn)物,本質(zhì)上依然僅是一個(gè)語(yǔ)言模型,。
2023開(kāi)年之初全球科技巨頭微軟的巨額投資讓ChatGPT成為科技領(lǐng)域的“頂流”并成功出圈,。隨著資本市場(chǎng)ChatGPT概念板塊的大漲,國(guó)內(nèi)眾多科技企業(yè)也著手布局這一領(lǐng)域,,在資本市場(chǎng)熱捧ChatGPT概念的同時(shí),,作為法律工作者,我們不禁要評(píng)估ChatGPT自身可能會(huì)帶來(lái)哪些法律安全風(fēng)險(xiǎn),,其法律合規(guī)路徑何在,?
在討論ChatGPT的法律風(fēng)險(xiǎn)及合規(guī)路徑之前,我們首先應(yīng)當(dāng)審視ChatGPT的技術(shù)原理——ChatGPT是否如新聞所言一樣,,可以給提問(wèn)者回答任何其想要的問(wèn)題,?
在颯姐團(tuán)隊(duì)看來(lái),ChatGPT似乎遠(yuǎn)沒(méi)有部分新聞所宣傳的那樣“神”——一句話(huà)總結(jié),,其僅僅是Transformer和GPT等自然語(yǔ)言處理技術(shù)的集成,,本質(zhì)上依然是一個(gè)基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,而非一項(xiàng)“跨時(shí)代的AI進(jìn)步”,。
前面已經(jīng)提到ChatGPT是自然語(yǔ)言處理技術(shù)發(fā)展的產(chǎn)物,,就該技術(shù)的發(fā)展史來(lái)看,其大致經(jīng)歷了基于語(yǔ)法的語(yǔ)言模型——基于統(tǒng)計(jì)的語(yǔ)言模型——基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型三大階段,,ChatGPT所在的階段正是基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型階段,,想要更為直白地理解ChatGPT的工作原理及該原理可能引發(fā)的法律風(fēng)險(xiǎn),,必須首先闡明的就是基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型的前身——基于統(tǒng)計(jì)的語(yǔ)言模型的工作原理。
在基于統(tǒng)計(jì)的語(yǔ)言模型階段,,AI工程師通過(guò)對(duì)巨量的自然語(yǔ)言文本進(jìn)行統(tǒng)計(jì),,確定詞語(yǔ)之間先后連結(jié)的概率,當(dāng)人們提出一個(gè)問(wèn)題時(shí),,AI開(kāi)始分析該問(wèn)題的構(gòu)成詞語(yǔ)共同組成的語(yǔ)言環(huán)境之下,,哪些詞語(yǔ)搭配是高概率的,之后再將這些高概率的詞語(yǔ)拼接在一起,,返回一個(gè)基于統(tǒng)計(jì)學(xué)的答案,。可以說(shuō)這一原理自出現(xiàn)以來(lái)就貫穿了自然語(yǔ)言處理技術(shù)的發(fā)展,,甚至從某種意義上說(shuō),,之后出現(xiàn)的基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型亦是對(duì)基于統(tǒng)計(jì)的語(yǔ)言模型的修正。
舉一個(gè)容易理解的例子,,颯姐團(tuán)隊(duì)在ChatGPT聊天框中輸入問(wèn)題“大連有哪些旅游勝地,?”
AI第一步會(huì)分析問(wèn)題中的基本語(yǔ)素“大連、哪些,、旅游,、勝地”,再在已有的語(yǔ)料庫(kù)中找到這些語(yǔ)素所在的自然語(yǔ)言文本集合,,在這個(gè)集合中找尋出現(xiàn)概率最多的搭配,,再將這些搭配組合以形成最終的答案。如AI會(huì)發(fā)現(xiàn)在“大連,、旅游,、勝地”這三個(gè)詞高概率出現(xiàn)的語(yǔ)料庫(kù)中,有“中山公園”一詞,,于是就會(huì)返回“中山公園”,,又如“公園”這個(gè)詞與花園、湖泊,、噴泉,、雕像等詞語(yǔ)搭配的概率最大,因此就會(huì)進(jìn)一步返回“這是一個(gè)歷史悠久的公園,,有美麗的花園,、湖泊、噴泉和雕像,?!?/p>
換言之,整個(gè)過(guò)程都是基于AI背后已有的自然語(yǔ)言文本信息(語(yǔ)料庫(kù))進(jìn)行的概率統(tǒng)計(jì),,因此返回的答案也都是“統(tǒng)計(jì)的結(jié)果”,,這就導(dǎo)致了ChatGPT在許多問(wèn)題上會(huì)“一本正經(jīng)的胡說(shuō)八道”,。如剛才的這個(gè)問(wèn)題“大連有哪些旅游勝地”的回答,大連雖然有中山公園,,但是中山公園中并沒(méi)有湖泊,、噴泉和雕像。大連在歷史上的確有“斯大林廣場(chǎng)”,,但是斯大林廣場(chǎng)自始至終都不是一個(gè)商業(yè)廣場(chǎng),也沒(méi)有任何購(gòu)物中心,、餐廳和娛樂(lè)場(chǎng)所,。顯然,ChatGPT返回的信息是虛假的,。
二,、ChatGPT作為語(yǔ)言模型目前其最適合的應(yīng)用場(chǎng)景
雖然上個(gè)部分我們直白的講明了基于統(tǒng)計(jì)的語(yǔ)言模型的弊端,但ChatGPT畢竟已經(jīng)是對(duì)基于統(tǒng)計(jì)的語(yǔ)言模型大幅度改良的基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,,其技術(shù)基礎(chǔ)Transformer和GPT都是最新一代的語(yǔ)言模型,,ChatGPT本質(zhì)上就是將海量的數(shù)據(jù)結(jié)合表達(dá)能力很強(qiáng)的Transformer模型結(jié)合,從而對(duì)自然語(yǔ)言進(jìn)行了一個(gè)非常深度的建模,,返回的語(yǔ)句雖然有時(shí)候是“胡說(shuō)八道”,,但乍一看還是很像“人類(lèi)回復(fù)的”,因此這一技術(shù)在需要海量的人機(jī)交互的場(chǎng)景下具有廣泛的應(yīng)用場(chǎng)景,。
就目前來(lái)看,,這樣的場(chǎng)景有三個(gè):
其一,搜索引擎,;
其二,,銀行、律所,、各類(lèi)中介機(jī)構(gòu),、商場(chǎng)、醫(yī)院,、政府政務(wù)服務(wù)平臺(tái)中的人機(jī)交互機(jī)制,,如上述場(chǎng)所中的客訴系統(tǒng)、導(dǎo)診導(dǎo)航,、政務(wù)咨詢(xún)系統(tǒng),;
第三,智能汽車(chē),、智能家居(如智能音箱,、智能燈光)等的交互機(jī)制。
結(jié)合ChatGPT等AI聊天技術(shù)的搜索引擎很可能會(huì)呈現(xiàn)出傳統(tǒng)搜索引擎為主+基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型為輔的途徑,。目前傳統(tǒng)的搜索巨頭如谷歌和百度均在基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型技術(shù)上有著深厚的積累,,譬如谷歌就有與ChatGPT相媲美的Sparrow和Lamda,,有著這些語(yǔ)言模型的加持,搜索引擎將會(huì)更加“人性化”,。
ChatGPT等AI聊天技術(shù)運(yùn)用在客訴系統(tǒng)和醫(yī)院,、商場(chǎng)的導(dǎo)診導(dǎo)航以及政府機(jī)關(guān)的政務(wù)咨詢(xún)系統(tǒng)中將大幅度降低相關(guān)單位的人力資源成本,節(jié)約溝通時(shí)間,,但問(wèn)題在于基于統(tǒng)計(jì)的回答有可能產(chǎn)生完全錯(cuò)誤的內(nèi)容回復(fù),,由此帶來(lái)的風(fēng)控風(fēng)險(xiǎn)恐怕還需要進(jìn)一步評(píng)估。
相比于上述兩個(gè)應(yīng)用場(chǎng)景,,ChatGPT應(yīng)用在智能汽車(chē),、智能家居等領(lǐng)域成為上述設(shè)備的人機(jī)交互機(jī)制的法律風(fēng)險(xiǎn)則要小很多,因?yàn)檫@類(lèi)領(lǐng)域應(yīng)用環(huán)境較為私密,,AI反饋的錯(cuò)誤內(nèi)容不至于引起大的法律風(fēng)險(xiǎn),,同時(shí)這類(lèi)場(chǎng)景對(duì)內(nèi)容準(zhǔn)確性要求不高,商業(yè)模式也更為成熟,。
三,、ChatGPT的法律風(fēng)險(xiǎn)及合規(guī)路徑初探
第一,人工智能在我國(guó)的整體監(jiān)管圖景
和許多新興技術(shù)一樣,,ChatGPT所代表的自然語(yǔ)言處理技術(shù)也面臨著“科林格里奇窘境(Collingridge dilemma)”,。這一窘境包含了信息困境與控制困境,所謂信息困境,,即一項(xiàng)新興技術(shù)所帶來(lái)的社會(huì)后果不能在該技術(shù)的早期被預(yù)料到,;所謂控制困境,即當(dāng)一項(xiàng)新興技術(shù)所帶來(lái)的不利的社會(huì)后果被發(fā)現(xiàn)時(shí),,技術(shù)卻往往已經(jīng)成為整個(gè)社會(huì)和經(jīng)濟(jì)結(jié)構(gòu)的一部分,,致使不利的社會(huì)后果無(wú)法被有效控制。
目前人工智能領(lǐng)域,,尤其是自然語(yǔ)言處理技術(shù)領(lǐng)域正在快速發(fā)展階段,,該技術(shù)很可能會(huì)陷入所謂的“科林格里奇窘境”,與此相對(duì)應(yīng)的法律監(jiān)管似乎并未“跟得上步伐”,。我國(guó)目前尚無(wú)國(guó)家層面上的人工智能產(chǎn)業(yè)立法,,但地方已經(jīng)有相關(guān)的立法嘗試。就在去年9月,,深圳市公布了全國(guó)首部人工智能產(chǎn)業(yè)專(zhuān)項(xiàng)立法《深圳經(jīng)濟(jì)特區(qū)人工智能產(chǎn)業(yè)促進(jìn)條例》,,緊接著上海也通過(guò)了《上海市促進(jìn)人工智能產(chǎn)業(yè)發(fā)展條例》,相信不久之后各地均會(huì)出臺(tái)類(lèi)似的人工智能產(chǎn)業(yè)立法,。
在人工智能的倫理規(guī)制方面,,國(guó)家新一代人工智能治理專(zhuān)業(yè)委員會(huì)亦在2021年發(fā)布了《新一代人工智能倫理規(guī)范》,提出將倫理道德融入人工智能研發(fā)和應(yīng)用的全生命周期,,或許在不久的將來(lái),,類(lèi)似阿西莫夫小說(shuō)中的“機(jī)器人三定律”將成為人工智能領(lǐng)域監(jiān)管的鐵律,。
第二,ChatGPT帶來(lái)的虛假信息法律風(fēng)險(xiǎn)問(wèn)題
將目光由宏觀轉(zhuǎn)向微觀,,拋開(kāi)人工智能產(chǎn)業(yè)的整體監(jiān)管圖景和人工智能倫理規(guī)制問(wèn)題,,ChatGPT等AI聊天基礎(chǔ)存在的現(xiàn)實(shí)合規(guī)問(wèn)題也急需重視。
這其中較為棘手的是ChatGPT回復(fù)的虛假信息問(wèn)題,,正如本文在第二部分提及的,,ChatGPT的工作原理導(dǎo)致其回復(fù)可能完全是“一本正經(jīng)的胡說(shuō)八道”,這種看似真實(shí)實(shí)則離譜的虛假信息具有極大的誤導(dǎo)性,。當(dāng)然,,像對(duì)“大連有哪些旅游勝地”這類(lèi)問(wèn)題的虛假回復(fù)可能不會(huì)造成嚴(yán)重后果,但倘若ChatGPT應(yīng)用到搜索引擎,、客訴系統(tǒng)等領(lǐng)域,,其回復(fù)的虛假信息可能造成極為嚴(yán)重的法律風(fēng)險(xiǎn),。
實(shí)際上這樣的法律風(fēng)險(xiǎn)已經(jīng)出現(xiàn),,2022年11月幾乎與ChatGPT同一時(shí)間上線(xiàn)的Meta服務(wù)科研領(lǐng)域的語(yǔ)言模型Galactica就因?yàn)檎婕俅鸢富祀s的問(wèn)題,測(cè)試僅僅3天就被用戶(hù)投訴下線(xiàn),。在技術(shù)原理無(wú)法短時(shí)間突破的前提下,,倘若將ChatGPT及類(lèi)似的語(yǔ)言模型應(yīng)用到搜索引擎、客訴系統(tǒng)等領(lǐng)域,,就必須對(duì)其進(jìn)行合規(guī)性改造,。當(dāng)檢測(cè)到用戶(hù)可能詢(xún)問(wèn)專(zhuān)業(yè)性問(wèn)題時(shí),應(yīng)當(dāng)引導(dǎo)用戶(hù)咨詢(xún)相應(yīng)的專(zhuān)業(yè)人員,,而非在人工智能處尋找答案,,同時(shí)應(yīng)當(dāng)顯著提醒用戶(hù)聊天AI返回的問(wèn)題真實(shí)性可能需要進(jìn)一步驗(yàn)證,以最大程度降低相應(yīng)的合規(guī)風(fēng)險(xiǎn),。
第三,,ChatGPT帶來(lái)的知識(shí)產(chǎn)權(quán)合規(guī)問(wèn)題
當(dāng)將目光由宏觀轉(zhuǎn)向微觀時(shí),除了AI回復(fù)信息的真實(shí)性問(wèn)題,,聊天AI尤其是像ChatGPT這樣的大型語(yǔ)言模型的知識(shí)產(chǎn)權(quán)問(wèn)題亦應(yīng)該引起合規(guī)人員的注意,。
首先的合規(guī)難題是“文本數(shù)據(jù)挖掘”是否需要相應(yīng)的知識(shí)產(chǎn)權(quán)授權(quán)問(wèn)題。正如前文所指明的ChatGPT的工作原理,,其依靠巨量的自然語(yǔ)言本文(或言語(yǔ)料庫(kù)),,ChatGPT需要對(duì)語(yǔ)料庫(kù)中的數(shù)據(jù)進(jìn)行挖掘和訓(xùn)練,ChatGPT需要將語(yǔ)料庫(kù)中的內(nèi)容復(fù)制到自己的數(shù)據(jù)庫(kù)中,,相應(yīng)的行為通常在自然語(yǔ)言處理領(lǐng)域被稱(chēng)之為“文本數(shù)據(jù)挖掘”,。當(dāng)相應(yīng)的文本數(shù)據(jù)可能構(gòu)成作品的前提下,文本數(shù)據(jù)挖掘行為是否侵犯復(fù)制權(quán)當(dāng)前仍存在爭(zhēng)議,。
在比較法領(lǐng)域,,日本和歐盟在其著作權(quán)立法中均對(duì)合理使用的范圍進(jìn)行了擴(kuò)大,,將AI中的“文本數(shù)據(jù)挖掘”增列為一項(xiàng)新的合理使用的情形。雖然2020年我國(guó)著作權(quán)法修法過(guò)程中有學(xué)者主張將我國(guó)的合理使用制度由“封閉式”轉(zhuǎn)向“開(kāi)放式”,,但這一主張最后并未被采納,,目前我國(guó)著作權(quán)法依舊保持了合理使用制度的封閉式規(guī)定,僅著作權(quán)法第二十四條規(guī)定的十三中情形可以被認(rèn)定為合理使用,,換言之,,目前我國(guó)著作權(quán)法并未將AI中的“文本數(shù)據(jù)挖掘”納入到合理適用的范圍內(nèi),文本數(shù)據(jù)挖掘在我國(guó)依然需要相應(yīng)的知識(shí)產(chǎn)權(quán)授權(quán),。
其次的合規(guī)難題是ChatGPT產(chǎn)生的答復(fù)是否具有獨(dú)創(chuàng)性,?對(duì)于AI生成的作品是否具有獨(dú)創(chuàng)性的問(wèn)題,颯姐團(tuán)隊(duì)認(rèn)為其判定標(biāo)準(zhǔn)不應(yīng)當(dāng)與現(xiàn)有的判定標(biāo)準(zhǔn)有所區(qū)別,,換言之,,無(wú)論某一答復(fù)是AI完成的還是人類(lèi)完成的,其都應(yīng)當(dāng)根據(jù)現(xiàn)有的獨(dú)創(chuàng)性標(biāo)準(zhǔn)進(jìn)行判定,。其實(shí)這個(gè)問(wèn)題背后是另一個(gè)更具有爭(zhēng)議性的問(wèn)題,,如果AI生成的答復(fù)具有獨(dú)創(chuàng)性,那么著作權(quán)人可以是AI嗎,?顯然,,在包括我國(guó)在內(nèi)的大部分國(guó)家的知識(shí)產(chǎn)權(quán)法律下,作品的作者僅有可能是自然人,,AI無(wú)法成為作品的作者,。
最后,ChatGPT倘若在自己的回復(fù)中拼接了第三方作品,,其知識(shí)產(chǎn)權(quán)問(wèn)題應(yīng)當(dāng)如何處理,?颯姐團(tuán)隊(duì)認(rèn)為,如果ChatGPT的答復(fù)中拼接了語(yǔ)料庫(kù)中擁有著作權(quán)的作品(雖然依據(jù)ChatGPT的工作原理,,這種情況出現(xiàn)的概率較?。敲窗凑罩袊?guó)現(xiàn)行的著作權(quán)法,,除非構(gòu)成合理使用,,否則非必須獲得著作權(quán)人的授權(quán)后才可以復(fù)制。(財(cái)富中文網(wǎng))
作者肖颯為財(cái)富中文網(wǎng)專(zhuān)欄作家,,“科技+金融”深度法律服務(wù)者
本內(nèi)容為作者獨(dú)立觀點(diǎn),,不代表財(cái)富中文網(wǎng)立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,。
編輯:劉蘭香