生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)與制度因應(yīng)_第1頁
生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)與制度因應(yīng)_第2頁
生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)與制度因應(yīng)_第3頁
生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)與制度因應(yīng)_第4頁
生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)與制度因應(yīng)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

目錄摘要(關(guān)鍵字) 頁共17頁生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)與制度因應(yīng)【摘要】隨著技術(shù)的不斷進(jìn)步,生成式人工智能已成為當(dāng)代社會的熱門話題。生成式人工智能的工作原理通常包括數(shù)據(jù)收集、模型訓(xùn)練和作品生成三個(gè)主要階段。在生成式人工智能的訓(xùn)練過程中,數(shù)據(jù)扮演著至關(guān)重要的角色。然而,這些數(shù)據(jù)的來源和使用方式往往與著作權(quán)法產(chǎn)生沖突,從而帶來了潛在的侵權(quán)風(fēng)險(xiǎn)。本研究從輸入、訓(xùn)練和輸出三個(gè)階段對這些風(fēng)險(xiǎn)進(jìn)行詳細(xì)的分析。在深入探討生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)問題時(shí),我們不可避免地會遇到一系列現(xiàn)實(shí)困境。其一,大量使用受著作權(quán)保護(hù)的作品作為訓(xùn)練數(shù)據(jù),可能會造成與著作權(quán)人和公眾的利益沖突。其二,過于嚴(yán)格的著作權(quán)保護(hù)可能會阻礙生成式人工智能技術(shù)的創(chuàng)新和應(yīng)用。其三,現(xiàn)有的合理使用制度無法適應(yīng)生成式人工智能的技術(shù)發(fā)展。針對提出的困境和挑戰(zhàn),通過借鑒歐盟等外國國家的相關(guān)經(jīng)驗(yàn)、設(shè)定相關(guān)的法定許可、設(shè)計(jì)更開放的合理使用制度等等的一系列制度因應(yīng),旨在平衡著作權(quán)保護(hù)與生成式人工智能技術(shù)發(fā)展之間的關(guān)系?!娟P(guān)鍵詞】生成式人工智能;著作權(quán)侵權(quán);訓(xùn)練數(shù)據(jù);合理使用Copyrightinfringementriskandinstitutionalresponseofgenerativeartificialintelligencetrainingdata【Abstract】Withthecontinuousprogressoftechnology,generativeartificialintelligencehasbecomeahottopicincontemporarysociety.TheworkingprincipleofgenerativeAIusuallyincludesthreemainstages:datacollection,modeltrainingandworkgeneration.InthetrainingprocessofgenerativeAI,dataplaysacrucialrole.However,thesourceanduseofthesedataoftenconflictwithcopyrightlaw,whichbringspotentialinfringementrisks.Thisstudyanalyzestheserisksindetailfromthreestages:input,trainingandoutput.Whendiscussingthecopyrightofgenerativeartificialintelligencetrainingdata,wewillinevitablyencounteraseriesofpracticaldilemmas.First,theextensiveuseofcopyrightedworksastrainingdatamaycreateconflictsofinterestwithcopyrightownersandthepublic.Second,toostrictcopyrightprotectionmayhindertheinnovationandapplicationofgenerativeAItechnologies.Third,theexistingfairusesystemcan’tadapttothetechnologicaldevelopmentofgenerativeartificialintelligence.Inresponsetotheproposeddilemmasandchallenges,thisstudywillexploreaseriesofinstitutionalsolutionstobalancetherelationshipbetweencopyrightprotectionandthedevelopmentofgenerativeAItechnologybydrawingontherelevantexperienceofforeigncountriessuchastheEuropeanUnion,settingrelevantstatutorylicenses,anddesigningamoreopenfairusesystem.【Keywords】Generativeartificialintelligence;Copyrightinfringement;Trainingdata;Fairuse第一章緒論一、選題背景和意義自上世紀(jì)以來,中國經(jīng)濟(jì)以建設(shè)為核心發(fā)展戰(zhàn)略,推動經(jīng)濟(jì)改革順利進(jìn)行,高科技領(lǐng)域迅速發(fā)展,人工智能技術(shù)嶄露頭角。隨著人工智能技術(shù)的日益普及,涉及到人工智能生成物的著作權(quán)問題日益凸顯。盡管已有大量關(guān)于人工智能生成物著作權(quán)歸屬的研究,但很少涉及到由訓(xùn)練數(shù)據(jù)導(dǎo)致的著作權(quán)問題?,F(xiàn)階段,遵循著作權(quán)法的相關(guān)規(guī)定,若人工智能系統(tǒng)在創(chuàng)作過程中需利用受著作權(quán)保護(hù)的作品,則必須事先獲得該作品著作權(quán)人的明確授權(quán),但這可能導(dǎo)致巨大的研發(fā)成本,阻礙了人工智能技術(shù)的發(fā)展和應(yīng)用。隨著數(shù)字和互聯(lián)網(wǎng)技術(shù)的發(fā)展,如何在新技術(shù)應(yīng)用的同時(shí)平衡權(quán)利人和公眾的利益成為迫切需要解決的問題。二、國內(nèi)發(fā)展?fàn)顩r國內(nèi)對相關(guān)領(lǐng)域研究持有積極態(tài)度,且研究方向多樣,與國外相比,更注重未來發(fā)展方向。圍繞生成式人工智能在訓(xùn)練數(shù)據(jù)相關(guān)方面的著作權(quán)風(fēng)險(xiǎn)防范及化解的主題,主要有以下幾個(gè)方面:第一,研究數(shù)據(jù)來源的法律屬性,觀點(diǎn)主要有:技術(shù)本體論的支持者提出,生成式人工智能作為一種創(chuàng)新技術(shù),具備對龐大數(shù)據(jù)集進(jìn)行檢索、匯集、深度挖掘及分析的能力;中立工具論的支持者的觀點(diǎn)主要集中在人工智能處理巨量數(shù)據(jù)的特性上,他們認(rèn)為人工智能可以被用作解決社會難題、實(shí)現(xiàn)商業(yè)利潤以及推動科學(xué)研究深入的有效工具;財(cái)產(chǎn)權(quán)客體論的支持者更著重強(qiáng)調(diào)信息財(cái)產(chǎn)權(quán)以及個(gè)人信息財(cái)產(chǎn)權(quán)的至關(guān)重要性。第二,探討數(shù)據(jù)的著作權(quán)保護(hù)模式,一種是賦權(quán)保護(hù)模式,以勞動增值說和制度激勵(lì)說為基礎(chǔ),將作品數(shù)據(jù)的主體選定為用戶或平臺;另一種是行為規(guī)制模式,通過規(guī)范行為的方式來保護(hù)數(shù)據(jù),以更好地防控風(fēng)險(xiǎn),并在公益與私益之間尋求平衡。第三,調(diào)整著作權(quán)現(xiàn)有制度,主要包括參見郝思洋.知識產(chǎn)權(quán)視角下數(shù)據(jù)財(cái)產(chǎn)的制度選項(xiàng)[J].知識產(chǎn)權(quán),2019,(09):45-60.:擴(kuò)大知識產(chǎn)權(quán)的適用范圍,將數(shù)據(jù)的本質(zhì)認(rèn)為是信息,應(yīng)在現(xiàn)有法律基礎(chǔ)上建立專門制度;調(diào)整著作權(quán)許可協(xié)議,考慮技術(shù)保護(hù)措施要素,適當(dāng)放寬對著作權(quán)獨(dú)創(chuàng)性的要求;采用鄰接權(quán)延伸保護(hù),以較低的立法成本參見郝思洋.知識產(chǎn)權(quán)視角下數(shù)據(jù)財(cái)產(chǎn)的制度選項(xiàng)[J].知識產(chǎn)權(quán),2019,(09):45-60.第四,構(gòu)想創(chuàng)設(shè)新制度,從經(jīng)濟(jì)學(xué)理論的角度來說,由于交易成本的上升可能會引發(fā)制度變革的需求,因此,為實(shí)現(xiàn)外部性的內(nèi)部化,有必要對財(cái)產(chǎn)權(quán)進(jìn)行重新配置。在這一背景下,針對數(shù)據(jù)作品進(jìn)行適度的制度設(shè)計(jì)顯得尤為關(guān)鍵。具體而言,我們可以通過預(yù)先設(shè)定排他性的財(cái)產(chǎn)權(quán),并結(jié)合反不正當(dāng)競爭法的事后監(jiān)管措施,來共同維護(hù)市場的正常交易秩序和公平的商業(yè)道德。三、國外發(fā)展?fàn)顩r哈佛大學(xué)教授本杰明·索貝爾(BenjaminL.W.Sobel)指出BenjaminL.W.Sobel,ArtificialIntelligence’sFairUseCrisis,COLUM.J.L.&ARTSBenjaminL.W.Sobel,ArtificialIntelligence’sFairUseCrisis,COLUM.J.L.&ARTS,2017,41,pp.45-97.紐約大學(xué)信息法律研究所研究員阿曼達(dá)·列文斯基(AmandaLevendowski)于2018年發(fā)表文章AmandaLevendowski,HowCopyrightLawCanFixArtificialIntelligence’sImplicitBiasProblem,WashingtonLawReviewAmandaLevendowski,HowCopyrightLawCanFixArtificialIntelligence’sImplicitBiasProblem,WashingtonLawReview,2018,93(2),pp.583-584.在2018年,日本對著作權(quán)法進(jìn)行了修訂,針對人工智能使用作品數(shù)據(jù)的相關(guān)例外與限制條款進(jìn)行了調(diào)整。根據(jù)修訂后的法律規(guī)定,人工智能在創(chuàng)作或處理信息的過程中,如果目的是為了、提供新的知識和信息,可以在必要的范圍內(nèi)復(fù)制著作權(quán)人的作品,但這一行為必須確保不損害著作權(quán)人的合法權(quán)益。2019年歐盟通過了《數(shù)字化單一市場版權(quán)指令》第3條明確界定了權(quán)利例外的范疇,僅限于“文化遺產(chǎn)機(jī)構(gòu)和研究組織”出于“科學(xué)研究目的”的復(fù)制和節(jié)選行為。相較之下,第4條則涵蓋了其他形式的文本與數(shù)據(jù)挖掘活動。此外,若權(quán)利人以合理方式保留了自己進(jìn)行文本與數(shù)據(jù)挖掘的權(quán)限,則第4條所規(guī)定的例外情形將不再適用。,該指令第3和第4條分別對科研目的下和一般情況下的文本和數(shù)據(jù)挖掘做出了著作權(quán)的例外與限制,正式承認(rèn)了機(jī)器使用作品進(jìn)行挖掘分析的合法性第3條明確界定了權(quán)利例外的范疇,僅限于“文化遺產(chǎn)機(jī)構(gòu)和研究組織”出于“科學(xué)研究目的”的復(fù)制和節(jié)選行為。相較之下,第4條則涵蓋了其他形式的文本與數(shù)據(jù)挖掘活動。此外,若權(quán)利人以合理方式保留了自己進(jìn)行文本與數(shù)據(jù)挖掘的權(quán)限,則第4條所規(guī)定的例外情形將不再適用。參見楊小桐.歐盟《數(shù)字化單一市場版權(quán)指令》文本數(shù)據(jù)挖掘版權(quán)例外制度評析[J].法制與社會,2020,(12):5-6+10.

第二章生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)概述一、生成式人工智能訓(xùn)練數(shù)據(jù)的作用機(jī)制生成式人工智能參見任鳳琴,董子涵.生成式人工智能賦能思想政治教育的風(fēng)險(xiǎn)與規(guī)避[J].理論導(dǎo)刊,2024,(02):121-128.參見任鳳琴,董子涵.生成式人工智能賦能思想政治教育的風(fēng)險(xiǎn)與規(guī)避[J].理論導(dǎo)刊,2024,(02):121-128.生成式人工智能實(shí)質(zhì)上是一種"生成型預(yù)訓(xùn)練語言轉(zhuǎn)換器",它依托于龐大的數(shù)據(jù)集進(jìn)行訓(xùn)練,進(jìn)而習(xí)得并解讀人類語言,擁有與人交流和對話的能力,不僅如此,它還能勝任諸如撰寫郵件、創(chuàng)作視頻劇本、文案設(shè)計(jì)、語言翻譯以及編寫代碼等多項(xiàng)任務(wù)。這種人工智能在“內(nèi)容創(chuàng)新”和“思維模擬”方面表現(xiàn)出色,且其應(yīng)用場景正逐漸從日常生活拓展至各個(gè)專業(yè)領(lǐng)域。目前,生成式人工智能已在智能辦公、科研輔助、教育智能化、醫(yī)療智慧化以及游戲設(shè)計(jì)、新聞報(bào)道、插畫創(chuàng)作等多個(gè)領(lǐng)域得到廣泛應(yīng)用參見參見鈄曉東.論生成式人工智能的數(shù)據(jù)安全風(fēng)險(xiǎn)及回應(yīng)型治理[J].東方法學(xué),2023,(05):106-116.生成式人工智能以其卓越的能力,正在逐漸改變我們的生活方式和工作模式。它不僅在理解人類語言上有著出色的表現(xiàn),更能勝任多種復(fù)雜的創(chuàng)作任務(wù),展現(xiàn)出其驚人的潛力和應(yīng)用價(jià)值。而在這背后,訓(xùn)練數(shù)據(jù)起到了至關(guān)重要的作用,正是通過海量的數(shù)據(jù)集的輸入、訓(xùn)練和學(xué)習(xí),生成式人工智能才得以不斷積累知識,提升技能,從而完成各種復(fù)雜的創(chuàng)作任務(wù)。可以說,訓(xùn)練數(shù)據(jù)是生成式人工智能創(chuàng)作作品的基礎(chǔ)和前置條件,它貫穿于人工智能創(chuàng)作的全過程,為其提供了源源不斷的創(chuàng)作靈感和動力。其具體的作用流程如下所示。第一,通過各種渠道獲取、收集數(shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理、標(biāo)注,形成訓(xùn)練集;第二,輸入訓(xùn)練數(shù)據(jù),建立初步模型以便分析,并和算法相互配合,根據(jù)訓(xùn)練數(shù)據(jù)中特征向量和類別標(biāo)簽等標(biāo)注內(nèi)容的有無,而采用不同的算法;第三,在學(xué)習(xí)環(huán)節(jié),借助計(jì)算機(jī)技術(shù)對訓(xùn)練數(shù)據(jù)進(jìn)行分析和學(xué)習(xí),以此來優(yōu)化算法。二、生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)風(fēng)險(xiǎn)(一)輸入階段的侵權(quán)風(fēng)險(xiǎn)在輸入階段,生成式人工智能不斷收集數(shù)據(jù),但在收集數(shù)據(jù)的多樣化的形式和手段上,很容易出現(xiàn)一些侵犯著作權(quán)的行為。如下所示。第一,爬蟲協(xié)議。也稱為網(wǎng)絡(luò)爬蟲協(xié)議或機(jī)器人協(xié)議,是一種規(guī)范或約定,用于指導(dǎo)網(wǎng)絡(luò)爬蟲(也稱為網(wǎng)絡(luò)蜘蛛、網(wǎng)絡(luò)機(jī)器人或網(wǎng)絡(luò)爬蟲程序)在抓取網(wǎng)頁數(shù)據(jù)時(shí)應(yīng)該遵循的行為準(zhǔn)則。這些協(xié)議通常以文本文件的形式存儲在網(wǎng)站的根目錄下,名為robots.txt。通過爬蟲協(xié)議,網(wǎng)站管理員可以指定哪些頁面可以被爬取,哪些頁面應(yīng)該被排除在爬取范圍之外。爬蟲協(xié)議是網(wǎng)站所有者和網(wǎng)絡(luò)爬蟲之間的一種合作協(xié)議,它有助于維護(hù)網(wǎng)絡(luò)生態(tài)的健康發(fā)展,同時(shí)確保爬蟲能夠有效地獲取所需的信息,而不會對網(wǎng)站造成侵權(quán)行為。第二,數(shù)據(jù)庫抓取作品素材。當(dāng)前,我國在數(shù)據(jù)庫著作權(quán)保護(hù)方面存在法律體系的不足,尚未有完善的法規(guī)對其提供專門保護(hù)。鑒于人工智能開發(fā)者在技術(shù)層面所擁有的優(yōu)勢,他們能夠輕易獲取并利用數(shù)據(jù)庫資源。為了推進(jìn)人工智能算法的訓(xùn)練,一些開發(fā)者可能會采取非法手段,破解數(shù)據(jù)庫的技術(shù)保護(hù)措施,進(jìn)而獲取大量數(shù)據(jù)。一旦他們成功繞過了權(quán)利人所設(shè)置的技術(shù)限制,人工智能開發(fā)公司有可能會將數(shù)據(jù)庫內(nèi)的數(shù)據(jù)擅自復(fù)制并存儲至自己的服務(wù)器,或者直接在原始數(shù)據(jù)庫上運(yùn)行其算法和模型。這兩種行為都構(gòu)成對數(shù)據(jù)庫所有者權(quán)利的侵犯,尤其是前者還侵犯了作者的復(fù)制權(quán)參見參見劉友華,魏遠(yuǎn)山.機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)問題及其解決[J].華東政法大學(xué)學(xué)報(bào),2019,22(02):68-79.第三,強(qiáng)制用戶許可協(xié)議(EULA)。全稱為End-UserLicenseAgreement,是一種法律協(xié)議,規(guī)定了軟件或應(yīng)用程序的最終用戶(End-User)在使用該軟件時(shí)必須遵守的條款和條件。EULA通常由軟件開發(fā)者、發(fā)行商或版權(quán)所有者制定,并要求用戶在安裝或使用軟件之前必須同意其中的條款。然而,人工智能研發(fā)公司通過與用戶簽訂強(qiáng)制許可協(xié)議的方式,涉嫌變相剝奪著作權(quán)人的合法權(quán)益,并從中謀取利益。第四,數(shù)據(jù)時(shí)代的背景下更容易面臨侵權(quán)風(fēng)險(xiǎn)。數(shù)字化但非電子數(shù)據(jù)有兩種形式:一種是正規(guī)渠道得到非電子出版物后將其數(shù)字化;另一種是非正規(guī)渠道獲取非電子出版物進(jìn)行數(shù)字化。大量數(shù)字化的非電子數(shù)據(jù)能夠更快速地傳播、整合,并完整地呈現(xiàn)在其他電子設(shè)備上。在以合法方式獲得非電子出版物后進(jìn)行數(shù)字化的過程中,可能會涉及對作品的復(fù)制等行為,根據(jù)我國《著作權(quán)法》第53條第一款的規(guī)定,這些情況構(gòu)成對復(fù)制權(quán)的侵犯。而以非正規(guī)渠道獲取非電子出版物并數(shù)字化的情形一定是侵權(quán)行為,與著作權(quán)法相悖。除此之外,由于數(shù)字化時(shí)代帶來的快速傳播,侵權(quán)源頭難以追溯,維權(quán)成本也大大提高,人工智能研發(fā)公司會更加大膽,使得侵權(quán)風(fēng)險(xiǎn)進(jìn)一步增加。(二)訓(xùn)練階段的侵權(quán)風(fēng)險(xiǎn)生成式人工智能訓(xùn)練數(shù)據(jù)在訓(xùn)練階段可能會涉及到著作權(quán)侵權(quán)的風(fēng)險(xiǎn),這些風(fēng)險(xiǎn)可能源于數(shù)據(jù)的使用和存儲等方面。在所有的機(jī)器學(xué)習(xí)里面都需要用到數(shù)據(jù),難免會對數(shù)據(jù)進(jìn)行復(fù)制、翻譯、改編、匯編等操作,這些對數(shù)據(jù)的使用是否構(gòu)成著作權(quán)侵犯需要更多條件進(jìn)行分析。所有這些行為都是在獲取訓(xùn)練數(shù)據(jù)的基礎(chǔ)上展開的。訓(xùn)練數(shù)據(jù)中的圖片、文字、視頻等內(nèi)容很可能包含了受到著作權(quán)保護(hù)的作品,例如他人拍攝的照片、創(chuàng)作的文章、錄制的音樂等,如果以非法方式獲得數(shù)據(jù),這些內(nèi)容的使用沒有得到原著作權(quán)人的許可,那么就可能構(gòu)成對原著作權(quán)人的侵權(quán)行為,機(jī)器學(xué)習(xí)對數(shù)據(jù)的使用當(dāng)然構(gòu)成侵權(quán)。訓(xùn)練過程中,對于數(shù)據(jù)的使用可以具體區(qū)分為對原作品的復(fù)制、修改和演繹。在機(jī)器學(xué)習(xí)過程中,我們必須仔細(xì)甄別復(fù)制行為是否侵犯了著作權(quán)。對于復(fù)制和臨時(shí)復(fù)制,著作權(quán)法有著截然不同的處理態(tài)度。由于臨時(shí)復(fù)制并未展現(xiàn)出著作權(quán)法所定義的復(fù)制的核心特點(diǎn),因此,將其納入復(fù)制權(quán)的范疇會過度擴(kuò)張著作權(quán)人的權(quán)利范圍,進(jìn)而對他人獲取信息的自由構(gòu)成不必要的限制。正因如此,著作權(quán)法并未將臨時(shí)復(fù)制視為其法律框架內(nèi)的復(fù)制行為。換句話說,在機(jī)器學(xué)習(xí)的實(shí)踐中,臨時(shí)復(fù)制并不會觸發(fā)復(fù)制權(quán)的侵權(quán)行為,但非臨時(shí)復(fù)制若滿足了侵犯復(fù)制權(quán)的條件,則有可能構(gòu)成侵權(quán)。改編權(quán),指的是對原有作品進(jìn)行修改并創(chuàng)作出新的、具有獨(dú)創(chuàng)性作品的權(quán)利。改編權(quán)需要滿足兩大核心要素:首先是必須在行為層面上充分利用了原作品的獨(dú)特創(chuàng)意表達(dá);其次,在結(jié)果上必須產(chǎn)生了一部全新且具有獨(dú)創(chuàng)性的作品。對于生成式人工智能而言,在判斷是否侵犯了原作者的改編權(quán)時(shí),關(guān)鍵在于評估其對原作品表達(dá)的“使用深度”。也就是說,最終生成物融合了原作品和具有很大程度的獨(dú)特創(chuàng)意表達(dá),可以認(rèn)為它是對原作品進(jìn)行了改編。在進(jìn)行改編權(quán)的侵權(quán)分析時(shí),我們需要從機(jī)器學(xué)習(xí)的具體方式出發(fā)。根據(jù)機(jī)器學(xué)習(xí)在素材的輸入和抓取上是否具有特定性和排他性,我們可以將機(jī)器學(xué)習(xí)大致劃分為一般機(jī)器學(xué)習(xí)和特殊機(jī)器學(xué)習(xí)兩大類別。通常而言,一般機(jī)器學(xué)習(xí)指的是在已收集的龐大信息庫中進(jìn)行篩選和分析,根據(jù)使用者的指令與數(shù)據(jù)進(jìn)行比對生成,而非直接在某個(gè)特定藍(lán)本上進(jìn)行修改。因此,其產(chǎn)出的作品風(fēng)格與外觀多樣且不可預(yù)測,使用者難以對其進(jìn)行精確控制。由于這類作品往往具備較強(qiáng)的創(chuàng)新性,即使被歸類為改編作品,也由于缺乏明確的比對對象而難以判定。所以,一般機(jī)器學(xué)習(xí)對改編權(quán)的影響微乎其微,除非生成物中明顯保留了某些原作品的核心獨(dú)創(chuàng)性表達(dá)。特殊機(jī)器學(xué)習(xí)是一種利用專門素材庫進(jìn)行訓(xùn)練的方法,如加州大學(xué)教授戴維·柯普研發(fā)的EMI系統(tǒng)。該系統(tǒng)專注于以巴赫的音樂作品為學(xué)習(xí)對象,深度模仿其風(fēng)格進(jìn)行音樂創(chuàng)作。在某次音樂節(jié)上,其創(chuàng)作的作品讓超過八成的聽眾誤以為是巴赫的真跡。但由于巴赫作品已進(jìn)入公共版權(quán)領(lǐng)域,因此并未引發(fā)版權(quán)爭議。然而,假若巴赫尚在人世,我們則需根據(jù)該程序所生成的作品中巴赫風(fēng)格的顯著程度,及其對巴赫原作市場可能產(chǎn)生的替代效應(yīng),來評估其是否侵犯了巴赫的改編權(quán)。作品的獨(dú)創(chuàng)性表達(dá)是作者思想的獨(dú)特展現(xiàn)。特殊機(jī)器學(xué)習(xí)的核心挑戰(zhàn)在于,如何在不直接復(fù)制原作獨(dú)創(chuàng)性表達(dá)的前提下,盡可能深入地理解和再現(xiàn)作者的思想精髓,并以新的方式進(jìn)行表達(dá)。然而,由于作者的思想和表達(dá)往往緊密相連,難以完全割裂,加之特殊機(jī)器學(xué)習(xí)受限于其訓(xùn)練素材的范圍和特性,因此其生成的作品難免會在一定程度上受到原作表達(dá)的束縛。這導(dǎo)致此類作品很可能因與原作過于相似而具備替代性,從而存在侵犯原作者改編權(quán)的風(fēng)險(xiǎn)參見參見詹愛嵐,田一農(nóng).生成式人工智能機(jī)器學(xué)習(xí)中的著作權(quán)風(fēng)險(xiǎn)及其化解路徑[J].電子知識產(chǎn)權(quán),2023,(11):4-14.除此之外,存儲訓(xùn)練數(shù)據(jù)的階段也存在風(fēng)險(xiǎn)。即使生成式人工智能的使用者對原作品的使用已經(jīng)獲得了許可,但是如果他們沒有正確地管理這些數(shù)據(jù),比如未能對存儲數(shù)據(jù)進(jìn)行適當(dāng)?shù)募用芎驮L問控制,就可能會導(dǎo)致數(shù)據(jù)的泄露或不當(dāng)使用,從而對原著作權(quán)人的權(quán)益造成損害。(三)輸出階段的侵權(quán)風(fēng)險(xiǎn)在侵權(quán)爭議中,輸出階段起著至關(guān)重要的作用,但對于其輸出內(nèi)容究竟是否侵犯了他人權(quán)益,仍需進(jìn)行深入分析。算法創(chuàng)作所呈現(xiàn)的輸出成果,其實(shí)質(zhì)并非預(yù)先定義的“作品”,而是一種特殊的數(shù)據(jù)表達(dá)。這種數(shù)據(jù)表達(dá)之所以采用類似“作品”的形式,主要是為了更好地滿足商業(yè)化利用的需求。因此,在侵權(quán)問題的考量上,我們應(yīng)將關(guān)注點(diǎn)放在這些數(shù)據(jù)或數(shù)據(jù)集合本身,這也與《著作權(quán)法》第15條所規(guī)定的保護(hù)范圍相契合。鑒于上述情況,部分學(xué)者提出了“表達(dá)性使用”與“非表達(dá)性使用”的概念區(qū)分。其中,非表達(dá)性使用指的是單純對事實(shí)信息的利用,不涉及任何獨(dú)創(chuàng)性表達(dá);而表達(dá)性使用則是對信息進(jìn)行具有獨(dú)創(chuàng)性的表達(dá)。這種區(qū)分的意義在于,它為我們提供了一個(gè)判斷標(biāo)準(zhǔn),用以衡量某種使用行為是否侵犯了權(quán)利人的合法權(quán)益。這也是三步檢驗(yàn)法的第一步,只有在確定了使用行為的性質(zhì)之后,我們才能進(jìn)一步探討侵權(quán)判斷規(guī)則的適用問題。在數(shù)字化時(shí)代背景下,“接觸+實(shí)質(zhì)性相似”這一規(guī)則煥發(fā)出新的生命力。前文已提及,對于人類作者創(chuàng)作影響的詳盡探究或許難以實(shí)現(xiàn),然而,針對人工智能學(xué)習(xí)模型,我們只需深究其訓(xùn)練語料庫,便能得出有力論斷。當(dāng)這些語料中涵蓋了被訴侵權(quán)的復(fù)制作品時(shí),無疑為被告訪問原告作品提供了確鑿證據(jù),從而輕松滿足“接觸”的判定標(biāo)準(zhǔn)。至于“實(shí)質(zhì)性相似”的界定,則呈現(xiàn)出多種可能性。誠如漢德法官所言,“思想與表達(dá)”二者間的界限難以一概而論,需在具體案例中逐一剖析定奪。此外,輸出內(nèi)容也可能引發(fā)侵權(quán)問題。一些用戶可能會將生成式人工智能輸出的內(nèi)容直接用于商業(yè)用途或公開發(fā)布,而未經(jīng)過充分的著作權(quán)審查。這種行為很可能導(dǎo)致對原著作權(quán)人的侵權(quán),因?yàn)樯傻膬?nèi)容可能包含了受著作權(quán)保護(hù)的作品元素。第三章生成式人工智能當(dāng)前存在的困境一、人工智能與著作權(quán)人、公眾的利益沖突如果放任生成式人工智能對受著作權(quán)保護(hù)的作品進(jìn)行無限制的使用和復(fù)制,首先可能會損害著作權(quán)人的創(chuàng)作積極性,進(jìn)而影響整個(gè)社會的文化創(chuàng)新和知識產(chǎn)出。著作權(quán)人的權(quán)益保護(hù)是知識產(chǎn)權(quán)法律體系的核心之一。生成式人工智能在訓(xùn)練和學(xué)習(xí)過程中,往往需要大量使用已存在的作品,這些作品可能包括文學(xué)作品、藝術(shù)作品、科學(xué)論文、音樂、照片等,它們都是著作權(quán)人的智力成果,受到法律的保護(hù)。如果生成式人工智能未經(jīng)著作權(quán)人授權(quán)就使用了這些作品,那么這種使用行為就可能構(gòu)成對著作權(quán)人權(quán)益的侵犯。即使這種使用是為了機(jī)器學(xué)習(xí)的目的,著作權(quán)法通常也要求事先獲得著作權(quán)人的許可。當(dāng)生成式人工智能基于已有作品創(chuàng)作出新的衍生作品時(shí),這個(gè)新作品的著作權(quán)歸屬也可能成為一個(gè)爭議點(diǎn)。著作權(quán)法通常規(guī)定衍生作品的著作權(quán)歸屬于衍生作品的作者,但生成式人工智能的介入使得這一規(guī)定變得復(fù)雜。公眾有獲取信息和分享知識的需求,這是社會進(jìn)步和文化傳承的基礎(chǔ),公眾通常期望能夠自由地獲取和使用信息,包括通過生成式人工智能生成的內(nèi)容。從社會整體利益的角度出發(fā),作品受到法律保護(hù)并成為財(cái)產(chǎn),這主要?dú)w因于公共政策對“推動創(chuàng)新與文化繁盛”的需求。借助大數(shù)據(jù)和算法的力量,生成式人工智能在創(chuàng)作方面展現(xiàn)出了超越人類的實(shí)力,其不僅能顯著提升創(chuàng)作效率、降低創(chuàng)作的難度,還能讓更多民眾參與到創(chuàng)作過程中,進(jìn)而對社會主義文化和科學(xué)事業(yè)的蓬勃發(fā)展產(chǎn)生積極影響參見參見顧男飛,方舟之.ChatGPT等生成式人工智能使用作品的合理邊界與侵權(quán)規(guī)制[J].數(shù)字圖書館論壇,2023,19(07):1-8.如果生成式人工智能的訓(xùn)練數(shù)據(jù)和使用受到嚴(yán)格的著作權(quán)保護(hù),那么公眾可能無法自由地訪問和使用這些由人工智能生成的內(nèi)容。這可能導(dǎo)致信息的流通受阻,影響公眾的知識獲取。另一方面,對于生成式人工智能來說,在嚴(yán)格的著作權(quán)保護(hù)下可能無法充分學(xué)習(xí)和借鑒已有的文化成果,從而影響其創(chuàng)新能力和輸出質(zhì)量,又可能限制公眾對新穎、有創(chuàng)意內(nèi)容的接觸和欣賞。對于生成式人工智能的開發(fā)者來說,授權(quán)許可和法定許可制度的高昂成本并不適合大規(guī)模的作品授權(quán),同時(shí)也違背了市場公平競爭的原則。大型企業(yè)可以依靠自身業(yè)務(wù)來收集現(xiàn)有作品,或者通過提供服務(wù)來獲得作品授權(quán),從而降低著作權(quán)侵權(quán)的風(fēng)險(xiǎn)。然而,中小企業(yè)在資金方面的匱乏,使其難以承擔(dān)作品授權(quán)的費(fèi)用,同時(shí)也無法通過提供服務(wù)來換取授權(quán)。這種現(xiàn)狀加劇了大型企業(yè)與中小企業(yè)之間的技術(shù)鴻溝,限制了市場競爭的公平性,甚至可能誘發(fā)中小企業(yè)采取非法手段獲取訓(xùn)練所需作品,最終導(dǎo)致雙方利益受損。二、著作權(quán)保護(hù)對技術(shù)發(fā)展的羈束生成式人工智能作為一種前沿技術(shù),其創(chuàng)新和發(fā)展對于推動科技進(jìn)步和經(jīng)濟(jì)增長具有重要意義。然而,著作權(quán)保護(hù)可能會對這種創(chuàng)新構(gòu)成一定的限制。生成式人工智能需要大量數(shù)據(jù)來進(jìn)行訓(xùn)練和學(xué)習(xí),如果這些數(shù)據(jù)受到嚴(yán)格的著作權(quán)保護(hù),那么人工智能開發(fā)者可能無法獲取足夠的數(shù)據(jù)來支持其技術(shù)的創(chuàng)新和發(fā)展。同時(shí),如果放任生成式人工智能對著作權(quán)作品的隨意使用,可能會引發(fā)大量的著作權(quán)糾紛和法律訴訟,給技術(shù)創(chuàng)新帶來不必要的法律風(fēng)險(xiǎn)和成本負(fù)擔(dān)。著作權(quán)法律的不確定性也可能對生成式人工智能的創(chuàng)新產(chǎn)生負(fù)面影響。由于法律規(guī)定的不清晰或滯后,開發(fā)者可能面臨無法預(yù)見的法律風(fēng)險(xiǎn),這可能會抑制他們進(jìn)行技術(shù)創(chuàng)新的積極性。法律的滯后性與迅速發(fā)展的機(jī)器學(xué)習(xí)技術(shù)日益加劇了《著作權(quán)法》的不確定性??萍嫉娜招略庐愖屃⒎üぷ飨萑肜Ь?。鑒于科技發(fā)展趨向的難以捉摸,如何制定相適應(yīng)的法律條文顯得尤為棘手。從靜電復(fù)印機(jī)到電子拷貝的技術(shù)轉(zhuǎn)變,以及從傳統(tǒng)出版物流到P2P程序互聯(lián)的作品流通方式革新,無不凸顯了立法對新技術(shù)影響的滯后認(rèn)知。法律的相對穩(wěn)定性和修改程序的復(fù)雜性進(jìn)一步拉大了法律與科技之間的裂痕。除此之外,版權(quán)產(chǎn)業(yè)對科技影響的評估不足也是導(dǎo)致其應(yīng)對遲緩的重要原因。在侵權(quán)行為尚未對產(chǎn)業(yè)利益相關(guān)方造成直接影響時(shí),版權(quán)產(chǎn)業(yè)常持寬容態(tài)度。然而,一旦威脅迫在眉睫,侵權(quán)行為的惡劣影響便如脫韁野馬,難以收束。此時(shí),即便版權(quán)產(chǎn)業(yè)求助于法律救濟(jì),也因技術(shù)和法律間的“灰色地帶”而使得法律介入變得復(fù)雜且低效。三、已有的合理使用制度難以適用于人工智能技術(shù)《中華人民共和國著作權(quán)法》(以下簡稱《著作權(quán)法》)第24條第十三款新增了合理使用的兜底條款,在原《著作權(quán)法》十二項(xiàng)合理使用的基礎(chǔ)上新增了“法律、行政法規(guī)規(guī)定的其他情形”。從法律規(guī)定的角度來看,為訓(xùn)練大模型挖掘使用作品數(shù)據(jù)的行為不屬于合理使用范疇。其難以解釋入兜底條款之中,也無法適用關(guān)于研發(fā)合理使用的第24條第1款的第1項(xiàng)和第6項(xiàng)第1項(xiàng)是將目的限制為“欣賞、學(xué)習(xí)、研究”,第六項(xiàng)則是將主體限制為“課堂教學(xué)或科學(xué)研究人員”。第1項(xiàng)是將目的限制為“欣賞、學(xué)習(xí)、研究”,第六項(xiàng)則是將主體限制為“課堂教學(xué)或科學(xué)研究人員”。對于第1項(xiàng)而言,大模型訓(xùn)練不屬于個(gè)人行為參見鄭飛,夏晨斌.生成式人工智能的著作權(quán)困境與制度應(yīng)對——以ChatGPT和文心一言為例[J].科技與法律(中英文),2023,(05):86-96.,對作品的合理使用,前提是基于“欣賞”、“學(xué)習(xí)”和“研究”為目的。但生成式人工智能對作品的使用主要被用于輸出滿足人類需求的輸出物,而并非在于學(xué)習(xí)研究。由此看來,對于人工智能使用作品的行為都難以被參見鄭飛,夏晨斌.生成式人工智能的著作權(quán)困境與制度應(yīng)對——以ChatGPT和文心一言為例[J].科技與法律(中英文),2023,(05):86-96.對于第6項(xiàng)而言,主體不屬于大專院校、科研院所,在現(xiàn)實(shí)中科研目的條款的適用也只對非商業(yè)目的的行為有效,而營利性的大型企業(yè)才是大多數(shù)人工智能的開發(fā)單位,這些企業(yè)完成項(xiàng)目的開發(fā)也會投入到商業(yè)活動中,訓(xùn)練所需使用的數(shù)據(jù)量也顯著不滿足少量要求。對于兜底條款而言,將原本封閉式的合理使用規(guī)則改為半開放式,看起來是將人工智能創(chuàng)作加入合理使用范圍。但由于生成式人工智能需要大規(guī)模與高頻率地利用作品,難以將其直接認(rèn)定為“特殊情形”,目前也尚未有與人工智能合理使用相關(guān)的法律法規(guī)。盡管司法裁決在合理使用的認(rèn)定上展現(xiàn)出一定的靈活性,但合理使用的法律闡釋依然必須恪守“三步檢驗(yàn)法”的嚴(yán)格界限。從法律實(shí)踐的角度來看,“三步檢驗(yàn)法”首先要求其在“特別且限定的情形”下適用,其次要確保使用行為落在“常規(guī)使用的范圍”內(nèi),最后必須保證“不致使著作權(quán)人的合法權(quán)益受到不合理損害”。不過,這一制度因高度依賴司法判斷,使得其運(yùn)用效果往往充滿變數(shù),標(biāo)準(zhǔn)模糊的問題亟待解決。特別是在我國著作權(quán)法體系以“作者中心主義”為核心的背景下,生成式人工智能對作品的使用情況難以完全契合“三步檢驗(yàn)法”的框架,這在實(shí)際判斷合理使用時(shí)形成了顯著的挑戰(zhàn)。

第四章生成式人工智能著作權(quán)侵權(quán)困境的制度因應(yīng)一、國外經(jīng)驗(yàn)借鑒(一)歐盟的文本與數(shù)據(jù)挖掘的例外規(guī)定為了推動歐盟版權(quán)規(guī)則與數(shù)字環(huán)境的同步演進(jìn),歐盟委員會在數(shù)字單一市場戰(zhàn)略的框架下,于2016年9月14日制定了一項(xiàng)立法提案,旨在實(shí)現(xiàn)歐盟版權(quán)法的現(xiàn)代化。該提案涵蓋了多項(xiàng)重要內(nèi)容,尤為引人注目的是《數(shù)字化單一市場版權(quán)指令草案》中提出的文本與數(shù)據(jù)挖掘的例外規(guī)定。該草案第3條第1款明確指出,為了科學(xué)研究的需要,歐盟各成員國應(yīng)規(guī)定允許研究機(jī)構(gòu)在文本與數(shù)據(jù)挖掘過程中,對其合法獲取的受版權(quán)保護(hù)的作品及數(shù)據(jù)庫內(nèi)容進(jìn)行復(fù)制與提取。同時(shí),該草案的第3條第2、3、4款還進(jìn)一步闡明了幾點(diǎn)重要內(nèi)容:任何試圖抵消第1款中所規(guī)定的例外情形的合同條款均不具備法律效力;權(quán)利人應(yīng)當(dāng)被允許為保障其作品及數(shù)據(jù)庫的安全性和完整性而采取必要的防護(hù)措施,但這些措施的實(shí)施范圍不得超過實(shí)現(xiàn)此目的所必需的程度;成員國應(yīng)當(dāng)積極促進(jìn)權(quán)利人與研究機(jī)構(gòu)就第3款中提及的保護(hù)措施進(jìn)行協(xié)商,共同確定最佳執(zhí)行方案。經(jīng)過長達(dá)兩年多的深入討論,2019年歐盟各成員國終于就文本與數(shù)據(jù)挖掘例外的具體規(guī)定取得了共識,除了原草案中針對科學(xué)研究目的的強(qiáng)制性例外,各成員國還一致同意另外增設(shè)一項(xiàng)普遍適用的文本與數(shù)據(jù)挖掘例外。這一新規(guī)定旨在進(jìn)一步推動數(shù)據(jù)分析和人工智能領(lǐng)域的蓬勃發(fā)展,為所有相關(guān)主體提供更廣闊的操作空間與法律支持。在正式文本中,第1項(xiàng)(對應(yīng)于第3條)確立了為科學(xué)研究目的的強(qiáng)制性例外。這一規(guī)定禁止權(quán)利人聲明對其作品或數(shù)據(jù)庫的專有使用權(quán),其內(nèi)容與原草案第3條的核心思想相吻合,但在適用對象上有所拓寬。除了科研機(jī)構(gòu),公共圖書館、博物館、檔案館以及電影、音頻等文化遺產(chǎn)機(jī)構(gòu)也被納入其中。此外,正式條文還新增了一項(xiàng)條款,允許相關(guān)機(jī)構(gòu)為科學(xué)研究之需保留作品和數(shù)據(jù)庫資料的復(fù)制件,但必須以“適當(dāng)?shù)陌踩墑e”加以存儲。第二項(xiàng)(對應(yīng)于第4條)則構(gòu)成了一般的選擇性例外。根據(jù)這一規(guī)定,所有主體均可基于文本和數(shù)據(jù)挖掘的目的,對其合法獲取的作品或數(shù)據(jù)庫進(jìn)行復(fù)制和提取。然而,與此同時(shí),權(quán)利人也享有通過適當(dāng)方式明確保留對其作品或數(shù)據(jù)庫使用權(quán)的權(quán)利。第4條所規(guī)定的一般例外并未對適用主體和目的設(shè)限,這意味著即便是出于商業(yè)目的的文本與數(shù)據(jù)挖掘行為,也能在合法范圍內(nèi)使用版權(quán)作品和數(shù)據(jù)庫資料,從而免除了侵權(quán)訴訟的顧慮。盡管權(quán)利人可以預(yù)先對基于文本與數(shù)據(jù)挖掘的復(fù)制和提取行為設(shè)置保留限制,但相較于原草案對研究機(jī)構(gòu)和科研目的的限制,《數(shù)字化單一市場版權(quán)指令》第4條無疑在更大程度上激發(fā)了商業(yè)性研究主體的積極性和創(chuàng)造力,為歐盟人工智能技術(shù)的發(fā)展提供了制度層面的有力支持。為促進(jìn)不同經(jīng)濟(jì)參與者之間的數(shù)據(jù)共享,2022年6月23日,歐盟《數(shù)據(jù)治理法》正式生效。相比于2018年公布的《通用數(shù)據(jù)保護(hù)條例》對個(gè)人數(shù)據(jù)的嚴(yán)格保護(hù),該法將數(shù)據(jù)視為一種可供流通的財(cái)產(chǎn)加以規(guī)制,其中企業(yè)或者個(gè)人對他人數(shù)據(jù)進(jìn)行使用必須通過數(shù)據(jù)中介服務(wù)提供者加以實(shí)現(xiàn)。該法規(guī)定:明確數(shù)據(jù)共享服務(wù)商業(yè)務(wù)范圍并實(shí)行登記制,規(guī)定從事數(shù)據(jù)持有者和潛在數(shù)據(jù)用戶之間中介服務(wù)或者數(shù)據(jù)合作社服務(wù)的,為該法規(guī)定的數(shù)據(jù)共享服務(wù)商,并要求其向主管部門提交登記。同時(shí)數(shù)據(jù)服務(wù)商要確保服務(wù)的程序和價(jià)格公平透明和非歧視性,可見歐盟立法態(tài)度逐漸開始兼顧保護(hù)與流通兩種屬性。人工智能企業(yè)可以在數(shù)據(jù)中介機(jī)構(gòu)上通過數(shù)據(jù)交易使用他人數(shù)據(jù)或是素材且不必經(jīng)過他人同意,同時(shí)數(shù)據(jù)提供者又能獲取合理的經(jīng)濟(jì)補(bǔ)償,形式上符合我國法定許可制度的模式。(二)日本關(guān)于文本和數(shù)據(jù)的著作權(quán)法修訂早在2014年,日本便在傳統(tǒng)出版物的版權(quán)制度之上,進(jìn)一步確立了數(shù)字版權(quán)的地位。隨后,在2018年,為適應(yīng)新的時(shí)代發(fā)展需求,日本政府著手對《著作權(quán)法》進(jìn)行了重要修訂,顯著放寬了著作權(quán)使用的相關(guān)限制。此次修訂在合理使用規(guī)則上的調(diào)整主要體現(xiàn)在以下四個(gè)方面:(1)明確了互聯(lián)網(wǎng)企業(yè)可以在未經(jīng)原作者授權(quán)的情況下使用其作品;(2)針對教育信息化領(lǐng)域制定了具體的限制性規(guī)定;(3)通過立法手段確保了有視力障礙的群體能夠平等參與文化生活;(4)為推動檔案數(shù)字化的進(jìn)程,對著作權(quán)人的某些權(quán)利進(jìn)行了必要的限制。與前期的著作權(quán)保護(hù)制度相比,此次修改顯著調(diào)整了保護(hù)傾向,更好地平衡了各方利益。日本在文本和數(shù)據(jù)挖掘方面的特點(diǎn)十分顯著。自2009年起,該國便通過修訂著作權(quán)法,開始允許進(jìn)行文本和數(shù)據(jù)挖掘。新設(shè)的著作權(quán)法第47條第7條明確規(guī)定,在電子計(jì)算機(jī)信息解讀的基礎(chǔ)上,于必要范圍內(nèi)可將作品記錄或改寫于存儲媒介上,但數(shù)據(jù)庫不在此列。這一條款的引入,使得日本在高度信息化的社會中,特定條件下允許存儲媒介對作品進(jìn)行記錄和改寫。針對文字和數(shù)據(jù)在傳播過程中可能發(fā)生的著作權(quán)侵權(quán)問題,日本法律明確規(guī)定,作為分析對象的數(shù)據(jù)等若屬于作品范疇,其收集、記錄和分析行為均不構(gòu)成對著作權(quán)的侵犯。為適應(yīng)數(shù)據(jù)時(shí)代日新月異的技術(shù)革新,并確保法律能夠靈活應(yīng)對環(huán)境變化,日本于2018年再次對著作權(quán)法進(jìn)行了修訂,修訂后的規(guī)定自2019年1月起生效。修訂后的著作權(quán)法中關(guān)于文字和數(shù)據(jù)的第30條第4項(xiàng)規(guī)定:“若使用目的并非享受作品中表達(dá)的思想或情感,則在必要范圍內(nèi)均可使用。”此外,原著作權(quán)法第47條第4條至第9條的內(nèi)容被刪除,取而代之的是修改后的第47條第4條,該條款將相關(guān)規(guī)定合并為關(guān)于電子計(jì)算機(jī)作品使用的統(tǒng)一規(guī)定。(三)美國的轉(zhuǎn)換性使用規(guī)則美國的合理使用標(biāo)準(zhǔn)可以追溯到1841年,最初出現(xiàn)在法院判例中,并在1976年《版權(quán)法》頒布后得到確立。其中,著名的107條確立了“四要素”分析模式,用于判斷是否構(gòu)成合理使用,包括使用目的與特性、原版權(quán)作品性質(zhì)、使用部分與原作品比例及關(guān)系、以及使用對原版權(quán)作品潛在市場或價(jià)值的影響。隨著新技術(shù)的涌現(xiàn),合理使用制度面臨新的挑戰(zhàn)參見參見華劼.合理使用制度運(yùn)用于人工智能創(chuàng)作的兩難及出路[J].電子知識產(chǎn)權(quán),2019,(04):29-39.為適應(yīng)社會實(shí)踐的需要,出現(xiàn)了“轉(zhuǎn)換性使用”概念。轉(zhuǎn)換性使用理論源于Leval法官在《哈佛法律評論》上發(fā)表的文章,強(qiáng)調(diào)在判斷合理使用時(shí)需要平衡版權(quán)人利益與公眾獲得和使用作品的社會公共利益。Leval法官認(rèn)為,創(chuàng)新地使用他人作品是被允許的,這一理解基于合理使用標(biāo)準(zhǔn)中的“使用的目的與性質(zhì)”要素。他指出,轉(zhuǎn)換性使用應(yīng)具備兩個(gè)基本要素:使用目的與原作品不同,且具有創(chuàng)造意義,為原作品增添新價(jià)值。盡管有學(xué)者對Leval法官的理論提出批評,認(rèn)為其過于主觀和抽象,缺乏明確性,但Leval法官的論述成為轉(zhuǎn)換性使用規(guī)則的理論開端。隨著科技進(jìn)步,合理使用規(guī)則面臨挑戰(zhàn),轉(zhuǎn)換性使用規(guī)則的討論日益熱烈,為司法實(shí)踐提供了理論基礎(chǔ)。轉(zhuǎn)換性使用規(guī)則的確立意味著著作權(quán)保護(hù)從版權(quán)人向使用人傾斜,更加重視社會公共利益。隨著司法實(shí)踐的完善,轉(zhuǎn)換性使用的類型逐步明晰,包括內(nèi)容、目的和功能三種類型。根據(jù)是否進(jìn)行創(chuàng)作行為作為判斷標(biāo)準(zhǔn),可以將轉(zhuǎn)換性使用分為創(chuàng)作型和功能型。在新技術(shù)背景下,對作品的不同利用方式推動了轉(zhuǎn)換性使用規(guī)則的發(fā)展。二、設(shè)定人工智能訓(xùn)練學(xué)習(xí)的法定許可為推動技術(shù)產(chǎn)業(yè)的持續(xù)繁榮,一些國家和地區(qū)已經(jīng)構(gòu)建了專門的制度框架,用以解決機(jī)器使用作品所引發(fā)的著作權(quán)難題,并據(jù)此深入探討訓(xùn)練數(shù)據(jù)可能涉及的著作權(quán)議題及其與現(xiàn)行法規(guī)的協(xié)調(diào)問題。較之下,我國在立法層面采取了更為審慎的態(tài)度,盡管學(xué)術(shù)界已就人工智能的著作權(quán)議題展開熱烈討論,部分學(xué)者亦就機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)的使用性質(zhì)進(jìn)行深入剖析,但最新著作權(quán)修法仍未能將此類關(guān)切在法律層面上予以體現(xiàn)。在全球紛紛構(gòu)建相應(yīng)制度的趨勢下,我國也應(yīng)該及時(shí)調(diào)整以適應(yīng)時(shí)代發(fā)展的需求。法定許可是指在法律規(guī)定的條件下,可以直接使用受著作權(quán)保護(hù)的作品,使用者無需事先獲得著作權(quán)人的許可,但需向著作權(quán)人支付報(bào)酬的一種制度。在人工智能領(lǐng)域,設(shè)定法定許可的目的是為了促進(jìn)人工智能技術(shù)的研發(fā)與應(yīng)用,同時(shí)保障著作權(quán)人的合法權(quán)益。支持該理論的學(xué)者對于該制度的初步構(gòu)想是,建立一個(gè)類似于歐盟在《數(shù)據(jù)治理法》中設(shè)想的“個(gè)人數(shù)據(jù)共享中介機(jī)構(gòu)”,要求使用主體將其欲使用的作品進(jìn)行登記付費(fèi),讓企業(yè)與個(gè)人在此機(jī)構(gòu)的指引和幫助下合理使用他人享有著作權(quán)的作品數(shù)據(jù)。使用者在使用受著作權(quán)保護(hù)的作品前,向相關(guān)機(jī)構(gòu)進(jìn)行登記,并按照規(guī)定的標(biāo)準(zhǔn)支付報(bào)酬,這樣可以保障著作權(quán)人的知情權(quán)與獲酬權(quán)。機(jī)器學(xué)習(xí)所需要的作品是一個(gè)龐大的數(shù)量,每一個(gè)作品都代表一位著作權(quán)人,如果單憑企業(yè)去進(jìn)行協(xié)商聯(lián)絡(luò),帶來的時(shí)間、經(jīng)濟(jì)上的壓力是不言而喻的。因此通過官方的平臺進(jìn)行作品登記,并向權(quán)利人支付報(bào)酬既可以提升交易效率、降低成本,又可以保證機(jī)器學(xué)習(xí)在獲得大量素材的同時(shí)兼顧原著作權(quán)人利益。我國在立法上不無依照該思路進(jìn)行諸多嘗試。以《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》第9條為例,規(guī)定了“向農(nóng)村提供特定作品的準(zhǔn)法定許可”制度,這一制度為我國農(nóng)村地區(qū)居民提供了實(shí)際幫助,保障了他們的基本生活文化權(quán)利。在這個(gè)制度下,農(nóng)村居民可以合法獲取特定作品,享受文化生活,而著作權(quán)人也能獲得合理的報(bào)酬,保護(hù)了其合法權(quán)益。同時(shí),當(dāng)著作權(quán)人提出異議時(shí),網(wǎng)絡(luò)服務(wù)提供者不僅要?jiǎng)h除作品,還應(yīng)支付作品使用期間的報(bào)酬,體現(xiàn)了法律對著作權(quán)人的保護(hù)。這種利益平衡的立法嘗試,為我國特殊群體與著作權(quán)人之間的關(guān)系提供了范例。這種制度的構(gòu)建對于生成式人工智能的訓(xùn)練數(shù)據(jù)的法定許可制度具有重要的參考意義。隨著人工智能的發(fā)展,對于大規(guī)模數(shù)據(jù)的需求日益增加,而這些數(shù)據(jù)往往涉及到著作權(quán)等法律問題。借鑒《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》第9條的經(jīng)驗(yàn),我們可以探討針對生成式人工智能的數(shù)據(jù)使用許可制度,既保護(hù)了數(shù)據(jù)提供者的權(quán)益,又促進(jìn)了人工智能技術(shù)的發(fā)展參見參見彭飛榮.論算法創(chuàng)作中涉數(shù)據(jù)的著作權(quán)侵權(quán)風(fēng)險(xiǎn)及其化解[J].法律適用,2023,(04):46-55.除此之外,筆者認(rèn)為應(yīng)明確哪些類型的人工智能訓(xùn)練學(xué)習(xí)可以適用法定許可,如機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等。同時(shí),對于不適用的情形也應(yīng)進(jìn)行明確規(guī)定。根據(jù)作品類型、使用方式、市場價(jià)值等因素制定合理的報(bào)酬標(biāo)準(zhǔn),確保著作權(quán)人能夠獲得合理的經(jīng)濟(jì)回報(bào)。三、構(gòu)建更加開放的合理使用制度合理使用制度是指在特定的情況下,允許他人在未經(jīng)著作權(quán)人許可的情況下,使用受著作權(quán)保護(hù)的作品,而不構(gòu)成侵權(quán)的一種制度。其目的是在保護(hù)著作權(quán)人合法權(quán)益的同時(shí),促進(jìn)作品的傳播、利用和創(chuàng)新,以滿足公眾的文化需求和社會進(jìn)步的需要。在保障著作權(quán)人基本權(quán)益的前提下,可以適當(dāng)擴(kuò)大合理使用的范圍,為生成式人工智能的學(xué)習(xí)和創(chuàng)作提供更多的素材和靈感來源:第一,可以對合理使用中的主體即《著作權(quán)法》第24條的第1款中第1項(xiàng)和第6項(xiàng)進(jìn)行升級擴(kuò)容,分別突破第一項(xiàng)下“個(gè)人”和第六項(xiàng)下“大專院校、科研院所”的主體限制,將其擴(kuò)大為所有通過合法途徑獲取數(shù)據(jù)的具有科研資質(zhì)的主體。因?yàn)槌藗€(gè)人和大專院校、科研機(jī)構(gòu)外,企業(yè)等市場經(jīng)濟(jì)主體、醫(yī)院等公共醫(yī)療機(jī)構(gòu)可能也具備資金、資源和人力上的研究條件,在具有科研資質(zhì)的情況,也能進(jìn)行技術(shù)的自主學(xué)習(xí)研究。第二,可以對合理使用的非營利性目的進(jìn)行進(jìn)一步解釋,對其解釋可分為兩種路徑。其一是在不突破非營利性目的的限制下,將非營利性目的限于直接目的之下,將雖用于企業(yè)經(jīng)營,但主要為研發(fā)創(chuàng)新所需的數(shù)據(jù)與文本挖掘間接性行為排除在外。其二是直接突破非營利性的目的限制,將使用目的變更為“非表達(dá)性使用目的或知識和信息創(chuàng)新目的”。第三,可以借鑒《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》的立法模式,利用合理使用制度的兜底條款即《著作權(quán)法》第24條的第1款第13項(xiàng),在《著作權(quán)法》之外通過制定或修改新的行政法規(guī),增設(shè)單獨(dú)的、整體的合理使用規(guī)則,為大模型研發(fā)所需的數(shù)據(jù)文本挖掘合理使用提供制度空間。生成式人工智能技術(shù)發(fā)展迅速,未來的學(xué)習(xí)和創(chuàng)作方式可能更加多樣化和復(fù)雜化。因此,在設(shè)定合理使用制度時(shí),需要關(guān)注技術(shù)的發(fā)展趨勢和制度的適應(yīng)性,及時(shí)對相關(guān)規(guī)定進(jìn)行調(diào)整和更新,以確保制度的科學(xué)性和有效性。四、平衡著作權(quán)人和生成式人工智能使用者的利益我們需要平衡著作權(quán)人與生成式人工智能使用者的利益,既要保障著作權(quán)人的合法權(quán)益不受侵害,又要為生成式人工智能的學(xué)習(xí)和創(chuàng)作提供足夠的自由度。為了保護(hù)作品的著作權(quán)人的利益,生成式人工智能的使用者必須承擔(dān)起提供必要且合理程度的技術(shù)保護(hù)措施以及注明作品來源的責(zé)任。生成式人工智能使用作品并形成復(fù)制件的行為會為他人未經(jīng)著作權(quán)人許可而使用作品提供便利,因此使用者附有必要且合理的義務(wù)保證他的二次使用行為不會導(dǎo)致權(quán)利人為作品提供的保護(hù)出現(xiàn)缺口,即不會導(dǎo)致作品外泄和不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論