《生成式人工智能》 課件全套 第1-8章 生成式人工智能概述 -視頻生成_第1頁(yè)
《生成式人工智能》 課件全套 第1-8章 生成式人工智能概述 -視頻生成_第2頁(yè)
《生成式人工智能》 課件全套 第1-8章 生成式人工智能概述 -視頻生成_第3頁(yè)
《生成式人工智能》 課件全套 第1-8章 生成式人工智能概述 -視頻生成_第4頁(yè)
《生成式人工智能》 課件全套 第1-8章 生成式人工智能概述 -視頻生成_第5頁(yè)
已閱讀5頁(yè),還剩640頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生成式人工智能概述案例導(dǎo)入:ChatGPT震撼來(lái)襲在實(shí)際應(yīng)用中,ChatGPT展現(xiàn)出了卓越的能力。它能根據(jù)用戶需求輕松完成撰寫郵件、視頻腳本、翻譯等任務(wù),甚至在一定程度上替代搜索引擎。更令人驚嘆的是,通過適當(dāng)?shù)幕?dòng)和引導(dǎo)訓(xùn)練,ChatGPT不僅能“舞文弄墨”,填詞作詩(shī),還能編寫程序代碼并進(jìn)行調(diào)試,仿佛一位全能的智者。2022年11月,OpenAI公司推出了一款名為ChatGPT的全新聊天機(jī)器人程序。ChatGPT通過學(xué)習(xí)和理解人類語(yǔ)言,能夠以對(duì)話形式與人類進(jìn)行交流。相較于眾多傳統(tǒng)聊天機(jī)器人,ChatGPT展現(xiàn)出卓越的語(yǔ)言理解和表達(dá)能力,交流互動(dòng)不僅自然流暢,而且精準(zhǔn)高效,能夠應(yīng)對(duì)復(fù)雜的推理問題,顛覆了人們對(duì)聊天機(jī)器人的傳統(tǒng)認(rèn)知。案例導(dǎo)入ChatGPT震撼來(lái)襲案例導(dǎo)入:ChatGPT震撼來(lái)襲思考2023年,全球人工智能技術(shù)不斷創(chuàng)新與突破,而ChatGPT無(wú)疑是其中最受歡迎的技術(shù)之一。它不僅在各種應(yīng)用場(chǎng)景中彰顯出強(qiáng)大的實(shí)用價(jià)值,還贏得了越來(lái)越多用戶的青睞。為何ChatGPT能在短時(shí)間內(nèi)引發(fā)全球廣泛關(guān)注?這歸功于它在最具挑戰(zhàn)性的AI研究領(lǐng)域——自然語(yǔ)言處理方面,實(shí)現(xiàn)了前所未有的突破。ChatGPT不僅展現(xiàn)了類人的認(rèn)知和推理能力,更揭示了生成式人工智能的巨大潛力。它的問世,無(wú)疑為人工智能領(lǐng)域注入了新的活力,也預(yù)示著未來(lái)智能世界的無(wú)限可能。1.1認(rèn)識(shí)人工智能1.1.1人工智能的定義

人工智能這個(gè)詞拆開來(lái)看,由“人工”和“智能”兩部分組成。其中,“人工”簡(jiǎn)單來(lái)說,就是由人類制造或安排的。目前,人們普遍認(rèn)同的觀點(diǎn)是,我們所認(rèn)知的智能僅限于人類自身的智慧能力。對(duì)此,美國(guó)著名心理學(xué)家羅伯特·斯滕伯格對(duì)“智能”給出了如下定義:智能是個(gè)人從經(jīng)驗(yàn)中學(xué)習(xí)、進(jìn)行理性思考、記憶重要信息,以及應(yīng)對(duì)日常生活需求的認(rèn)知能力。由于我們對(duì)自身智能的理解有限,因此很難明確界定人工制造的“智能”。較早流行的一種定義是由約翰·麥卡錫在1956年達(dá)特茅斯會(huì)議上提出的,即:人工智能旨在使機(jī)器表現(xiàn)出類似于人類智能的行為。具體而言,機(jī)器應(yīng)“像人一樣思考”“像人一樣行動(dòng)”“理性地思考”和“理性地行動(dòng)”。這里的“行動(dòng)”應(yīng)廣義地理解為采取行動(dòng)或制定行動(dòng)決策,而非僅指肢體動(dòng)作。1.1.1人工智能的定義

目前,研究者普遍認(rèn)為,人工智能(AI)是一門旨在研究、開發(fā)用于模擬、延伸和擴(kuò)展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的新興技術(shù)科學(xué)。從學(xué)科角度來(lái)看,人工智能橫跨自然科學(xué)和社會(huì)科學(xué)兩大領(lǐng)域,呈現(xiàn)出顯著的多學(xué)科交叉性特點(diǎn)。涉及的學(xué)科包括哲學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、物理學(xué)、心理學(xué)、神經(jīng)生理學(xué)、信息論、控制論等。自20世紀(jì)70年代以來(lái),人工智能被譽(yù)為世界三大尖端技術(shù)之一(空間技術(shù)、能源技術(shù)、人工智能),同時(shí)也被視為21世紀(jì)三大尖端技術(shù)(基因工程、納米科學(xué)、人工智能)之一。人工智能的核心在于模擬人類意識(shí)、思維的信息處理過程。它致力于揭示智能的本質(zhì),并致力于創(chuàng)造一種能夠以類似人類智能方式做出反應(yīng)的新型智能機(jī)器。1.1.2人工智能的分類第一個(gè)被授予國(guó)籍的機(jī)器人索菲亞根據(jù)人工智能實(shí)現(xiàn)“智能”的方式和水平,可以將其劃分為計(jì)算智能、感知智能和認(rèn)知智能。1)計(jì)算智能指的是具備超凡計(jì)算能力和存儲(chǔ)能力的智能系統(tǒng)。例如,人工神經(jīng)網(wǎng)絡(luò)的出現(xiàn),使機(jī)器能夠更高效、更快速地處理海量數(shù)據(jù),展現(xiàn)出類似人類的計(jì)算能力。AlphaGo便是這一領(lǐng)域的典型代表。2)感知智能是指機(jī)器能夠理解和回應(yīng)人類語(yǔ)言、識(shí)別世間萬(wàn)物的智能。語(yǔ)音處理和視覺識(shí)別均屬于此范疇。這些技術(shù)能夠有效輔助甚至替代人類完成特定任務(wù),例如,首個(gè)被授予國(guó)籍的機(jī)器人索菲亞。3)認(rèn)知智能是指機(jī)器能夠主動(dòng)進(jìn)行思考和采取行動(dòng),它是對(duì)計(jì)算智能和感知智能的綜合與升華,例如自動(dòng)駕駛汽車。1.按照實(shí)現(xiàn)方式分類2.按照智能水平高低分類1)弱人工智能(專用人工智能)是指那些不能真正實(shí)現(xiàn)推理和解決問題的智能機(jī)器。弱人工智能擅長(zhǎng)于特定領(lǐng)域的單一能力。例如,有些人工智能能夠戰(zhàn)勝象棋世界冠軍,但它們只會(huì)下象棋,若詢問如何更高效地在硬盤上存儲(chǔ)數(shù)據(jù),它們則無(wú)法回答。根據(jù)智能水平的高低,人工智能可以分為弱人工智能、強(qiáng)人工智能和超人工智能三種。2)強(qiáng)人工智能(通用人工智能)是指那些能夠真正進(jìn)行思維的智能機(jī)器,并具備知覺和自我意識(shí)。例如,科幻電影《星球大戰(zhàn)》中的C-3PO和邪惡終結(jié)者等。這類機(jī)器可分為類人與非類人兩大類:①類人的人工智能,其思考和推理方式與人類相似;②非類人的人工智能,其知覺和意識(shí)與人類截然不同,采用獨(dú)特的推理方式。1.1.2人工智能的分類強(qiáng)人工智能在各方面都能與人類媲美,能夠完成人類所有的腦力工作。創(chuàng)造強(qiáng)人工智能的難度遠(yuǎn)高于弱人工智能。ChatGPT展現(xiàn)了人類特有的認(rèn)知和推理能力,實(shí)現(xiàn)了前所未有的突破,使人類看到了通用人工智能的曙光。3)超人工智能(超級(jí)智能)。牛津哲學(xué)家、知名人工智能思想家尼克·博斯特羅姆將超級(jí)智能定義為“在幾乎所有領(lǐng)域都比最聰明的人類大腦聰明得多,包括科學(xué)創(chuàng)新、通識(shí)和社交技能”。超人工智能可能在各方面都比人類略強(qiáng),也可能強(qiáng)萬(wàn)億倍。在超人工智能領(lǐng)域,人工智能已跨越“奇點(diǎn)”,其計(jì)算和思維能力遠(yuǎn)超人類,此時(shí)的人工智能將打破人腦的維度限制,超出人類的理解和想象,將形成一個(gè)全新的社會(huì)。因此,超人工智能引發(fā)了人類對(duì)“永生”和“滅絕”的深刻思考。1.1.2人工智能的分類人工智能技術(shù)由其背后的模型支撐。若按模型來(lái)劃分,可分為判別式(決策式)人工智能和生成式人工智能。生成式人工智能則專注于學(xué)習(xí)數(shù)據(jù)的生成過程,不僅學(xué)習(xí)數(shù)據(jù)的特征,還學(xué)習(xí)如何生成新的數(shù)據(jù)實(shí)例,這些實(shí)例在統(tǒng)計(jì)上與訓(xùn)練數(shù)據(jù)相似。生成式人工智能可生成的內(nèi)容形式多樣,涵蓋文本、圖片、音頻和視頻等。判別式(決策式)人工智能主要聚焦于分類和識(shí)別任務(wù),通過學(xué)習(xí)數(shù)據(jù)的特征和模式來(lái)區(qū)分不同的輸出類別。其主要應(yīng)用領(lǐng)域包括:人臉識(shí)別、推薦系統(tǒng)、風(fēng)控系統(tǒng)、其他智能決策系統(tǒng)、機(jī)器人、自動(dòng)駕駛。3.按模型劃分1.1.3人工智能的起源人工智能的孕育(1)傳說中的人工智能人工智能的思想在古代就已萌芽,無(wú)論是在東方還是西方。公元前900多年,我國(guó)就有關(guān)于歌舞機(jī)器人的傳說記載;古希臘也流傳著諸多神話,涉及天神、怪獸等元素。在這些傳說中,機(jī)械人的形象亦屢見不鮮,例如古代詩(shī)人荷馬在其著作《伊利亞特》中提到的希臘天神赫菲斯托斯制造的黃金機(jī)器人。書中描述,該機(jī)器人擁有三條腿,行動(dòng)自如。19世紀(jì)興起的幻想文學(xué)同樣涌現(xiàn)出大量關(guān)于人造人和智能機(jī)器的題材,如被譽(yù)為科幻小說之母的瑪麗·雪萊創(chuàng)作的《科學(xué)怪人》,以及卡雷爾·恰佩克的戲劇《羅素姆萬(wàn)能機(jī)器人》。1.1.3人工智能的起源1)《大都會(huì)》:開啟科幻電影的大門1927年,美國(guó)拍攝的《大都會(huì)》被譽(yù)為第一部科幻電影。該片對(duì)未來(lái)社會(huì)進(jìn)行了大膽設(shè)想,內(nèi)容涉及機(jī)器人、可視電話等前沿技術(shù),正式打開了機(jī)器人科幻電影的大門。繼《大都會(huì)》之后,科幻電影如潮水般涌現(xiàn),為人們提供了了解人工智能的獨(dú)特窗口。此外,《大都會(huì)》中還展示了先進(jìn)的通信工具,可視電話。(2)科幻電影中的人工智能1.1.3人工智能的起源鮑曼與哈爾下國(guó)際象棋超級(jí)計(jì)算機(jī)哈爾2)《2001太空漫游》:現(xiàn)代科幻電影技術(shù)的里程碑影片中,人類在2001年的月球上發(fā)現(xiàn)了一塊能向木星發(fā)出強(qiáng)烈無(wú)線電信號(hào)的黑色石板。政府隨即派遣“發(fā)現(xiàn)一號(hào)”宇宙飛船前往木星進(jìn)行探查。飛船上除了兩名宇航員和三名科學(xué)家外,還配備了一臺(tái)名為“哈爾”的超級(jí)計(jì)算機(jī)。

2.圖靈測(cè)試與人工智能阿蘭·圖靈出生于英國(guó)倫敦帕丁頓,畢業(yè)于普林斯頓大學(xué),是英國(guó)著名的數(shù)學(xué)家和邏輯學(xué)家,被譽(yù)為“計(jì)算機(jī)科學(xué)之父”和“人工智能之父”。圖靈在1950年發(fā)表了一篇具有劃時(shí)代意義的論文,題為《計(jì)算機(jī)器與智能》。在這篇論文中提出了一個(gè)判斷機(jī)器是否具備智能的設(shè)想:“如果一臺(tái)機(jī)器能夠與人類進(jìn)行對(duì)話,且其機(jī)器身份不被識(shí)破,那么這臺(tái)機(jī)器便被認(rèn)為具有智能?!眻D靈的這一構(gòu)想后來(lái)被譽(yù)為著名的“圖靈測(cè)試”。它本質(zhì)上是一個(gè)“思想實(shí)驗(yàn)”,具體測(cè)試內(nèi)容如下:假設(shè)測(cè)試者與兩名被測(cè)試者通過“問答模式”進(jìn)行對(duì)話,其中一名被測(cè)試者是真人,另一名則是機(jī)器;測(cè)試者與被測(cè)試者相互隔離。因此,測(cè)試者無(wú)法知曉哪位被測(cè)試者是真人,哪位是機(jī)器。經(jīng)過多次測(cè)試,若超過30%的測(cè)試者無(wú)法確定被測(cè)試者的身份,那么這臺(tái)機(jī)器便視為通過了測(cè)試,并被認(rèn)定具備人類智能。2.圖靈測(cè)試與人工智能圖靈測(cè)試通過實(shí)驗(yàn),圖靈得出結(jié)論:機(jī)器確實(shí)具備一定程度的思維能力。基于此,他從行為主義的角度對(duì)智能問題進(jìn)行了定義,并大膽提出假設(shè):“一個(gè)人在不接觸對(duì)方的情況下,通過特定方式與對(duì)方進(jìn)行一系列問答,若在一段時(shí)間內(nèi)無(wú)法根據(jù)這些問題判斷對(duì)方是人還是機(jī)器,那么即可認(rèn)定該機(jī)器擁有與人類相當(dāng)?shù)闹橇Α!边@便是廣為人知的“圖靈測(cè)試”。圖靈機(jī)是圖靈于1936年提出的一種精確的通用計(jì)算機(jī)模型,能夠模擬實(shí)際計(jì)算機(jī)的所有計(jì)算行為。該機(jī)器可以讀入一系列的0和1,這些數(shù)字代表了解決某一問題所需的步驟。按照這些步驟進(jìn)行操作,便能解決特定的問題,這一觀念在當(dāng)時(shí)具有決定性意義。2.圖靈測(cè)試與人工智能圖靈機(jī)圖靈機(jī)本質(zhì)上是一個(gè)抽象的機(jī)器,配備有一條無(wú)限長(zhǎng)的紙帶,紙帶被劃分成多個(gè)小方格,每個(gè)方格具有不同的顏色。機(jī)器頭在紙帶上移動(dòng),擁有若干內(nèi)部狀態(tài)和一套固定程序。在每個(gè)時(shí)刻,機(jī)器頭會(huì)讀取當(dāng)前紙帶上的方格信息,結(jié)合自身內(nèi)部狀態(tài),查找程序表,并根據(jù)程序?qū)⑿畔⑤敵龅郊垘Х礁裆?,同時(shí)轉(zhuǎn)換內(nèi)部狀態(tài),隨后進(jìn)行移動(dòng)。圖靈不僅在計(jì)算機(jī)和人工智能領(lǐng)域產(chǎn)生了深遠(yuǎn)影響,還在密碼破譯方面展現(xiàn)了卓越的才華。為紀(jì)念艾倫·圖靈在數(shù)學(xué)領(lǐng)域的卓越成就,美國(guó)計(jì)算機(jī)協(xié)會(huì)于1966年設(shè)立了“圖靈獎(jiǎng)”,專門用于獎(jiǎng)勵(lì)在計(jì)算機(jī)領(lǐng)域做出重大貢獻(xiàn)的杰出人士,圖靈獎(jiǎng)也因此被譽(yù)為“計(jì)算機(jī)界的諾貝爾”。

3.人工智能學(xué)科的誕生達(dá)特茅斯學(xué)院1946年,人類成功制造出世界上第一臺(tái)電子計(jì)算機(jī)ENIAC,這一創(chuàng)舉為人工智能的發(fā)展奠定了堅(jiān)實(shí)的硬件基礎(chǔ)。計(jì)算機(jī)的問世引發(fā)了信息存儲(chǔ)和處理領(lǐng)域的革命性變革,計(jì)算機(jī)理論的不斷進(jìn)步催生了計(jì)算機(jī)科學(xué),并最終促成了人工智能的誕生。計(jì)算機(jī)這一通過電子方式處理數(shù)據(jù)的發(fā)明,為人工智能的實(shí)現(xiàn)提供了關(guān)鍵的技術(shù)媒介。計(jì)算機(jī)的出現(xiàn)使得技術(shù)層面上創(chuàng)造機(jī)器智能成為可能,人類自此擁有了一個(gè)能夠模擬人類思維的工具。在此后的歲月里,無(wú)數(shù)科學(xué)家為實(shí)現(xiàn)這一目標(biāo)不懈努力。1956年夏季在達(dá)特茅斯學(xué)院開展一次為期兩個(gè)月、由10人參與的人工智能研究項(xiàng)目,共同探討利用機(jī)器模擬智能的相關(guān)議題。3.人工智能學(xué)科的誕生卡斯帕羅夫與深藍(lán)對(duì)弈當(dāng)中除了四名發(fā)起人外,特倫查德·莫爾、亞瑟·塞繆爾、艾倫·紐厄爾、赫伯特·西蒙、雷·所羅門諾夫和奧利弗·塞爾弗里奇等人于1956年參與了達(dá)特茅斯會(huì)議,會(huì)議首次提出了“人工智能”這一術(shù)語(yǔ)。達(dá)特茅斯會(huì)議作為人類歷史上首次人工智能研討會(huì),標(biāo)志著“人工智能”這一新興學(xué)科的正式誕生。該年份也因此被譽(yù)為“人工智能元年”,具有極其重要的歷史意義。1997年5月,IBM公司研制的深藍(lán)計(jì)算機(jī)擊敗了國(guó)際象棋大師卡斯帕羅夫,這一成就堪稱人工智能技術(shù)的典范展示。1.1.4人工智能發(fā)展歷程人工智能發(fā)展并非一帆風(fēng)順,而是經(jīng)歷了從繁榮到衰退,再到繁榮的螺旋式上升過程,大致可分為以下六個(gè)階段。1.起步發(fā)展期:1956年~20世紀(jì)60年代初在20世紀(jì)50年代,人工智能概念初現(xiàn)時(shí),研究主要集中在理論層面,主要采用邏輯法,研究方向涵蓋自動(dòng)推理、認(rèn)知模型、知識(shí)表示與推理,以及人工智能的語(yǔ)言、架構(gòu)和工具等。初期應(yīng)用領(lǐng)域包括機(jī)器翻譯、定理證明、通用問題求解、下棋程序、工業(yè)反饋控制和機(jī)器人等。1957年,康奈爾大學(xué)的實(shí)驗(yàn)心理學(xué)家弗蘭克·羅森布拉特在一臺(tái)IBM704計(jì)算機(jī)上成功模擬了“感知機(jī)”神經(jīng)網(wǎng)絡(luò)模型。盡管該模型看似僅將一組M-P神經(jīng)元簡(jiǎn)單排列,但借助機(jī)器學(xué)習(xí),它能夠完成部分機(jī)器視覺和模式識(shí)別任務(wù),從而推動(dòng)了人工智能的進(jìn)步,掀起了人工智能發(fā)展的首個(gè)高潮。1.1.4人工智能發(fā)展歷程反思發(fā)展期:20世紀(jì)60~70年代初人工智能發(fā)展初期的突破性進(jìn)展極大地提升了人們對(duì)這一領(lǐng)域的期望。人們開始嘗試更具挑戰(zhàn)性的任務(wù),并提出了一些不切實(shí)際的研發(fā)目標(biāo),但很快便遭遇了諸多困境。在機(jī)器翻譯領(lǐng)域,起初人們認(rèn)為只需一本雙解字典和一些語(yǔ)法知識(shí)便能實(shí)現(xiàn)兩種語(yǔ)言的互譯,然而實(shí)際情況遠(yuǎn)比預(yù)想的復(fù)雜,甚至?xí)霈F(xiàn)荒謬的錯(cuò)誤。例如,將英語(yǔ)句子“Thespiritiswillingbutthefleshisweak”(心有余而力不足)翻譯成俄語(yǔ),再轉(zhuǎn)譯回英語(yǔ)時(shí),竟變成了“Thewineisgoodbutthemeatisspoiled”(酒是好的,肉變質(zhì)了)。在人工智能的本質(zhì)、理論、思想和機(jī)理方面,該領(lǐng)域受到了來(lái)自哲學(xué)、心理學(xué)、神經(jīng)生理學(xué)等社會(huì)各界的責(zé)難、懷疑和批評(píng)。1.1.4人工智能發(fā)展歷程應(yīng)用發(fā)展期:20世紀(jì)70年代初~80年代中20世紀(jì)70年代,專家系統(tǒng)嶄露頭角,通過模擬人類專家的知識(shí)和經(jīng)驗(yàn),成功解決了特定領(lǐng)域的問題,實(shí)現(xiàn)了人工智能從理論研究邁向?qū)嶋H應(yīng)用、從一般推理策略探討轉(zhuǎn)向運(yùn)用專門知識(shí)的重大突破。美國(guó)斯坦福大學(xué)成功研制了一種輔助化學(xué)家判斷待定物質(zhì)分子結(jié)構(gòu)的專家系統(tǒng)——DENDRAL系統(tǒng)。1976年,該校研究人員歷經(jīng)五六年開發(fā)出一種早期的人工智能模擬決策系統(tǒng)——MYCIN系統(tǒng),用于嚴(yán)重感染時(shí)的細(xì)菌診斷及抗生素給藥推薦。此后,眾多知名專家系統(tǒng)如PROSPECTIOR探礦系統(tǒng)、Hearsay-II語(yǔ)音理解系統(tǒng)等相繼問世,推動(dòng)了人工智能的實(shí)際應(yīng)用。值得一提的是,為促進(jìn)人工智能的進(jìn)一步發(fā)展,各國(guó)科學(xué)家于1969年共同倡議召開了國(guó)際人工智能聯(lián)合會(huì)議,標(biāo)志著人工智能發(fā)展進(jìn)入新高峰。1.1.4人工智能發(fā)展歷程4.低迷發(fā)展期:20世紀(jì)80年代中~90年代中隨著人工智能應(yīng)用規(guī)模的不斷擴(kuò)大,專家系統(tǒng)的局限性逐漸顯現(xiàn),包括應(yīng)用領(lǐng)域狹窄、缺乏常識(shí)性知識(shí)、知識(shí)獲取困難、推理方法單一、缺乏分布式功能以及難以與現(xiàn)有數(shù)據(jù)庫(kù)兼容等問題。從20世紀(jì)80年代末至20世紀(jì)末,隨著IBM個(gè)人計(jì)算機(jī)性能的提升和成本的降低,人工智能系統(tǒng)硬件成本高、維護(hù)難的缺點(diǎn)愈發(fā)突出,且專家系統(tǒng)對(duì)人類知識(shí)的依賴導(dǎo)致其實(shí)用局限性日益明顯,人工智能市場(chǎng)顯著萎縮,政府資助也大幅減少,人工智能發(fā)展再次陷入低谷。5.穩(wěn)步發(fā)展期:20世紀(jì)90年代中~2010年得益于網(wǎng)絡(luò)技術(shù),尤其是因特網(wǎng)的迅猛發(fā)展,信息與數(shù)據(jù)的匯聚速度不斷加快,因特網(wǎng)的普及進(jìn)一步推動(dòng)了人工智能的創(chuàng)新研究,促使人工智能技術(shù)逐步走向?qū)嵱没?997年,IBM深藍(lán)超級(jí)計(jì)算機(jī)戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫;2008年,IBM提出“智慧地球”概念,這些均成為該時(shí)期的標(biāo)志性事件。1.1.4人工智能發(fā)展歷程6.蓬勃發(fā)展期:2011年至今圖像分類、語(yǔ)音識(shí)別、知識(shí)問答、人機(jī)對(duì)弈、無(wú)人駕駛等具有廣闊應(yīng)用前景的人工智能技術(shù),成功突破了從“不能用、不好用”到“可以用”的技術(shù)瓶頸。幾個(gè)典型事件包括:2010年,谷歌無(wú)人駕駛汽車創(chuàng)下了超過16萬(wàn)公里無(wú)事故的紀(jì)錄;2011年,IBM沃森參加“危險(xiǎn)邊緣”智力游戲,擊敗了最高獎(jiǎng)金得主和連勝紀(jì)錄保持者;2016年,谷歌阿爾法狗戰(zhàn)勝圍棋九段棋手李世石;2017年,谷歌阿爾法狗以3∶0完勝世界圍棋冠軍柯潔。人工智能發(fā)展由此進(jìn)入爆發(fā)式增長(zhǎng)的新高潮。自2018年以來(lái),人工智能大模型和ChatGPT技術(shù)的突破標(biāo)志著生成式人工智能技術(shù)的興起,引領(lǐng)了科技革命的新潮流。生成式人工智能的出現(xiàn),推動(dòng)了構(gòu)建能夠理解和表達(dá)復(fù)雜信息的智能系統(tǒng),增強(qiáng)了學(xué)習(xí)能力和適應(yīng)性,能夠從大量數(shù)據(jù)中提取知識(shí)并應(yīng)用于實(shí)際場(chǎng)景,為通用人工智能的實(shí)現(xiàn)開辟了新希望和途徑。隨著研究和創(chuàng)新的持續(xù),生成式人工智能預(yù)計(jì)將對(duì)人類社會(huì)產(chǎn)生深遠(yuǎn)的影響。1.1.5人工智能的主要流派符號(hào)主義,又稱邏輯主義,是由赫伯特·西蒙和艾倫·紐厄爾合作創(chuàng)立的重要人工智能學(xué)派,在人工智能早期階段占據(jù)主導(dǎo)地位。該學(xué)派認(rèn)為人工智能源于數(shù)學(xué)邏輯,其核心在于模擬人類的抽象邏輯思維,通過符號(hào)來(lái)描述人類的認(rèn)知過程。通常被稱為“經(jīng)典的人工智能”是在符號(hào)主義觀點(diǎn)指導(dǎo)下開展研究的。經(jīng)典人工智能研究可分為認(rèn)知學(xué)派和邏輯學(xué)派。認(rèn)知學(xué)派以西蒙、明斯基和紐厄爾等為代表,從人的思維活動(dòng)出發(fā),利用計(jì)算機(jī)進(jìn)行宏觀功能模擬。邏輯學(xué)派以麥卡錫和尼爾森等為代表,主張用邏輯方法研究人工智能,即用形式化手段描述客觀世界。早期研究通過基本的推斷步驟尋求完全解,涌現(xiàn)出邏輯理論家和幾何定理證明器等成果。20世紀(jì)70年代,大量專家系統(tǒng)涌現(xiàn),結(jié)合領(lǐng)域知識(shí)和邏輯推斷,推動(dòng)人工智能進(jìn)入工程應(yīng)用領(lǐng)域。0102031.符號(hào)主義1.1.5人工智能的主要流派2.聯(lián)接主義聯(lián)接主義,又稱仿生學(xué)派,其核心原理是利用神經(jīng)網(wǎng)絡(luò)及其連接機(jī)制和學(xué)習(xí)算法來(lái)模擬生物神經(jīng)系統(tǒng)。聯(lián)接主義旨在使機(jī)器模擬人腦,通過構(gòu)建類似人腦神經(jīng)元的模擬節(jié)點(diǎn)網(wǎng)絡(luò)來(lái)處理信號(hào)。聯(lián)接主義的起源可追溯至1943年麥卡洛克和皮茨創(chuàng)立的腦模型,奠定了其理論基礎(chǔ)。1957年,康奈爾大學(xué)實(shí)驗(yàn)心理學(xué)家弗蘭克·羅森布拉特發(fā)明了“感知器”神經(jīng)網(wǎng)絡(luò)模型,引發(fā)廣泛關(guān)注。然而,受限于理論模型、生物原型和技術(shù)條件,隨著20世紀(jì)70年代人工智能第一波低潮的到來(lái),聯(lián)接主義的發(fā)展勢(shì)頭逐漸減弱。直至1982年,約翰·霍普菲爾德提出了一種新的神經(jīng)網(wǎng)絡(luò),由多個(gè)節(jié)點(diǎn)和連接線組成,每個(gè)節(jié)點(diǎn)與相鄰節(jié)點(diǎn)相連。霍普菲爾德神經(jīng)網(wǎng)絡(luò)的提出,標(biāo)志著聯(lián)接主義的復(fù)蘇。1986年,魯梅爾哈特等人提出的反向傳播算法,為神經(jīng)網(wǎng)絡(luò)理論研究帶來(lái)突破。2006年后,人工智能深度學(xué)習(xí)網(wǎng)絡(luò)迅速崛起,尤其是近年來(lái)以ChatGPT為代表的大模型算法的興起,使聯(lián)接主義成為人工智能時(shí)代的主流。1.1.5人工智能的主要流派行為主義,亦稱進(jìn)化主義,近年來(lái)因AlphaGo取得的突破性進(jìn)展而備受矚目。其理論基礎(chǔ)可追溯至諾伯特·維納(NorbertWiener)于1948年提出的“控制論”理論,隨后這一理論逐漸演化為人工智能領(lǐng)域中的行為主義學(xué)派。行為主義的核心思想在于關(guān)注主體與環(huán)境的相互作用,通過模擬動(dòng)物的“感知-動(dòng)作”機(jī)制,使智能體不斷調(diào)整自身行動(dòng),改變狀態(tài),與環(huán)境進(jìn)行有效交互,并通過獎(jiǎng)勵(lì)規(guī)則評(píng)估調(diào)整效果,最終實(shí)現(xiàn)對(duì)人類智能的復(fù)制。行為主義秉持還原論的觀點(diǎn),主張放棄對(duì)意識(shí)的研究,專注于探討人和動(dòng)物等有機(jī)體的行為。在人工智能研究歷程中,行為主義曾長(zhǎng)期未受重視,遠(yuǎn)不及符號(hào)主義和聯(lián)結(jié)主義,直至20世紀(jì)末期,行為主義才正式確立為一個(gè)新的學(xué)派。01023.行為主義(Behaviourism)1.2生成式人工智能1.2.1認(rèn)識(shí)生成式人工智能生成式人工智能是人工智能的一個(gè)分支,專門用于“生成”新內(nèi)容。具體而言,這種技術(shù)基于算法、模型和規(guī)則,能夠生成文本、圖片、聲音、視頻、代碼等多種內(nèi)容。它通過事先訓(xùn)練好的模型,利用用戶輸入的相關(guān)資料,生成具有邏輯性和連貫性的內(nèi)容。與傳統(tǒng)人工智能相比,生成式人工智能不僅能夠處理輸入數(shù)據(jù),還能學(xué)習(xí)和模擬事物的內(nèi)在規(guī)律,自主創(chuàng)造新內(nèi)容。該技術(shù)在新聞寫作、廣告創(chuàng)意、藝術(shù)創(chuàng)作等領(lǐng)域得到了廣泛應(yīng)用。ChatGPT的推出標(biāo)志著生成式人工智能在文本生成領(lǐng)域取得了突破性進(jìn)展,引發(fā)了社會(huì)各界的廣泛關(guān)注。從文本和繪圖的自動(dòng)生成,到音頻和視頻的精妙合成,生成式人工智能不僅為創(chuàng)意產(chǎn)業(yè)注入了強(qiáng)勁動(dòng)力,實(shí)現(xiàn)了革命性變革,同時(shí)也在科研探索、教育普及等多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出深遠(yuǎn)影響。1.生成式人工智能的定義1.2.1認(rèn)識(shí)生成式人工智能人工智能生成內(nèi)容,是通過人工智能技術(shù)自動(dòng)生成各類內(nèi)容。這些內(nèi)容可以涵蓋文本、圖像、音頻、視頻等多種形式。1生成式人工智能與人工智能生成內(nèi)容是相互關(guān)聯(lián)但各有側(cè)重的概念。GAI作為一種技術(shù),具備生成新內(nèi)容的能力,構(gòu)成了AIGC的技術(shù)基礎(chǔ);而AIGC則是將這一技術(shù)應(yīng)用于生成符合用戶需求和偏好的具體內(nèi)容。因此,AIGC可以被視作GAI的一種實(shí)際應(yīng)用。在內(nèi)容生成的語(yǔ)境中,人們常常將這兩個(gè)概念相互通用。22022年,AIGC技術(shù)取得了突破性進(jìn)展,人工智能從單純的學(xué)習(xí)階段邁向了創(chuàng)造階段,展現(xiàn)出在推理、科學(xué)、數(shù)學(xué)和編程等多個(gè)領(lǐng)域的創(chuàng)造力。基于此,AIGC成功入選《科學(xué)》期刊評(píng)選的2022年度十大科學(xué)突破。32.人工智能生成內(nèi)容1.2.1認(rèn)識(shí)生成式人工智能2)圖像生成1)文本生成AIGC具備生成各類文字內(nèi)容的能力,包括文章、新聞、故事、對(duì)話、劇本及自動(dòng)翻譯等。它可根據(jù)指定的主題或?qū)懽黠L(fēng)格,生成與之相契合的文字。ChatGPT等模型在文本生成領(lǐng)域應(yīng)用廣泛,能夠生成多種類型的文本內(nèi)容。AIGC可根據(jù)文字描述或簡(jiǎn)單指示生成圖像內(nèi)容,涵蓋照片、插圖、圖表、地圖等多種類型。它還能根據(jù)用戶需求調(diào)整顏色、構(gòu)圖和版式,具備高度真實(shí)感和藝術(shù)感。DALL-E等模型能夠?qū)⑽谋久枋鲛D(zhuǎn)換為相應(yīng)的圖像。3.AIGC的形式02013.AIGC的形式3)音頻生成AIGC能夠生成各類音頻內(nèi)容,包括語(yǔ)音、音樂、聲效等。它可根據(jù)指定的語(yǔ)言和情感,生成具有特定語(yǔ)言風(fēng)格或音樂風(fēng)格的音頻內(nèi)容。例如,它可根據(jù)文本生成一段特定語(yǔ)調(diào)且接近真人發(fā)音的語(yǔ)音內(nèi)容。谷歌的Tacotron和WaveNet模型被用于生成逼真的語(yǔ)音,應(yīng)用于虛擬助手、自動(dòng)語(yǔ)音識(shí)別等場(chǎng)景。4)視頻生成AIGC能夠生成各類視頻內(nèi)容,包括短片、動(dòng)畫、廣告等。它可將生成的圖像、音頻和動(dòng)畫效果組合,生成視頻片段;也可根據(jù)腳本或指示,控制視頻的主題、情節(jié)和節(jié)奏。2024年2月,OpenAI推出了全新的視頻生成大模型Sora。繼文字與圖片生成后,生成式人工智能體系進(jìn)一步完善,人工智能在理解和創(chuàng)造復(fù)雜視覺內(nèi)容方面的能力顯著提升。4.生成式人工智能的特點(diǎn)生成式人工智能是一種能夠創(chuàng)造新內(nèi)容的人工智能技術(shù),其特點(diǎn)主要包括

1)創(chuàng)造性生成式AI能夠根據(jù)輸入的提示或條件生成新內(nèi)容,而不僅限于對(duì)現(xiàn)有數(shù)據(jù)的分類或預(yù)測(cè)。例如,文本生成模型可以創(chuàng)作新文章或故事,圖像生成模型可以創(chuàng)造出逼真的新圖像。2)多樣性它能夠生成多種風(fēng)格和形式的輸出,滿足不同需求和應(yīng)用場(chǎng)景。例如,在新聞撰寫領(lǐng)域,它可以迅速撰寫體育賽事結(jié)果、財(cái)經(jīng)簡(jiǎn)報(bào)、天氣預(yù)報(bào)等新聞稿。3)交互性生成式AI可與用戶互動(dòng),根據(jù)用戶反饋調(diào)整生成內(nèi)容。例如,文本生成模型可根據(jù)用戶提供的主題或關(guān)鍵詞生成文章草稿,用戶閱讀后提出修改意見,模型則據(jù)此調(diào)整內(nèi)容,直至用戶滿意。4.生成式人工智能的特點(diǎn)高效率它能在極短時(shí)間生成大量?jī)?nèi)容,遠(yuǎn)超人類工作效率。例如,訓(xùn)練有素的文本生成模型可在幾秒內(nèi)完成一篇新聞報(bào)道或故事。生成式AI的高效率使其在多個(gè)領(lǐng)域具有廣泛應(yīng)用潛力,如快速生成新聞稿件、電影劇本和音樂作品,加速新藥研發(fā),個(gè)性化定制教學(xué)內(nèi)容??蓴U(kuò)展性生成式AI可通過增加數(shù)據(jù)量和模型復(fù)雜度提升生成品質(zhì)。隨著數(shù)據(jù)量增加,模型能從更多樣本中學(xué)習(xí),提高泛化能力和生成品質(zhì)。例如,在圖像生成領(lǐng)域,更多訓(xùn)練圖像有助于模型更準(zhǔn)確理解物體形狀、顏色和紋理,生成更逼真的圖像。不確定性生成式AI基于概率模型生成內(nèi)容,輸出具有一定隨機(jī)性和不可預(yù)測(cè)性。由于生成內(nèi)容的多樣性和創(chuàng)造性,輸出結(jié)果有時(shí)難以預(yù)測(cè)和控制,需相應(yīng)過濾和審核機(jī)制。生成式AI可能被用于制造虛假信息、侵權(quán)內(nèi)容等,存在一定倫理和法律風(fēng)險(xiǎn)。1.2.2AIGC與內(nèi)容生產(chǎn)方式變革1.PGC:專業(yè)內(nèi)容創(chuàng)作的時(shí)代在互聯(lián)網(wǎng)發(fā)展的早期階段,PGC(Professional-GeneratedContent)占據(jù)主導(dǎo)地位。專業(yè)機(jī)構(gòu)和人士是內(nèi)容創(chuàng)作的核心力量,如新聞機(jī)構(gòu)、電影制作公司、音樂唱片公司等。他們創(chuàng)作的新聞報(bào)道、電影、音樂等內(nèi)容,具備高度的專業(yè)性和質(zhì)量水準(zhǔn)。這些內(nèi)容通常經(jīng)過精心的策劃、制作和審核,旨在滿足大眾需求并吸引受眾。例如,各大新聞社的記者深入采訪、調(diào)查,撰寫新聞稿件,這些稿件在發(fā)布前需經(jīng)過多層次的編輯和校對(duì),確保內(nèi)容準(zhǔn)確、客觀、有深度。然而,PGC也存在一些局限性。一方面,創(chuàng)作成本高昂,需要投入大量的人力、物力和財(cái)力;另一方面,由于創(chuàng)作主體相對(duì)單一,創(chuàng)新性在一定程度上受限,且與受眾的互動(dòng)性較差。受眾大多只是被動(dòng)接受內(nèi)容,很少有機(jī)會(huì)參與內(nèi)容的創(chuàng)作過程。1.2.2AIGC與內(nèi)容生產(chǎn)方式變革2.UGC:用戶參與內(nèi)容創(chuàng)作的興起隨著互聯(lián)網(wǎng)和社交媒體的迅猛發(fā)展,UGC時(shí)代應(yīng)運(yùn)而生。在這一時(shí)期,普通用戶逐漸成為內(nèi)容的創(chuàng)作者和傳播者。社交媒體平臺(tái)的廣泛普及為用戶提供了便捷的創(chuàng)作和分享途徑,用戶可以通過微博、抖音、小紅書等平臺(tái)分享自己的觀點(diǎn)、經(jīng)驗(yàn)、生活點(diǎn)滴和創(chuàng)意作品等。例如,一位旅游愛好者可以在旅游博客上分享自己的旅行經(jīng)歷、攻略和心得,其他用戶則可以通過評(píng)論、點(diǎn)贊、分享等方式進(jìn)行互動(dòng)。品牌也開始重視UGC內(nèi)容,因?yàn)樗軌蛘鎸?shí)反映消費(fèi)者的聲音和需求。消費(fèi)者通過UGC與品牌建立更緊密的聯(lián)系,品牌則可以根據(jù)用戶生成的內(nèi)容進(jìn)行調(diào)整和優(yōu)化產(chǎn)品或服務(wù)。相較于PGC,UGC的優(yōu)勢(shì)顯而易見,它大幅提升了用戶的參與度,使內(nèi)容創(chuàng)作更加多元化和個(gè)性化,同時(shí)也孕育了豐富的社群文化,用戶之間可以互相交流、啟發(fā)。1.2.2AIGC與內(nèi)容生產(chǎn)方式變革

3.AIGC:人工智能助力內(nèi)容創(chuàng)作如今,AIGC時(shí)代已然到來(lái)。AIGC依托深度學(xué)習(xí)和自然語(yǔ)言處理等人工智能技術(shù),能夠模擬人類的創(chuàng)作能力,生成各類內(nèi)容,如文章、廣告文案、音樂、影片等。它具備快速、高效、個(gè)性化和創(chuàng)新性等顯著特點(diǎn)。例如,百度推出的AIGC平臺(tái),用戶可以利用“文心一言”創(chuàng)作工具,進(jìn)行文字、圖片、語(yǔ)音等多種形式的內(nèi)容創(chuàng)作。AIGC代表了人工智能領(lǐng)域的重大突破,是一場(chǎng)生產(chǎn)力的革命。AIGC融合了大量訓(xùn)練數(shù)據(jù)和模型,拓展了內(nèi)容創(chuàng)新的邊界,使創(chuàng)作者能夠在人工智能生成的內(nèi)容中尋找思路和靈感,助力創(chuàng)作者產(chǎn)出更加獨(dú)特的內(nèi)容。1.2.3AIGC的發(fā)展歷程1.早期萌芽階段(20世紀(jì)50年代~90年代中期)在這一階段,受限于當(dāng)時(shí)的科技水平,AIGC僅限于小范圍實(shí)驗(yàn)。1950年,艾倫·圖靈提出了著名的“圖靈測(cè)試”,該測(cè)試讓測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)在隔開的情況下,通過一些裝置(如鍵盤)向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后,如果機(jī)器使平均每個(gè)參與者做出超過30%的誤判,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能。1957年,美國(guó)作曲家萊杰倫·希勒(LejarenHiller)和倫納德·艾薩克森(LeonardIsaacson)開發(fā)了一個(gè)作曲程序,并制作了歷史上第一支由計(jì)算機(jī)創(chuàng)作的音樂作品《伊利亞克組曲》,人工智能以作曲家的身份首次進(jìn)入音樂領(lǐng)域。1.2.3AIGC的發(fā)展歷程1966年,世界上第一款可進(jìn)行人機(jī)對(duì)話的機(jī)器人“伊莉莎”誕生。伊莉莎程序由麻省理工學(xué)院的計(jì)算機(jī)科學(xué)家約瑟夫·魏岑鮑姆(JosephWeizenbaum)開發(fā),它僅具備文本界面,扮演精神治療師的角色。該程序以英國(guó)著名戲劇家蕭伯納的戲劇《偶像》中的角色命名,能夠使計(jì)算機(jī)與人用英語(yǔ)進(jìn)行對(duì)話。20世紀(jì)80年代中期,IBM基于隱形馬爾可夫模型(hiddenMarkovmodel,HMM)創(chuàng)造了語(yǔ)音控制打字機(jī)“坦戈拉”(Tangora),它能夠處理約20000個(gè)單詞。20世紀(jì)80年代末至90年代中期,由于人工智能研究需要高昂的系統(tǒng)成本,且難以實(shí)現(xiàn)顯著的商業(yè)變現(xiàn),各國(guó)政府紛紛減少了在人工智能領(lǐng)域的投入,導(dǎo)致AIGC未能取得重大突破。1.2.3AIGC的發(fā)展歷程沉淀積累階段(20世紀(jì)90年代中期~21世紀(jì)10年代中期)在這一階段,AIGC從實(shí)驗(yàn)性逐步向?qū)嵱眯赃^渡。2006年,深度學(xué)習(xí)算法取得重大突破。得益于同期圖形處理器(GPU)、張量處理器(TPU)等算力設(shè)備性能的不斷提升,以及互聯(lián)網(wǎng)推動(dòng)下數(shù)據(jù)規(guī)模的迅猛增長(zhǎng),各類人工智能算法獲得了海量訓(xùn)練數(shù)據(jù),人工智能發(fā)展因此取得了顯著進(jìn)步。然而,AIGC仍受限于算法瓶頸,創(chuàng)作任務(wù)完成效果不佳,應(yīng)用范圍有限,效果有待提升。2012年,微軟公開展示了一款全自動(dòng)同聲傳譯系統(tǒng),該系統(tǒng)基于深度神經(jīng)網(wǎng)絡(luò)(deepneuralnetworks,DNN),能夠自動(dòng)將英文演講內(nèi)容通過語(yǔ)音識(shí)別、語(yǔ)言翻譯、語(yǔ)音合成等技術(shù)轉(zhuǎn)換為中文語(yǔ)音。1.2.3AIGC的發(fā)展歷程3.快速發(fā)展階段(21世紀(jì)10年代中期~至今)2017年,為模仿美國(guó)作家杰克·凱魯亞克(JackKerouac)的小說《在路上》(OntheRoad),美國(guó)紐約大學(xué)人工智能研究員羅斯·古德溫(RossGoodwin)于3月啟動(dòng)了一項(xiàng)實(shí)驗(yàn)。他攜帶一臺(tái)連接了多種傳感器、安裝了人工智能程序的筆記本電腦,從紐約驅(qū)車前往新奧爾良(距離約2100公里)。在此過程中,該人工智能裝置將感知到的一切以文字形式記錄,最終出版了《1theRoad》一書,成為世界上首部由人工智能創(chuàng)作的實(shí)驗(yàn)小說。同年5月,微軟與湛廬文化合作推出了小冰原創(chuàng)詩(shī)集《陽(yáng)光失了玻璃窗》,這是人類歷史上首部由人工智能創(chuàng)作的詩(shī)集。詩(shī)集中不乏“樹影壓在秋天的報(bào)紙上,中間隔著一片夢(mèng)幻的海洋,我凝視著一池湖水的天空”這樣充滿意象的句子。1.2.3AIGC的發(fā)展歷程一位宇航員騎著馬2018年,英偉達(dá)發(fā)布了StyleGAN模型,能夠自動(dòng)生成圖片。至2022年5月,該模型已升級(jí)至第四代StyleGAN-XL,其生成的高分辨率圖片人眼難以辨認(rèn)真?zhèn)巍?021年,OpenAI推出了DALL-E,并于2022年發(fā)布了升級(jí)版DALL-E2,主要應(yīng)用于文本與圖像的交互生成內(nèi)容。用戶只需輸入簡(jiǎn)短的描述性文字,DALL-E2即可創(chuàng)作出相應(yīng)的高質(zhì)量卡通、寫實(shí)、抽象等風(fēng)格的繪畫。2019年,DeepMind發(fā)布了DVD-GAN模型,專用于生成連續(xù)視頻,在草場(chǎng)、廣場(chǎng)等特定場(chǎng)景下表現(xiàn)尤為突出。3.快速發(fā)展階段(21世紀(jì)10年代中期~至今)1.2.3AIGC的發(fā)展歷程3.快速發(fā)展階段(21世紀(jì)10年代中期~至今)2022年9月,Meta公司推出了Make-A-Video,這是一款基于人工智能的高質(zhì)量短視頻生成模型,堪稱視頻版的DALL-E,被形象地稱為“用嘴做視頻”。該模型能夠通過文本提示創(chuàng)建全新的視頻內(nèi)容,其核心技術(shù)同樣源自DALL-E等圖像生成器所采用的文本—圖像合成技術(shù)。緊隨其后的一周內(nèi),谷歌接連發(fā)布了兩款文本轉(zhuǎn)視頻工具——ImagenVideo與Phenaki。2022年11月,ChatGPT正式上線。這款能夠與用戶進(jìn)行文本交互、回答問題、提供建議、進(jìn)行閑聊的聊天機(jī)器人迅速在全球范圍內(nèi)走紅。到了2023年1月,ChatGPT的月活躍用戶人數(shù)已突破1億。2023年3月16日,百度在北京總部召開新聞發(fā)布會(huì),正式發(fā)布了新一代大語(yǔ)言模型的生成式人工智能產(chǎn)品——文心一言。發(fā)布會(huì)上,百度展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五大應(yīng)用場(chǎng)景中的卓越綜合能力。1.2.3AIGC的發(fā)展歷程2023年5月6日,科大訊飛正式發(fā)布訊飛星火認(rèn)知大模型,并開始不斷迭代。該模型具備七大核心能力,包括文本生成、語(yǔ)言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)能力、代碼能力及多模交互,直接對(duì)標(biāo)ChatGPT。值得驕傲的是,中國(guó)AI初創(chuàng)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司發(fā)布的DeepSeek模型也取得了顯著成就。2024年12月26日晚間,該公司宣布全新系列模型DeepSeek-V3首個(gè)版本上線并同步開源。2025年1月27日,DeepSeek-V3登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美國(guó)區(qū)下載榜上超越了ChatGPT。1.3機(jī)器學(xué)習(xí)與深度學(xué)習(xí)1.3機(jī)器學(xué)習(xí)與深度學(xué)習(xí)人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)與生成式人工智能人工智能的研究旨在賦予機(jī)器類似于人類的智能,而機(jī)器學(xué)習(xí)則專注于研究如何使機(jī)器具備學(xué)習(xí)能力,能夠模擬人類的學(xué)習(xí)行為,建立相應(yīng)的學(xué)習(xí)能力,從而實(shí)現(xiàn)對(duì)事物和事件的識(shí)別與判斷。這里的“機(jī)器”特指包含硬件和軟件的計(jì)算機(jī)系統(tǒng)。因此,機(jī)器學(xué)習(xí)不僅是人工智能的一個(gè)重要分支,更是其核心研究?jī)?nèi)容,是實(shí)現(xiàn)人工智能的關(guān)鍵途徑。在解決復(fù)雜問題的過程中,機(jī)器學(xué)習(xí)依賴于數(shù)據(jù),而深度學(xué)習(xí)在這一過程中扮演著至關(guān)重要的角色。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支,其核心在于利用人工神經(jīng)網(wǎng)絡(luò),尤其是深度神經(jīng)網(wǎng)絡(luò),模仿人腦處理信息的方式,提取和表示數(shù)據(jù)的特征,特別適合處理大規(guī)模數(shù)據(jù)集。生成式人工智能是深度學(xué)習(xí)的進(jìn)一步延伸,它借助強(qiáng)大的神經(jīng)網(wǎng)絡(luò)模型,能夠生成圖像、文字、音樂和視頻等全新的內(nèi)容。1.3.1機(jī)器學(xué)習(xí)

對(duì)比一下人類學(xué)習(xí)與機(jī)器學(xué)習(xí)的兩個(gè)過程,人類在成長(zhǎng)和生活的過程中積累了豐富的經(jīng)驗(yàn),通過對(duì)這些經(jīng)驗(yàn)進(jìn)行“歸納”,人們掌握了一系列生活的“規(guī)律”。在面對(duì)未知問題或需要對(duì)未來(lái)進(jìn)行“預(yù)測(cè)”時(shí),人們便會(huì)運(yùn)用這些“規(guī)律”來(lái)指導(dǎo)自己的生活和工作。機(jī)器學(xué)習(xí),就是使計(jì)算機(jī)具備類似人類的學(xué)習(xí)能力,能夠從數(shù)據(jù)中提煉信息,進(jìn)而掌握一定的規(guī)律,即“通過經(jīng)驗(yàn)來(lái)優(yōu)化系統(tǒng)自身的性能”。在計(jì)算機(jī)系統(tǒng)中,“經(jīng)驗(yàn)”通常以數(shù)據(jù)的形式呈現(xiàn)。機(jī)器通過數(shù)據(jù)學(xué)習(xí),并依據(jù)數(shù)據(jù)生成模型的算法。一旦擁有算法,只需輸入經(jīng)驗(yàn)數(shù)據(jù),機(jī)器便能基于這些數(shù)據(jù)構(gòu)建模型。在面對(duì)新情境時(shí),該模型能夠做出相應(yīng)的判斷和預(yù)測(cè)。1.3.1機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)中的“訓(xùn)練”與“預(yù)測(cè)”過程,恰與人類的“歸納”與“預(yù)測(cè)”過程相對(duì)應(yīng)。通過這種對(duì)應(yīng)關(guān)系,我們可以發(fā)現(xiàn),機(jī)器學(xué)習(xí)實(shí)際上是對(duì)人類在生活中學(xué)習(xí)成長(zhǎng)過程的一種模擬。機(jī)器學(xué)習(xí)作為計(jì)算機(jī)科學(xué)的一個(gè)重要子領(lǐng)域,同時(shí)也是人工智能的一個(gè)分支和實(shí)現(xiàn)途徑。它專注于研究如何讓機(jī)器模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,從而獲取新的知識(shí)或技能,并能夠重新組織已有的知識(shí)結(jié)構(gòu),不斷提升自身的性能。從技術(shù)實(shí)現(xiàn)的角度來(lái)看,機(jī)器學(xué)習(xí)通過算法與模型的設(shè)計(jì),使機(jī)器能夠從已有的訓(xùn)練數(shù)據(jù)集中自動(dòng)分析和習(xí)得規(guī)律(即模型與參數(shù)),進(jìn)而利用這些規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。不同的算法與模型在預(yù)測(cè)準(zhǔn)確率和運(yùn)算量上存在差異。機(jī)器學(xué)習(xí)的主要理論基礎(chǔ)涵蓋概率論、數(shù)理統(tǒng)計(jì)、線性代數(shù)、數(shù)學(xué)分析、數(shù)值逼近、最優(yōu)化理論和計(jì)算復(fù)雜理論等,其核心要素包括數(shù)據(jù)、算法和模型。1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)

機(jī)器學(xué)習(xí)根據(jù)數(shù)據(jù)是否具有標(biāo)簽,可分為四種類型:監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。當(dāng)數(shù)據(jù)全部帶有標(biāo)簽時(shí),稱為監(jiān)督學(xué)習(xí);數(shù)據(jù)完全無(wú)標(biāo)簽時(shí),稱為無(wú)監(jiān)督學(xué)習(xí);若部分?jǐn)?shù)據(jù)有標(biāo)簽,則屬于半監(jiān)督學(xué)習(xí)或強(qiáng)化學(xué)習(xí)。半監(jiān)督學(xué)習(xí)通過綜合運(yùn)用有標(biāo)簽和無(wú)標(biāo)簽的數(shù)據(jù),生成恰當(dāng)?shù)姆诸惡瘮?shù);而強(qiáng)化學(xué)習(xí)則是通過觀察反饋?zhàn)孕羞M(jìn)行學(xué)習(xí)。這幾種學(xué)習(xí)方式并無(wú)優(yōu)劣之分,主要區(qū)別在于它們適用的應(yīng)用場(chǎng)景不同。1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)1.監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)是指機(jī)器學(xué)習(xí)過程中使用的數(shù)據(jù)帶有標(biāo)記,這些標(biāo)記涵蓋數(shù)據(jù)類別、屬性及特征點(diǎn)位置等信息。其具體實(shí)現(xiàn)流程為:利用大量帶有標(biāo)記的數(shù)據(jù)對(duì)機(jī)器進(jìn)行訓(xùn)練,機(jī)器將生成的預(yù)測(cè)結(jié)果與期望結(jié)果進(jìn)行對(duì)比;根據(jù)對(duì)比結(jié)果調(diào)整模型參數(shù),再次輸出預(yù)測(cè)結(jié)果;重復(fù)此過程,不斷比對(duì)和調(diào)整,直至模型收斂,最終構(gòu)建出具備智能決策能力的模型。

例如,在訓(xùn)練機(jī)器識(shí)別“狗”的圖片時(shí),需先使用大量狗的圖片進(jìn)行訓(xùn)練,隨后將預(yù)測(cè)結(jié)果與期望結(jié)果進(jìn)行對(duì)比,以此評(píng)估模型性能。左圖展示了用于識(shí)別狗圖片的數(shù)據(jù)集。識(shí)別狗圖片的數(shù)據(jù)集1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)

無(wú)監(jiān)督學(xué)習(xí)常用于數(shù)據(jù)挖掘,旨在從大量無(wú)標(biāo)簽數(shù)據(jù)中發(fā)掘信息。其訓(xùn)練數(shù)據(jù)無(wú)標(biāo)簽,訓(xùn)練目標(biāo)是對(duì)觀察值無(wú)監(jiān)督學(xué)習(xí)應(yīng)能在沒有任何額外提示的情況下,處理貓和狗的圖片,不告知計(jì)算機(jī)哪些是貓哪些是狗,僅依據(jù)所有“貓、狗”圖片的特征,將它們從海量圖片中區(qū)分出來(lái)。

進(jìn)行分類或區(qū)分。在認(rèn)識(shí)世界的過程中,無(wú)監(jiān)督學(xué)習(xí)扮演著重要角色。例如,參觀畫展時(shí),每個(gè)人對(duì)藝術(shù)的理解各不相同,需要我們親自體會(huì)作品,尋找美的感覺。類比到機(jī)器學(xué)習(xí)中,我們所見的畫作即為輸入數(shù)據(jù),沒有人告訴我們哪些畫作更美。經(jīng)過大量觀賞,我們會(huì)形成自身的審美標(biāo)準(zhǔn),這相當(dāng)于通過眾多畫作找到了一個(gè)函數(shù)。下次面對(duì)新畫作時(shí),我們可以憑借自己的審美方式進(jìn)行評(píng)價(jià)。這一過程便是無(wú)監(jiān)督學(xué)習(xí)。2.無(wú)監(jiān)督學(xué)習(xí)1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)3.半監(jiān)督學(xué)習(xí)隨著大數(shù)據(jù)的迅猛發(fā)展,數(shù)據(jù)庫(kù)中的數(shù)據(jù)呈現(xiàn)出指數(shù)級(jí)增長(zhǎng)。獲取大量無(wú)標(biāo)記樣本變得相對(duì)容易,然而,獲取大量有標(biāo)記樣本卻困難得多,且人工標(biāo)注需要耗費(fèi)大量的人力和物力。我們可以輕松地收集到幾十萬(wàn)甚至上百萬(wàn)張關(guān)于桌子、椅子、書本和玩具的圖片,但要對(duì)每一張圖片都進(jìn)行標(biāo)簽標(biāo)注,明確哪張圖片是桌子,哪張是椅子,其代價(jià)極高,是一項(xiàng)既耗時(shí)又耗力的工作。在這種只有少量數(shù)據(jù)帶有標(biāo)簽的海量數(shù)據(jù)情況下,使用有監(jiān)督學(xué)習(xí)方法顯得非常不利。半監(jiān)督學(xué)習(xí)正是為解決上述問題而誕生的。其核心目的在于充分利用海量未帶標(biāo)簽的數(shù)據(jù),輔以少量帶標(biāo)簽數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,從而顯著增強(qiáng)計(jì)算機(jī)的學(xué)習(xí)能力。在訓(xùn)練階段,半監(jiān)督學(xué)習(xí)將大量無(wú)標(biāo)簽數(shù)據(jù)和少量標(biāo)簽數(shù)據(jù)相結(jié)合。盡管無(wú)標(biāo)簽數(shù)據(jù)無(wú)法直接提供類別信息,但其中蘊(yùn)含了豐富的數(shù)據(jù)分布規(guī)律,這些規(guī)律對(duì)模型學(xué)習(xí)具有積極的促進(jìn)作用。1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)4.強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)將學(xué)習(xí)過程視為一種試探與評(píng)價(jià)的循環(huán)。智能體首先選擇一個(gè)動(dòng)作用于環(huán)境,環(huán)境接受該動(dòng)作后狀態(tài)發(fā)生改變,并產(chǎn)生一個(gè)強(qiáng)化信號(hào)(獎(jiǎng)勵(lì)或懲罰)反饋給智能體。智能體根據(jù)強(qiáng)化信號(hào)和當(dāng)前環(huán)境狀態(tài)再選擇下一個(gè)動(dòng)作,其選擇原則是增加受到正強(qiáng)化(獎(jiǎng)勵(lì))的概率。所選擇的動(dòng)作不僅影響即時(shí)的強(qiáng)化值,還會(huì)影響環(huán)境下一時(shí)刻的狀態(tài)及最終的強(qiáng)化值,如左圖所示。

強(qiáng)化學(xué)習(xí)的模型1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)4.強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)主要包含智能體、環(huán)境、獎(jiǎng)勵(lì)和動(dòng)作四個(gè)基本元素,以及一個(gè)環(huán)境狀態(tài)。強(qiáng)化學(xué)習(xí)用于描述和解決智能體在與環(huán)境交互過程中,通過學(xué)習(xí)策略以實(shí)現(xiàn)回報(bào)最大化或達(dá)成特定目標(biāo)的問題。該領(lǐng)域的問題常在信息論、博弈論、自動(dòng)控制理論等學(xué)科中被廣泛討論,并被應(yīng)用于解釋有限理性條件下的平衡態(tài)、設(shè)計(jì)推薦系統(tǒng)和機(jī)器人交互系統(tǒng)。強(qiáng)化學(xué)習(xí)的基本原理在于,若智能體的某一行為策略引發(fā)了環(huán)境的正向獎(jiǎng)賞(即強(qiáng)化信號(hào)),那么智能體在未來(lái)采取這一行為策略的傾向便會(huì)增強(qiáng)。智能體的核心目標(biāo)是,在每個(gè)離散狀態(tài)中尋找最優(yōu)策略,以使期望的折扣獎(jiǎng)賞總和達(dá)到最大化。1.3.2監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)是一種帶有激勵(lì)機(jī)制的算法。若機(jī)器行為正確,則獲得“正激勵(lì)”;若行為錯(cuò)誤,則受到“負(fù)激勵(lì)”。在此機(jī)制下,機(jī)器會(huì)思考如何在特定環(huán)境中行動(dòng)以實(shí)現(xiàn)激勵(lì)最大化,這蘊(yùn)含了一定的動(dòng)態(tài)規(guī)劃思想。強(qiáng)化學(xué)習(xí)最為火爆且廣為人知的應(yīng)用案例是谷歌AlphaGo的升級(jí)版?AlphaGoZero。與AlphaGo不同,AlphaGoZero摒棄了先驗(yàn)知識(shí),無(wú)需人為設(shè)計(jì)特征,直接將棋盤上黑、白棋子的布局作為原始數(shù)據(jù)輸入模型,通過強(qiáng)化學(xué)習(xí)進(jìn)行自我博弈,不斷精進(jìn),最終出色完成下棋任務(wù)。AlphaGoZero的成功驗(yàn)證了在缺乏人類經(jīng)驗(yàn)指導(dǎo)下,強(qiáng)化學(xué)習(xí)依然能夠高效完成指定任務(wù)。1.3.3人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ANN)實(shí)質(zhì)上是對(duì)人類大腦生物神經(jīng)網(wǎng)絡(luò)的模擬。人類的神經(jīng)系統(tǒng)極為復(fù)雜,其基本構(gòu)成單元為神經(jīng)元。在成人的大腦中,大約存在1000

億個(gè)神經(jīng)元,這些神經(jīng)元相互連接,共同構(gòu)成了生物神經(jīng)網(wǎng)絡(luò)。在人工神經(jīng)網(wǎng)絡(luò)中,基本工作單元是人工神經(jīng)元,這些“神經(jīng)元”與其他“神經(jīng)元”相互連接。1.3.3人工神經(jīng)網(wǎng)絡(luò)1.神經(jīng)元神經(jīng)元是大腦處理信息的基本單元,以細(xì)胞體為主體,由眾多向周圍延伸的不規(guī)則樹枝狀纖維構(gòu)成的神經(jīng)細(xì)胞,如右圖所示。每個(gè)神經(jīng)元主要由細(xì)胞體(中央主體部分)、樹突(分布在細(xì)胞體的外周)和軸突(細(xì)胞體伸出的主軸)構(gòu)成。神經(jīng)元存在兩種狀態(tài):激活狀態(tài)和非激活狀態(tài)。在生物神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元彼此相互連接。當(dāng)神經(jīng)元處于激活狀態(tài)時(shí),它會(huì)向相連的神經(jīng)元釋放化學(xué)物質(zhì),進(jìn)而改變這些神經(jīng)元內(nèi)部的電位。若某神經(jīng)元的電位超過特定“閾值”,該神經(jīng)元將被激活,即進(jìn)入“興奮”狀態(tài),并向其他神經(jīng)元傳遞化學(xué)物質(zhì)。1.3.3人工神經(jīng)網(wǎng)絡(luò)2.神經(jīng)元模型人工神經(jīng)網(wǎng)絡(luò)的構(gòu)建始于對(duì)生物神經(jīng)系統(tǒng)神經(jīng)元的模擬。人工神經(jīng)元模型包括輸入、計(jì)算模塊和輸出三個(gè)主要部分。輸入部分可類比于生物神經(jīng)元的樹突,輸出部分則類似于生物神經(jīng)元的軸突,而計(jì)算模塊則對(duì)應(yīng)于生物神經(jīng)元的細(xì)胞體。

某些神經(jīng)元與少數(shù)相鄰神經(jīng)元進(jìn)行通信,而另一些神經(jīng)元?jiǎng)t與數(shù)千個(gè)神經(jīng)元共享信息。神經(jīng)元之間的連接和信息傳遞過程可以通過一般化模型來(lái)描述。1.3.3人工神經(jīng)網(wǎng)絡(luò)基于上述規(guī)律,1943年,美國(guó)心理學(xué)家麥卡洛克和數(shù)學(xué)家皮茨借鑒生物神經(jīng)元的結(jié)構(gòu),提出了人工神經(jīng)元的抽象數(shù)學(xué)模型?MP模型,如圖所示。一個(gè)典型的神經(jīng)元模型,該模型包含兩個(gè)輸入、兩個(gè)計(jì)算模塊(求和與非線性函數(shù))以及一個(gè)輸出。在MP模型中,非線性的激活函數(shù)是整個(gè)模型的核心組件。激活函數(shù)能夠?qū)訖?quán)的輸入進(jìn)行非線性組合,從而生成非線性決策邊界。簡(jiǎn)而言之,它將線性模型轉(zhuǎn)換為非線性模型,拓寬了應(yīng)用場(chǎng)景。MP模型1.3.3人工神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)上,激活函數(shù)的定義是:當(dāng)函數(shù)的自變量超過某個(gè)閾值時(shí),函數(shù)值等于1;否則,函數(shù)值等于0。以下是一個(gè)示例函數(shù):

MP模型中連接輸入與計(jì)算模塊的箭頭被稱為“連接”。每個(gè)連接上均附有一個(gè)“權(quán)值”,用于表示其權(quán)重。連接是神經(jīng)元結(jié)構(gòu)中的關(guān)鍵部分,每個(gè)連接都代表值的加權(quán)傳遞。MP模型的信息傳遞過程如下:神經(jīng)元接收來(lái)自其他神經(jīng)元的輸入信號(hào),這些輸入信號(hào)通過帶有權(quán)重的連接進(jìn)行傳遞。神經(jīng)元接收到的總輸入值將與神經(jīng)元的閾值進(jìn)行比較,隨后經(jīng)過“激活函數(shù)”的處理,產(chǎn)生神經(jīng)元的輸出。訓(xùn)練神經(jīng)網(wǎng)絡(luò)的核心任務(wù)是將權(quán)值調(diào)整至最佳狀態(tài),以優(yōu)化整個(gè)模型的效果。1.3.3人工神經(jīng)網(wǎng)絡(luò)3.感知機(jī)

通過研究指出,人腦神經(jīng)細(xì)胞連接的強(qiáng)度是可以變化的。基于此發(fā)現(xiàn),科學(xué)家們開始探索通過調(diào)整權(quán)值來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的方法,這為后續(xù)神經(jīng)網(wǎng)絡(luò)算法的發(fā)展奠定了基礎(chǔ)。1958年,計(jì)算科學(xué)家羅森布拉特提出了由兩層神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò),并將其命名為“感知機(jī)”。感知機(jī)由兩層神經(jīng)元構(gòu)成,結(jié)構(gòu)如圖所示。輸入層負(fù)責(zé)接收外界信號(hào),并將其傳遞至輸出層,而輸出層則由MP神經(jīng)元組成。感知機(jī)在原有MP模型的“輸入”位置增設(shè)了神經(jīng)元節(jié)點(diǎn),形成了“輸入單元”,其余部分保持不變。其工作原理與MP模型高度相似。對(duì)于每個(gè)屬性,均指定一個(gè)權(quán)重,通過計(jì)算屬性值與權(quán)重的乘積之和,并將結(jié)果與閾值進(jìn)行比較,從而判斷正負(fù)樣本。1.3.3人工神經(jīng)網(wǎng)絡(luò)其中,w、b為模型參數(shù),w為權(quán)值,b為偏置。wx表示w與x的內(nèi)積,sign為激活函數(shù)。感知機(jī)是一種相對(duì)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型,通常被稱為單層感知機(jī),它是深度學(xué)習(xí)領(lǐng)域中最基礎(chǔ)的模型之一。其主要用途是對(duì)外部輸入進(jìn)行分類,尤其適用于解決二分類問題,即結(jié)果僅為兩種可能(非負(fù)即正)的情況。例如,判斷一個(gè)同學(xué)的考試成績(jī)是否合格,或預(yù)測(cè)今天是否會(huì)下雨,這類僅存在“是”或“否”(正或負(fù))兩種答案的問題,均屬于二分類問題。這一過程可用以下函數(shù)表示:1.3.3人工神經(jīng)網(wǎng)絡(luò)兩層BP神經(jīng)網(wǎng)絡(luò)模型4.BP神經(jīng)網(wǎng)絡(luò)美國(guó)加州大學(xué)的魯梅爾哈特教授與杰弗里?辛頓教授等人提出了誤差反向傳播(BP)神經(jīng)網(wǎng)絡(luò)算法,徹底解決了兩層神經(jīng)網(wǎng)絡(luò)計(jì)算量問題,從而激發(fā)了業(yè)界對(duì)多層神經(jīng)網(wǎng)絡(luò)研究的熱潮。1BP神經(jīng)網(wǎng)絡(luò)在感知機(jī)的基礎(chǔ)上增加了一個(gè)隱藏層(見左圖)。BP神經(jīng)網(wǎng)絡(luò),即誤差反向傳播算法的學(xué)習(xí)過程,由信息的正向傳播和誤差的反向傳播兩個(gè)階段組成。2BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層構(gòu)成,每一層均由若干神經(jīng)元組成。相鄰層之間的神經(jīng)元實(shí)現(xiàn)全連接,即相鄰層的所有神經(jīng)元之間均存在連接,這種連接方式稱為全連接,而同一層內(nèi)的神經(jīng)元之間無(wú)連接。3(1)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)1.3.3人工神經(jīng)網(wǎng)絡(luò)01在輸入階段,負(fù)責(zé)將外部信息提供給網(wǎng)絡(luò)的部分統(tǒng)稱為“輸入層”。輸入層對(duì)輸入的信息不做任何處理,即輸入節(jié)點(diǎn)不執(zhí)行計(jì)算,僅負(fù)責(zé)將信息傳遞至隱藏層。輸入層0203隱藏層的節(jié)點(diǎn)與外界無(wú)直接聯(lián)系,猶如一個(gè)黑盒,因此得名“隱藏層”。隱藏層的神經(jīng)元負(fù)責(zé)執(zhí)行運(yùn)算,并將信息從輸入節(jié)點(diǎn)傳輸?shù)捷敵龉?jié)點(diǎn)。神經(jīng)網(wǎng)絡(luò)僅有一個(gè)輸入層和輸出層,但可以包含多個(gè)隱藏層。隱藏層輸出節(jié)點(diǎn)統(tǒng)稱為“輸出層”,負(fù)責(zé)計(jì)算并將信息從網(wǎng)絡(luò)輸出至外部。在正常情況下,多層神經(jīng)網(wǎng)絡(luò)的計(jì)算流程從數(shù)據(jù)進(jìn)入輸入層開始,輸入層將其傳遞到第一層隱藏層,然后經(jīng)過第一層神經(jīng)元的運(yùn)算(乘以權(quán)值,加上偏置,進(jìn)行一次激活函數(shù)運(yùn)算),得到輸出。接著,將第一層的輸出作為第二層的輸入,重復(fù)進(jìn)行運(yùn)算,直至所有隱藏層計(jì)算完畢,最后數(shù)據(jù)被輸出至輸出層進(jìn)行運(yùn)算,得到最終輸出結(jié)果。輸出層1.3.3人工神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的傳播過程左圖展示了一個(gè)包含兩個(gè)隱藏層的人工神經(jīng)網(wǎng)絡(luò)模型,輸入層輸入訓(xùn)練數(shù)據(jù),輸出層輸出計(jì)算結(jié)果,中間設(shè)有兩個(gè)隱藏層,使輸入數(shù)據(jù)逐層向前傳播至輸出層。從這一過程可以看出,對(duì)于多層神經(jīng)網(wǎng)絡(luò),需計(jì)算每個(gè)節(jié)點(diǎn)對(duì)其下一層節(jié)點(diǎn)的影響,求出各神經(jīng)元的權(quán)值和偏置參數(shù)值,以使輸出結(jié)果符合預(yù)期要求。計(jì)算輸出需從第一層向輸出層傳遞,該網(wǎng)絡(luò)為前向網(wǎng)絡(luò),即信息的正向傳播過程。而進(jìn)行學(xué)習(xí)調(diào)整權(quán)值時(shí),需從輸出層向第一層傳遞計(jì)算誤差,這一學(xué)習(xí)過程稱為誤差反向傳播(BP),因此該網(wǎng)絡(luò)也稱為BP網(wǎng)絡(luò)。BP網(wǎng)絡(luò)能夠精確計(jì)算誤差并調(diào)整權(quán)值,實(shí)現(xiàn)多層網(wǎng)絡(luò)的學(xué)習(xí),因而具備強(qiáng)大功能。根據(jù)相關(guān)證明,擁有兩個(gè)以上隱藏層的BP網(wǎng)絡(luò),能夠?qū)崿F(xiàn)輸入與輸出之間任意關(guān)系的映射。1.3.3人工神經(jīng)網(wǎng)絡(luò)信息的正向傳播:當(dāng)感知到外界信號(hào)時(shí),輸入層首先接收這些信號(hào),隨后將其傳遞給中間層的各個(gè)隱藏層。信息傳播的路徑依次為“輸入層—隱藏層—輸出層”。而“誤差的反向傳播”則發(fā)生在正向傳播結(jié)束后,若輸出結(jié)果與期望值存在偏差,BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)會(huì)將這一誤差值沿反向路徑傳導(dǎo),即信息傳輸路徑變?yōu)椤拜敵鰧印[藏層—輸入層”。在這一過程中,各個(gè)神經(jīng)節(jié)點(diǎn)會(huì)根據(jù)誤差值的大小調(diào)整自身的權(quán)值和閾值,最終實(shí)現(xiàn)傳播信息與期望值的一致。對(duì)于BP神經(jīng)網(wǎng)絡(luò)而言,其工作過程主要由“信息的正向傳播”和“誤差的反向傳播”兩個(gè)階段構(gòu)成。(2)BP神經(jīng)網(wǎng)絡(luò)算法1.3.3人工神經(jīng)網(wǎng)絡(luò)在誤差消減方面,BP神經(jīng)網(wǎng)絡(luò)展現(xiàn)出顯著的優(yōu)勢(shì)。通過誤差的反向傳播,能夠?qū)Ω鱾€(gè)節(jié)點(diǎn)進(jìn)行精準(zhǔn)的判定和修正。經(jīng)過修正后的節(jié)點(diǎn)權(quán)值,在后續(xù)的數(shù)據(jù)傳輸和計(jì)算過程中能夠確保較高的精準(zhǔn)度。然而,在實(shí)際應(yīng)用中,BP神經(jīng)網(wǎng)絡(luò)也暴露出一些不足之處。首先,在學(xué)習(xí)速率方面,BP神經(jīng)網(wǎng)絡(luò)的反應(yīng)頻率是固定的,面對(duì)復(fù)雜問題時(shí),往往需要更長(zhǎng)時(shí)間進(jìn)行讀取、學(xué)習(xí)和修正。其次,盡管BP算法能使節(jié)點(diǎn)權(quán)值收斂至一個(gè)穩(wěn)定值,但無(wú)法保證該值為全局最優(yōu)。這是因?yàn)樵谡麄€(gè)學(xué)習(xí)過程中,BP神經(jīng)網(wǎng)絡(luò)采用“梯度下降法”,可能導(dǎo)致最終收斂于“局部最優(yōu)”而非“全局最優(yōu)”。再次,人工神經(jīng)網(wǎng)絡(luò)中隱含的層數(shù)和單元數(shù)難以精確測(cè)量,目前缺乏有效的理論依據(jù)進(jìn)行測(cè)算。因此,針對(duì)人工網(wǎng)絡(luò)模型中的元素和變量,通常需通過反復(fù)實(shí)驗(yàn)和測(cè)算來(lái)確定,這使得網(wǎng)絡(luò)模型不可避免地包含冗余和無(wú)效因素,從而給BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程帶來(lái)額外負(fù)擔(dān)。1.3.3人工神經(jīng)網(wǎng)絡(luò)5.卷積神經(jīng)網(wǎng)絡(luò)(1)卷積神經(jīng)網(wǎng)絡(luò)的定義

卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN),顧名思義,是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入了卷積運(yùn)算。通過卷積核局部感知圖像信息,提取其特征,多層卷積后能夠提取出圖像的深層抽象特征,憑借這些特征實(shí)現(xiàn)更準(zhǔn)確的分類或預(yù)測(cè)。

與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,CNN具有局部感知、權(quán)值共享和多卷積核三大特點(diǎn)。局部感知是指卷積核與圖像卷積時(shí),每次僅覆蓋一小部分像素(即局部特征),而傳統(tǒng)神經(jīng)網(wǎng)絡(luò)則是整體處理,因此稱為局部感知;權(quán)值共享是CNN最顯著的特點(diǎn),這種結(jié)構(gòu)大幅減少了神經(jīng)網(wǎng)絡(luò)的參數(shù)量,既防止過擬合,又降低了模型復(fù)雜度;多卷積核能夠充分提取圖像特征,因?yàn)槊總€(gè)卷積核代表一種特征提取方式。1.3.3人工神經(jīng)網(wǎng)絡(luò)(2)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)是多層感知機(jī)的變體,其設(shè)計(jì)靈感來(lái)源于生物視覺神經(jīng)系統(tǒng)中神經(jīng)元的局部響應(yīng)特性。通過局部連接和權(quán)值共享,降低了模型的復(fù)雜度,極大減少了訓(xùn)練參數(shù),提高了訓(xùn)練速度,并在一定程度上增強(qiáng)了模型的泛化能力。CNN是目前眾多神經(jīng)網(wǎng)絡(luò)模型中研究最為活躍的一種。一個(gè)典型的CNN主要由卷積層、池化層和全連接層構(gòu)成。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)1.3.3人工神經(jīng)網(wǎng)絡(luò)1)卷積層。卷積運(yùn)算的核心目標(biāo)是從圖像中提取信息和特征。任何圖像均可視為一個(gè)數(shù)值矩陣,而矩陣中的特定數(shù)值組合則構(gòu)成一個(gè)特征。卷積運(yùn)算旨在掃描該矩陣,挖掘圖像中相關(guān)且可解釋的特征。卷積層的卷積過程如下:首先,選擇特定規(guī)格大小的卷積核,其數(shù)量由輸出圖像的通道數(shù)決定;其次,將卷積核按從左至右、從上至下的順序在二維數(shù)字圖像上進(jìn)行掃描,將卷積核上的數(shù)值與圖像對(duì)應(yīng)位置的像素值相乘并求和;最后,將計(jì)算結(jié)果作為卷積后相應(yīng)位置的像素值,從而生成卷積后的輸出圖像。2)池化和全連接。池化層,亦稱下采樣層,主要通過統(tǒng)計(jì)卷積生成的圖像特征,降低特征維度,減少網(wǎng)絡(luò)模型過擬合的風(fēng)險(xiǎn)。此外,池化操作能有效減小卷積圖像的尺寸,在保留主要特征的同時(shí),減少網(wǎng)絡(luò)結(jié)構(gòu)中的計(jì)算參數(shù),防止過擬合,提升模型的泛化能力。在卷積網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)中,通常在卷積層后接一個(gè)池化層。圖像經(jīng)過卷積和池化處理后,其關(guān)鍵特征得以提取。全連接層的作用是將這些特征進(jìn)行組合拼接,最終通過計(jì)算得出圖像被預(yù)測(cè)為某一類別的概率。1.3.4深度學(xué)習(xí)深度學(xué)習(xí)于1986年被研究人員引入機(jī)器學(xué)習(xí)領(lǐng)域,通常與深度神經(jīng)網(wǎng)絡(luò)密切相關(guān)。作為機(jī)器學(xué)習(xí)領(lǐng)域的新興技術(shù),深度學(xué)習(xí)的核心在于對(duì)數(shù)據(jù)進(jìn)行分層特征表示,通過神經(jīng)網(wǎng)絡(luò)將低級(jí)特征進(jìn)一步抽象為高級(jí)特征,是一種基于數(shù)據(jù)的表征學(xué)習(xí)方法。

深度學(xué)習(xí)有效克服了淺層學(xué)習(xí)的這一局限,通過構(gòu)建多隱藏層模型并利用海量訓(xùn)練數(shù)據(jù)(包括無(wú)標(biāo)簽數(shù)據(jù))來(lái)學(xué)習(xí)更有價(jià)值的特征,從而顯著提升分類或預(yù)測(cè)的準(zhǔn)確性?!吧疃饶P汀笔瞧鋵?shí)施手段,而“特征學(xué)習(xí)”則是其最終目的。左圖清晰展示了淺層學(xué)習(xí)網(wǎng)絡(luò)與深度學(xué)習(xí)網(wǎng)絡(luò)之間的差異。淺層學(xué)習(xí)網(wǎng)絡(luò)與深度學(xué)習(xí)網(wǎng)絡(luò)1.3.4深度學(xué)習(xí)1.深度學(xué)習(xí)與淺層學(xué)習(xí)相比1)深度學(xué)習(xí)強(qiáng)調(diào)模型結(jié)構(gòu)的深度,通常包含多層隱藏層節(jié)點(diǎn)。2)深度學(xué)習(xí)明確突出了特征學(xué)習(xí)的重要性,通過逐層特征變換,將樣本在原空間的特征表示轉(zhuǎn)換到一個(gè)新的特征空間,從而使分類或預(yù)測(cè)更加容易。

一般來(lái)說,典型的深度學(xué)習(xí)模型是指具有“多隱藏層”的神經(jīng)網(wǎng)絡(luò),這里的“多隱藏層”指的是擁有三個(gè)及以上隱藏層的網(wǎng)絡(luò)。隨著隱藏層數(shù)量的增加,相應(yīng)的神經(jīng)元連接權(quán)值、閾值等參數(shù)也會(huì)增多。深度學(xué)習(xí)模型通常包含8層、9層,甚至更多的隱藏層,這意味著它們可以自動(dòng)提取大量復(fù)雜的特征。過去,設(shè)計(jì)復(fù)雜模型時(shí)常常面臨訓(xùn)練效率低和易陷入過擬合的問題,但隨著云計(jì)算和大數(shù)據(jù)時(shí)代的到來(lái),海量的訓(xùn)練數(shù)據(jù)配合逐層預(yù)訓(xùn)練和誤差逆?zhèn)鞑ノ⒄{(diào)的方法,大幅提升了模型的訓(xùn)練效率,同時(shí)降低了過擬合的風(fēng)險(xiǎn)。1.3.4深度學(xué)習(xí)2.深度學(xué)習(xí)與機(jī)器學(xué)習(xí)相比具有以下三個(gè)顯著優(yōu)點(diǎn)。(1)高效率

相比之下,傳統(tǒng)的機(jī)器學(xué)習(xí)算法在處理原始數(shù)據(jù)時(shí)存在較大困難,通常需要人工從原始數(shù)據(jù)中提取特征。這意味著系統(tǒng)設(shè)計(jì)者必須對(duì)原始數(shù)據(jù)有相當(dāng)專業(yè)的理解;在獲得較好的特征表示后,還需設(shè)計(jì)相應(yīng)的分類器,利用這些特征進(jìn)行問題分類。而深度學(xué)習(xí)則是一種自動(dòng)提取特征的學(xué)習(xí)算法,通過多層次的非線性變換,它能夠?qū)⒊跏嫉摹暗讓印碧卣鞅硎巨D(zhuǎn)化為“高層”特征表示,進(jìn)而使用“簡(jiǎn)單模型”即可完成復(fù)雜的分類學(xué)習(xí)任務(wù)?,F(xiàn)有的深度學(xué)習(xí)技術(shù)無(wú)需考慮煩瑣的特征提取過程,一旦設(shè)計(jì)好網(wǎng)絡(luò)框架,便能高效解決問題。深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如右圖所示。多隱藏層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖1.3.4深度學(xué)習(xí)2.深度學(xué)習(xí)與機(jī)器學(xué)習(xí)相比(2)可塑性

在面對(duì)問題時(shí),傳統(tǒng)算法需重新編寫代碼才能調(diào)整模型,這種改進(jìn)方式成本高昂。相比之下,深度學(xué)習(xí)只需調(diào)整模型參數(shù),無(wú)需重寫代碼,即可達(dá)到近乎完美的效果,賦予程序高度的靈活性和成長(zhǎng)性。深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)算法的性能對(duì)比,詳見左圖。深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)算法性能對(duì)比1.3.4深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)通過持續(xù)的學(xué)習(xí),自動(dòng)構(gòu)建算法模型以應(yīng)對(duì)各類問題,因此幾乎能夠解決各種復(fù)雜挑戰(zhàn)。深度學(xué)習(xí)技術(shù)在當(dāng)前人工智能領(lǐng)域占據(jù)著絕對(duì)的領(lǐng)先地位。相較于傳統(tǒng)的機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)在某些領(lǐng)域展現(xiàn)出了最接近人類理想智能的效果。同時(shí),它正悄然融入人們的日常生活,例如刷臉支付、語(yǔ)音識(shí)別、智能翻譯、自動(dòng)駕駛以及棋類人機(jī)大戰(zhàn)等。0102(3)普適性1.4AIGC的應(yīng)用與安全挑戰(zhàn)1.4.1AIGC的應(yīng)用1.媒體與娛樂領(lǐng)域(1)新聞和內(nèi)容創(chuàng)作在新聞行業(yè),AIGC憑借其強(qiáng)大的數(shù)據(jù)處理能力,能夠迅速基于海量數(shù)據(jù)生成新聞報(bào)道。它能夠從新聞數(shù)據(jù)庫(kù)中提取事件信息,經(jīng)過高效算法處理,快速生成新聞稿件,從而大幅節(jié)省撰寫時(shí)間,提升新聞的即時(shí)性。在內(nèi)容創(chuàng)作方面,無(wú)論是編劇創(chuàng)作還是小說寫作,AIGC都能提供情節(jié)構(gòu)思的靈感,甚至完成初稿的創(chuàng)作。此外,它還能為創(chuàng)作者提供創(chuàng)作靈感或作為創(chuàng)作起點(diǎn),供進(jìn)一步修改和完善。AIGC還能根據(jù)不同的風(fēng)格要求,生成多樣化的版本,例如,依據(jù)讀者的喜好,創(chuàng)作科幻、言情等不同類型的小說故事。1.4.1AIGC的應(yīng)用(2)影視與游戲制作

在影視制作的前期階段,AIGC能夠生成虛擬場(chǎng)景和人物概念模型,輔助導(dǎo)演和攝影團(tuán)隊(duì)進(jìn)行場(chǎng)景和分鏡頭規(guī)劃,有效降低籌備成本。在電影特效制作中,尤其是涉及大量虛擬元素或超自然現(xiàn)象的表現(xiàn)時(shí),AIGC能夠生成高質(zhì)量的特效圖像和動(dòng)畫序列。對(duì)于游戲行業(yè),AIGC的應(yīng)用范圍廣泛,包括游戲劇情生成、非玩家角色(NPC)的智能交互邏輯設(shè)計(jì)以及游戲地圖的創(chuàng)建與優(yōu)化等,顯著提升游戲的可玩性和豐富性。此外,AIGC還能根據(jù)玩家的不同等級(jí)和游戲進(jìn)展,動(dòng)態(tài)調(diào)整游戲劇情和難度,為玩家?guī)?lái)更加個(gè)性化的游戲體驗(yàn)。1.4.1AIGC的應(yīng)用(2)智能教學(xué)資源創(chuàng)造(1)個(gè)性化學(xué)習(xí)計(jì)劃與輔導(dǎo)AIGC能夠通過分析學(xué)生的學(xué)習(xí)成績(jī)、學(xué)習(xí)習(xí)慣(如學(xué)習(xí)時(shí)間的分配、對(duì)錯(cuò)題類型的偏好)、學(xué)習(xí)興趣(基于對(duì)不同學(xué)科內(nèi)容的關(guān)注和交互程度)等多維度數(shù)據(jù)信息,為每位學(xué)生量身定制個(gè)性化學(xué)習(xí)計(jì)劃。當(dāng)學(xué)生遇到學(xué)習(xí)難題時(shí),AIGC會(huì)根據(jù)學(xué)生當(dāng)前的知識(shí)水平,以淺顯易懂的方式提供相應(yīng)的解答步驟和詳細(xì)解釋,如同配備了一位專屬的人工智能輔導(dǎo)老師。AIGC可以根據(jù)教學(xué)大綱和目標(biāo),創(chuàng)造多樣化的教學(xué)資源。例如,生成圖文并茂、生動(dòng)有趣的教學(xué)課件,將理論知識(shí)以直觀的形式展示;還能創(chuàng)作教學(xué)動(dòng)畫,通過動(dòng)畫角色的對(duì)話和演示過程,幫助學(xué)生更好地理解復(fù)雜概念,如物理中的微觀粒子運(yùn)動(dòng)、化學(xué)中的分子結(jié)構(gòu)等。這對(duì)于緩解師資力量不均衡、教學(xué)資源短缺等教育實(shí)際問題具有顯著的輔助作用。2.教育領(lǐng)域02011.4.1AIGC的應(yīng)用(2)醫(yī)學(xué)研究協(xié)助(1)輔助診斷與治療方案制定AIGC通過學(xué)習(xí)大量醫(yī)療病例數(shù)據(jù),包括病歷文本和醫(yī)學(xué)影像等,能夠有效輔助醫(yī)生進(jìn)行疾病診斷。例如,在識(shí)別醫(yī)學(xué)影像中的病變特征時(shí),AIGC可根據(jù)預(yù)訓(xùn)練模型提示潛在病變區(qū)域,協(xié)助醫(yī)生做出更精準(zhǔn)的診斷。在治療方案制定方面,AIGC能依據(jù)不同病情的案例經(jīng)驗(yàn)和最新醫(yī)學(xué)研究成果,提供多種治療方案建議,并預(yù)估每種方案的成功率和風(fēng)險(xiǎn),為醫(yī)生的最終決策提供有力參考。在醫(yī)學(xué)研究中,AIGC可用于文獻(xiàn)綜述的撰寫。鑒于醫(yī)藥科研需整合大量研究論文資料,AIGC能高效地對(duì)海量論文進(jìn)行分析和總結(jié),提煉關(guān)鍵信息,為科研人員節(jié)省大量文獻(xiàn)閱讀和整理時(shí)間。同時(shí),在藥物研發(fā)階段,AIGC可模擬藥物分子與人體細(xì)胞的相互作用,預(yù)測(cè)藥物效果和副作用,從而加速藥物研發(fā)進(jìn)程。3.醫(yī)療領(lǐng)域02011.4.1AIGC的應(yīng)用(2)精準(zhǔn)營(yíng)銷與個(gè)性化推薦(1)客戶服務(wù)自動(dòng)化AIGC技術(shù)在智能客服領(lǐng)域的應(yīng)用,能夠顯著提升客戶服務(wù)的效率與質(zhì)量。智能客服借助自然語(yǔ)言處理技術(shù),準(zhǔn)確理解客戶問題,而AIGC則依托預(yù)訓(xùn)練模型,為客戶提供迅速且精準(zhǔn)的解答和解決方案。該系統(tǒng)可7天24小時(shí)不間斷運(yùn)行,高效應(yīng)對(duì)常見問題,并在必要時(shí)將復(fù)雜問題轉(zhuǎn)交人工客服處理,既降低了企業(yè)的人力成本,又確保了服務(wù)的優(yōu)質(zhì)與及時(shí)性?;贏IGC技術(shù),企業(yè)能夠深入分析消費(fèi)者的行為數(shù)據(jù)(如購(gòu)買歷史、瀏覽歷史、收藏偏好等)和社會(huì)屬性數(shù)據(jù)(如年齡、性別、地域等),從而制定出精準(zhǔn)的營(yíng)銷策略。例如,針對(duì)不同類型的消費(fèi)者,精準(zhǔn)推送符合其需求和興趣的廣告內(nèi)容;或在電商平臺(tái)上為用戶生成個(gè)性化的商品推薦列表,有效提升商品的點(diǎn)擊率和購(gòu)買轉(zhuǎn)化率,進(jìn)而增加企業(yè)的商業(yè)收益。4.商業(yè)與營(yíng)銷領(lǐng)域02011.4.2AIGC的發(fā)展方向1.多模態(tài)內(nèi)容生成多模態(tài)內(nèi)容生成將成為AIGC未來(lái)發(fā)展的核心方向。這表明AIGC將整合文本、圖像、音頻和視頻等多種內(nèi)容形式,創(chuàng)造出更為豐富和多樣化的內(nèi)容。例如,生成一個(gè)完整的多媒體故事,不僅包含文字?jǐn)⑹銮楣?jié)發(fā)展,還輔以圖像插圖展示關(guān)鍵場(chǎng)景,并配合音頻解說以增強(qiáng)氛圍。這樣的多模態(tài)內(nèi)容相較于單一形式的內(nèi)容,更能全方位吸引受眾,在教育領(lǐng)域可用于制作生動(dòng)易懂的教學(xué)課件,在娛樂領(lǐng)域則能打造沉浸式的故事體驗(yàn)。2.個(gè)性化內(nèi)容生成隨著用戶需求的多樣化和個(gè)性化趨勢(shì),AIGC技術(shù)將愈發(fā)專注于個(gè)性化內(nèi)容的生成。通過分析用戶的偏好和行為數(shù)據(jù),構(gòu)建用戶興趣模型,從而生成符合每個(gè)用戶個(gè)人口味和需求的特定內(nèi)容。例如,在音樂推薦系統(tǒng)中,AIGC不僅能依據(jù)用戶的音樂收聽歷史推薦相似風(fēng)格的音樂,還能創(chuàng)作全新的音樂作品,以滿足用戶個(gè)性化的音樂需求,進(jìn)一步提升用戶體驗(yàn)的滿意度和忠誠(chéng)度。1.4.2AIGC的發(fā)展方向3.實(shí)時(shí)生成與互動(dòng)未來(lái)的AIGC技術(shù)將具備更強(qiáng)的實(shí)時(shí)生成和互動(dòng)能力。在廣告場(chǎng)景中,可生成實(shí)時(shí)動(dòng)態(tài)廣告,根據(jù)用戶的實(shí)時(shí)反饋(如點(diǎn)擊、停留時(shí)間等操作)及時(shí)調(diào)整廣告內(nèi)容,以優(yōu)化投放效果。在虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)環(huán)境中,AIGC能夠持續(xù)生成互動(dòng)場(chǎng)景和角色,為用戶提供高度個(gè)性化且緊密互動(dòng)的體驗(yàn)。這對(duì)于游戲、培訓(xùn)模擬等場(chǎng)景而言,將帶來(lái)革命性變革,使參與者能夠更自然地與虛擬環(huán)境互動(dòng),提升參與度和沉浸感。4.成為增強(qiáng)創(chuàng)作工具AIGC技術(shù)還將進(jìn)一步演化為增強(qiáng)創(chuàng)作工具,助力內(nèi)容創(chuàng)作者提升創(chuàng)作效率和質(zhì)量。例如,智能推薦功能可在創(chuàng)作者輸入開頭時(shí),根據(jù)上下文推薦可能的情節(jié)發(fā)展或詞匯用法;自動(dòng)修正功能可幫助創(chuàng)作者檢測(cè)語(yǔ)法、邏輯等方面的錯(cuò)誤;創(chuàng)意生成功能則能從廣泛的知識(shí)圖譜中提取靈感元素,為創(chuàng)作者提供全新的創(chuàng)意思路。這對(duì)于支持多種內(nèi)容形式的創(chuàng)作(無(wú)論是文本創(chuàng)作、圖像繪制、音頻制作還是視頻剪輯)都具有極大價(jià)值,能使創(chuàng)作過程更加流暢高效,輸出的內(nèi)容更加優(yōu)質(zhì)。1.4.3AIGC風(fēng)險(xiǎn)挑戰(zhàn)1.內(nèi)容安全風(fēng)險(xiǎn)AIGC技術(shù)普及帶來(lái)內(nèi)容質(zhì)量、虛幻性和偏見問題。內(nèi)容準(zhǔn)確性和安全性是關(guān)鍵風(fēng)險(xiǎn)。算法局限和數(shù)據(jù)不完善導(dǎo)致AIGC內(nèi)容常有錯(cuò)誤和混亂,影響用戶體驗(yàn),可能誤導(dǎo)公眾。模型的局限性導(dǎo)致編造不實(shí)內(nèi)容,影響用戶價(jià)值觀。AIGC內(nèi)容偏見問題,反映算法和數(shù)據(jù)源偏見,可能加劇社會(huì)不公和歧視,引發(fā)爭(zhēng)議。2.知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)AIGC技術(shù)能快速生成大量?jī)?nèi)容,但可能無(wú)意中侵犯知識(shí)產(chǎn)權(quán),因?yàn)樗狈θ祟惖膭?chuàng)造性和判斷力。AI創(chuàng)作引發(fā)的知識(shí)產(chǎn)權(quán)問題包括:訓(xùn)練數(shù)據(jù)可能侵犯版權(quán),以及AI生成內(nèi)容的版權(quán)保護(hù)存在爭(zhēng)議。當(dāng)前法律尚未完全適應(yīng)AIGC技術(shù),導(dǎo)致法律空白和風(fēng)險(xiǎn)。例如,AI繪畫工具使用的數(shù)據(jù)集可能包含受版權(quán)保護(hù)的作品,未經(jīng)授權(quán)使用可能侵權(quán)。AI服務(wù)提供方通常限制AI作品的版權(quán)歸屬和商業(yè)使用權(quán),用戶需遵守用戶協(xié)議,避免不當(dāng)使用。1.4.3AIGC風(fēng)險(xiǎn)挑戰(zhàn)3.道德倫理與法律風(fēng)險(xiǎn)AI創(chuàng)作提高了效率,但帶來(lái)了道德和法律問題。AI可能影響人類倫理和價(jià)值,生成內(nèi)容雖逼真,卻可能包含錯(cuò)誤或有害信息。由于語(yǔ)言模型難以區(qū)分事實(shí)與虛構(gòu),可能導(dǎo)致倫理判斷受損。此外,AI技術(shù)易被濫用,用于不當(dāng)目的,如抄襲、惡搞,甚至威脅安全和公共利益。AIGC生成的信息可能違反社會(huì)規(guī)范,需要制定倫理和社會(huì)規(guī)范框架來(lái)引導(dǎo)其健康發(fā)展,同時(shí)保護(hù)知識(shí)產(chǎn)權(quán)和公眾利益。4.數(shù)據(jù)處理、隱私與安全風(fēng)險(xiǎn)保護(hù)用戶隱私的關(guān)鍵在于合規(guī)的數(shù)據(jù)處理。以ChatGPT為例,其訓(xùn)練和應(yīng)用階段涉及大量數(shù)據(jù)處理,數(shù)據(jù)質(zhì)量直接影響模型成熟度和內(nèi)容質(zhì)量。目前,數(shù)據(jù)收集階段的風(fēng)險(xiǎn)較大,需確保個(gè)人信息處理的合法性、正當(dāng)性和必要性。數(shù)據(jù)清洗和標(biāo)注階段要減少個(gè)人信息和敏感信息,降低風(fēng)險(xiǎn)。1.4.3AIGC風(fēng)險(xiǎn)挑戰(zhàn)5其他技術(shù)風(fēng)險(xiǎn)鑒于技術(shù)迭代迅猛,AIGC仍面臨諸多不可預(yù)知的風(fēng)險(xiǎn),這些風(fēng)險(xiǎn)往往在使用過程中才得以充分暴露。因此,企業(yè)在應(yīng)用AIGC技術(shù)時(shí)需持謹(jǐn)慎態(tài)度,在技術(shù)演進(jìn)過程中持續(xù)完善安全措施,強(qiáng)化監(jiān)管力度,并提升透明度,力求最大限度地降低潛在風(fēng)險(xiǎn)的發(fā)生概率,確保AIGC技術(shù)的健康發(fā)展,保障用戶的安全與權(quán)益,最終實(shí)現(xiàn)科技與人類社會(huì)的和諧共進(jìn)。1.4.4AIGC監(jiān)管政策

美國(guó)提出人工智能技術(shù)五大原則2022年發(fā)布的《人工智能權(quán)利法案藍(lán)圖:讓自動(dòng)化系統(tǒng)為美國(guó)人民服務(wù)》針對(duì)大數(shù)據(jù)和人工智能技術(shù)的影響,提出了五大原則,具體如下:1立安全有效的系統(tǒng)原則;2免大數(shù)據(jù)算法歧視原則;3護(hù)數(shù)據(jù)隱私原則;4持通知和解釋的原則;5持可替代性原則。2023年4月,美國(guó)商務(wù)部國(guó)家電信與信息管理局發(fā)布《人工智能問責(zé)政策征求意見稿》,就ChatGPT等人工智能工具是否需接受審查、新人工智能模型發(fā)布前是否應(yīng)經(jīng)過認(rèn)證程序等問題征詢意見。該征求意見稿涵蓋人工智能審計(jì)、風(fēng)險(xiǎn)評(píng)估、認(rèn)證等內(nèi)容,旨在構(gòu)建合法、有效、可信的人工智能系統(tǒng)。1.4.4AIGC監(jiān)管政策2.英國(guó)發(fā)布人工智能新監(jiān)管框架提案

2023年3月底,英國(guó)政府發(fā)布《一種支持創(chuàng)新的人工智能監(jiān)管方法》新監(jiān)管框架提案,旨在“營(yíng)造清晰、有利于創(chuàng)新的監(jiān)管環(huán)境”,使英國(guó)成為全球建立基礎(chǔ)人工智能公司的優(yōu)選地之一。同時(shí),該提案明確要求在不損害安全或隱私的前提下推進(jìn)創(chuàng)新。具體而言,英國(guó)針對(duì)人工智能領(lǐng)域的監(jiān)管框架主要基于五大關(guān)鍵原則:1)安全、保障和穩(wěn)健性,確保人工智能系統(tǒng)在整個(gè)生命周期內(nèi)穩(wěn)健、可靠且安全運(yùn)行;2)適當(dāng)?shù)耐该鞫群涂山忉屝裕WC人工智能系統(tǒng)得到合理解釋并保持足夠透明;3)公平性,避免人工智能系統(tǒng)損害個(gè)人或組織的合法權(quán)益,防止歧視或不公平市場(chǎng)結(jié)果;4)問責(zé)制和有效治理,確保人工智能系統(tǒng)受到有效監(jiān)督,并建立明確的問責(zé)機(jī)制;可競(jìng)爭(zhēng)性和補(bǔ)救,允許當(dāng)事方對(duì)可能產(chǎn)生有害結(jié)果的人工智能工具提出異議。1.4.4AIGC監(jiān)管政策3.歐盟發(fā)布《人工智能法案》草案

該草案依據(jù)不同風(fēng)險(xiǎn)等級(jí)對(duì)人工智能應(yīng)用進(jìn)行分類監(jiān)管。一方面,多數(shù)人工智能應(yīng)用將被歸為低風(fēng)險(xiǎn)類別,無(wú)需承擔(dān)法律義務(wù);另一方面,少數(shù)存在不可接受風(fēng)險(xiǎn)的應(yīng)用將被直接禁止使用。介于低風(fēng)險(xiǎn)和禁止使用之間的是第三類應(yīng)用,即存在明確潛在安全風(fēng)險(xiǎn)但可管理的應(yīng)用。

此外,歐盟議會(huì)針對(duì)大模型提出更嚴(yán)格的監(jiān)管要求,具體包括:1)版權(quán)信息披露,要求模型開發(fā)商披露構(gòu)建系統(tǒng)時(shí)使用的所有材料的版權(quán)信息。2)公平競(jìng)爭(zhēng),禁止生成式人工智能模型提供方單方面對(duì)中小企業(yè)和初創(chuàng)企業(yè)施加不公平合同義務(wù)。3)保障合法權(quán)利,確保隱私、非歧視等基本權(quán)利。4)降低風(fēng)險(xiǎn),模型發(fā)布前需在獨(dú)立專家參與下進(jìn)行風(fēng)險(xiǎn)評(píng)估。1.4.4AIGC監(jiān)管政策4.我國(guó)發(fā)布《生成式人工智能服務(wù)管理暫行辦法》

2023年7月,中國(guó)發(fā)布了首部針對(duì)生成式人工智能產(chǎn)業(yè)的規(guī)范性政策?《生成式人工智能服務(wù)管理暫行辦法》,包含24條內(nèi)容,涵蓋算法備案、數(shù)據(jù)、模型、隱私保護(hù)、監(jiān)管和法律責(zé)任等方面。該政策旨在促進(jìn)生成式人工智能的健康發(fā)展,維護(hù)國(guó)家安全和社會(huì)公共利益,同時(shí)保障合法權(quán)益。政策鼓勵(lì)技術(shù)創(chuàng)新和應(yīng)用,同時(shí)要求服務(wù)提供者遵守法律法規(guī),尊重知識(shí)產(chǎn)權(quán),保護(hù)個(gè)人隱私,并建立投訴舉報(bào)機(jī)制。此外,數(shù)據(jù)處理活動(dòng)必須合法,使用數(shù)據(jù)需獲得同意或符合法定條件,并提高數(shù)據(jù)質(zhì)量。通過這些措施,政策旨在推動(dòng)技術(shù)的健康有序發(fā)展,服務(wù)于經(jīng)濟(jì)社會(huì),同時(shí)防范風(fēng)險(xiǎn),確保在法治框架內(nèi)運(yùn)行。拓展閱讀幾位人工智能的奠基人拓展閱讀

1.約翰?麥卡錫

約翰?麥卡錫于1927年9月4日出生在美國(guó)波士頓。1956年,在達(dá)特茅斯會(huì)議上,他首次提出了“人工智能”這一概念,因此被譽(yù)為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論