版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第1版·微課版生成式人工智能基礎(chǔ)第1章人工智能基礎(chǔ)本章介紹人工智能(AI)基礎(chǔ)知識(shí),追溯計(jì)算機(jī)從人力計(jì)算到現(xiàn)代電子計(jì)算機(jī)的發(fā)展歷程。課文介紹了大數(shù)據(jù)的特征,包括數(shù)量、多樣性、速度和真實(shí)性,以及它在各個(gè)領(lǐng)域的廣泛應(yīng)用和價(jià)值。進(jìn)一步闡述了AI的目標(biāo)、圖靈測試及其發(fā)展,區(qū)分強(qiáng)AI、弱AI和實(shí)用型AI,并探討它們的特點(diǎn)和應(yīng)用。課文還重點(diǎn)介紹了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的定義、類型、特點(diǎn)及應(yīng)用,通過具體示例展示這些技術(shù)如何解決實(shí)際問題,討論兩者之間的關(guān)系,指出它們在現(xiàn)代AI發(fā)展中的互補(bǔ)作用以及未來交叉融合的趨勢。第1章人工智能基礎(chǔ)01計(jì)算機(jī)的淵源02大數(shù)據(jù)基礎(chǔ)03AI時(shí)代04機(jī)器學(xué)習(xí)與深度學(xué)習(xí)目錄/CONTENTSPART01計(jì)算機(jī)的淵源20世紀(jì)40年代的時(shí)候還沒有“計(jì)算機(jī)(Computer)”這個(gè)詞,它原本指的是做計(jì)算的人。這些計(jì)算員在桌子前一坐就是一整天,面對一張紙、一份打印的指導(dǎo)手冊,可能還有一臺(tái)機(jī)械加法機(jī),按照指令一步步地費(fèi)力工作,并且足夠仔細(xì),最后可能得出一個(gè)正確結(jié)果。1.1計(jì)算機(jī)的淵源面對全球沖突,一幫數(shù)學(xué)家開始致力于快速解決復(fù)雜數(shù)學(xué)問題。沖突雙方都會(huì)通過無線電發(fā)送命令和戰(zhàn)略信息,為了防止信息可能被敵方截獲而泄露,軍方會(huì)對信號(hào)進(jìn)行加密,而能否破解敵方的密碼則關(guān)乎著成百上千人的性命,顯然,自動(dòng)化破解會(huì)大有裨益。1.1計(jì)算機(jī)的淵源到第二次世界大戰(zhàn)結(jié)束時(shí),人們已經(jīng)制造出兩臺(tái)機(jī)器,它們可以被看做是現(xiàn)代計(jì)算機(jī)的源頭。一臺(tái)是美國的電子數(shù)字積分計(jì)算機(jī)(ENIAC),它被譽(yù)為世界上第一臺(tái)通用電子數(shù)字計(jì)算機(jī),另一臺(tái)是英國的巨人計(jì)算機(jī)(Colossus)。這些計(jì)算機(jī)在配置新任務(wù)時(shí)需要移動(dòng)連線和推動(dòng)開關(guān)等一系列操作。圖1-1世界上第一臺(tái)通用計(jì)算機(jī)ENIAC1.1計(jì)算機(jī)的淵源今天,計(jì)算機(jī)幾乎存在于所有的電子設(shè)備當(dāng)中,這通常只是因?yàn)樗绕渌x項(xiàng)都要便宜。例如普通的烤面包機(jī)本來并不需要計(jì)算機(jī),但比起采用亂七八糟一堆組件,只用一個(gè)簡單的成分就可以實(shí)現(xiàn)所有功能還是比較劃算的。這類專用的計(jì)算機(jī)運(yùn)行速度不同、體積大小不一,但從根本上講,它們的功用是一樣的。事實(shí)上,這類計(jì)算機(jī)大部分只在工廠進(jìn)行一次編程,這樣做是為了對運(yùn)行的程序進(jìn)行加密,同時(shí)降低可能因改編程序引起的售后服務(wù)成本。1.1.1通用計(jì)算機(jī)機(jī)器人其實(shí)就是配有諸如手臂和輪子這樣的幫助其與外部環(huán)境進(jìn)行交互的特殊外圍設(shè)備的電子設(shè)備。機(jī)器人內(nèi)部的計(jì)算機(jī)能夠運(yùn)行程序,它的攝像頭拍攝物體影像后,相關(guān)程序通過照片就可以對影像進(jìn)行區(qū)分,以此幫助機(jī)器人在現(xiàn)實(shí)環(huán)境中辨認(rèn)物體。1.1.1通用計(jì)算機(jī)人們玩計(jì)算機(jī)游戲、用計(jì)算機(jī)寫文章、在線購物、聽音樂或者通過社交媒體與朋友聯(lián)系。計(jì)算機(jī)被用于預(yù)測天氣、設(shè)計(jì)飛機(jī)、制作電影、經(jīng)營企業(yè)、完成金融交易和控制工廠等。作為一種通用的信息處理機(jī)器,電子計(jì)算機(jī)又被稱為電腦,它能夠執(zhí)行被詳細(xì)描述的任何過程,其中用于描述解決特定問題的步驟序列稱為算法,算法可以變成軟件(程序),確定硬件(物理機(jī))能做什么和做了什么。創(chuàng)建軟件的過程稱為編程。1.1.1通用計(jì)算機(jī)但是,計(jì)算機(jī)到底是什么機(jī)器?一個(gè)計(jì)算設(shè)備怎么能執(zhí)行這么多不同的任務(wù)呢?現(xiàn)代計(jì)算機(jī)可以被定義為“在可改變的程序的控制下,存儲(chǔ)和操縱信息的機(jī)器”。該定義有兩個(gè)關(guān)鍵要素:第一,計(jì)算機(jī)是用于操縱信息的設(shè)備。這意味著可以將信息存入計(jì)算機(jī),計(jì)算機(jī)將信息轉(zhuǎn)換為新的、有用的形式,然后顯示或以其他方式輸出信息。第二,計(jì)算機(jī)在可改變的程序的控制下運(yùn)行。1.1.2計(jì)算機(jī)的定義計(jì)算機(jī)不是唯一能操縱信息的機(jī)器。當(dāng)你用簡單的計(jì)算器來運(yùn)算一組數(shù)字時(shí),就是在輸入信息(數(shù)字),處理信息(如計(jì)算連續(xù)的總和),然后輸出信息(如顯示)。另一個(gè)簡單的例子是油泵,給油箱加油時(shí),油泵利用當(dāng)前每升汽油的價(jià)格和來自傳感器的信號(hào),讀取汽油流入油箱的速率,并將這些數(shù)據(jù)轉(zhuǎn)換為加了多少汽油和應(yīng)付多少錢的信息。但是,計(jì)算器或油泵并不是完整的計(jì)算機(jī),它們只是被構(gòu)建來執(zhí)行特定的任務(wù)。1.1.2計(jì)算機(jī)的定義在計(jì)算機(jī)的幫助下,人們可以設(shè)計(jì)出更有表現(xiàn)力、更加優(yōu)雅的語言,并指示機(jī)器將其翻譯為讀取—執(zhí)行周期能夠理解的模式。計(jì)算機(jī)科學(xué)家常常會(huì)談及建立某個(gè)過程或物體的模型,這里的“模型”是一個(gè)數(shù)學(xué)術(shù)語,意思是寫出事件運(yùn)作的所有方程式并進(jìn)行計(jì)算,這樣就可以在沒有真實(shí)模型的情況下完成實(shí)驗(yàn)測試。由于計(jì)算機(jī)運(yùn)行十分迅速,因此,與真正的實(shí)驗(yàn)操作相比,計(jì)算機(jī)建模能夠更快地得出答案。1.1.2計(jì)算機(jī)的定義PART02大數(shù)據(jù)基礎(chǔ)信息社會(huì)所帶來的好處是顯而易見的:每個(gè)人口袋里都揣著一部手機(jī),每臺(tái)辦公桌上都放著一臺(tái)電腦,每間辦公室內(nèi)都連接到局域網(wǎng)或者互聯(lián)網(wǎng)。半個(gè)世紀(jì)以來,隨著計(jì)算機(jī)技術(shù)全面和深度地融入社會(huì)生活,信息爆炸已經(jīng)積累到了一個(gè)引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息總量的變化還導(dǎo)致了信息形態(tài)的變化——量變引起了質(zhì)變。1.2大數(shù)據(jù)基礎(chǔ)有趣的是,早在2007年就有一項(xiàng)研究指出,只有7%是存儲(chǔ)在報(bào)紙、書籍、圖片等媒介上的模擬數(shù)據(jù),其余全部是數(shù)字?jǐn)?shù)據(jù)。模擬數(shù)據(jù)也稱為模擬量,相對于數(shù)字量而言,指的是取值范圍是連續(xù)的變量或者數(shù)值,例如聲音、圖像、溫度、壓力等。模擬數(shù)據(jù)一般采用模擬信號(hào),例如用一系列連續(xù)變化的電磁波或電壓信號(hào)來表示。數(shù)字?jǐn)?shù)據(jù)也稱為數(shù)字量,相對模擬量而言,指的是取值范圍是離散的變量或者數(shù)值。數(shù)字?jǐn)?shù)據(jù)采用數(shù)字信號(hào),例如用一系列斷續(xù)變化的電壓脈沖(如用恒定的正電壓表示二進(jìn)制數(shù)1,用恒定的負(fù)電壓表示二進(jìn)制數(shù)0)或光脈沖來表示。1.2大數(shù)據(jù)基礎(chǔ)人類存儲(chǔ)信息量的增長速度比世界經(jīng)濟(jì)的增長速度快4倍,而計(jì)算機(jī)數(shù)據(jù)處理能力的增長速度則比世界經(jīng)濟(jì)的增長速度快9倍。難怪人們會(huì)抱怨信息過量,因?yàn)槊總€(gè)人都受到了這種極速發(fā)展的沖擊。大數(shù)據(jù)的科學(xué)價(jià)值和社會(huì)價(jià)值正是體現(xiàn)在這里。一方面,對大數(shù)據(jù)的掌握程度可以轉(zhuǎn)化為經(jīng)濟(jì)價(jià)值的來源。另一方面,大數(shù)據(jù)已經(jīng)撼動(dòng)了世界的方方面面,從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟(jì)、人文以及社會(huì)的其他各個(gè)領(lǐng)域。盡管我們還處在大數(shù)據(jù)時(shí)代的初期,但我們的日常生活已經(jīng)離不開它了。1.2大數(shù)據(jù)基礎(chǔ)以前,一旦達(dá)成了收集的目的,數(shù)據(jù)就會(huì)被認(rèn)為沒有用處了。比方說,在飛機(jī)降落之后,票價(jià)數(shù)據(jù)就沒有用了——如果沒有大數(shù)據(jù)的理念,人們可能會(huì)丟失掉很多有價(jià)值的數(shù)據(jù)。如今,人們不再認(rèn)為數(shù)據(jù)是靜止和陳舊的,它已經(jīng)成為一種商業(yè)資本,一項(xiàng)重要的經(jīng)濟(jì)投入,可以創(chuàng)造新的經(jīng)濟(jì)利益。事實(shí)上,一旦思維轉(zhuǎn)變過來,數(shù)據(jù)就能被巧妙地用來激發(fā)新產(chǎn)品和新服務(wù)。今天,大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價(jià)值的源泉,還是改變市場、組織機(jī)構(gòu)以及政府與公民關(guān)系的方法。大數(shù)據(jù)時(shí)代對我們的生活和與世界交流的方式都提出了挑戰(zhàn)。1.2.1大數(shù)據(jù)的定義所謂大數(shù)據(jù),狹義上可以定義為:用現(xiàn)有的一般技術(shù)難以管理的大量數(shù)據(jù)的集合。這實(shí)際上是指用目前在企業(yè)數(shù)據(jù)庫占據(jù)主流地位的關(guān)系型數(shù)據(jù)庫無法進(jìn)行管理的、具有復(fù)雜結(jié)構(gòu)的數(shù)據(jù)?;蛘咭部梢哉f,是指由于數(shù)據(jù)量的增大,導(dǎo)致對數(shù)據(jù)的查詢響應(yīng)時(shí)間超出了允許的范圍。1.2.1大數(shù)據(jù)的定義全球知名的管理咨詢公司麥肯錫說:“大數(shù)據(jù)指的是所涉及的數(shù)據(jù)集規(guī)模已經(jīng)超過了傳統(tǒng)數(shù)據(jù)庫軟件獲取、存儲(chǔ)、營理和分析的能力。這是一個(gè)被故意設(shè)計(jì)成主觀性的定義,并且是一個(gè)關(guān)于多大的數(shù)據(jù)集才能被認(rèn)為是大數(shù)據(jù)的可變定義,即并不定義大于一個(gè)特定數(shù)字的TB才叫大數(shù)據(jù)。因?yàn)殡S著技術(shù)的不斷發(fā)展,符合大數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集容量也會(huì)增長;并且定義隨不同的行業(yè)也有變化,這依賴于在一個(gè)特定行業(yè)通常使用何種軟件和數(shù)據(jù)集有多大。因此,大數(shù)據(jù)在今天不同行業(yè)中的范圍可以從幾十TB到幾PB?!?.2.1大數(shù)據(jù)的定義隨著“大數(shù)據(jù)”的出現(xiàn),數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等圍繞大數(shù)據(jù)商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點(diǎn),在全球引領(lǐng)了又一輪數(shù)據(jù)技術(shù)革新的浪潮。1.2.1大數(shù)據(jù)的定義從字面上看,“大數(shù)據(jù)”這個(gè)詞可能會(huì)讓人覺得只是容量非常大的數(shù)據(jù)集合而已,但容量只不過是大數(shù)據(jù)特征的一個(gè)方面,如果拘泥于數(shù)據(jù)量,就無法深入理解圍繞大數(shù)據(jù)所進(jìn)行的討論。1.2.2大數(shù)據(jù)的3V特征IBM說:“可以用3個(gè)特征相結(jié)合來定義大數(shù)據(jù):數(shù)量(或稱容量)、種類(或稱多樣性)和速度,或者就是簡單的3V,即龐大容量、極快速度和種類豐富的數(shù)據(jù)?!?/p>
圖1-2按數(shù)量、種類和速度來定義大數(shù)據(jù)1.2.2大數(shù)據(jù)的3V特征(1)Volume(數(shù)量)。存儲(chǔ)的數(shù)據(jù)量在急劇增長中,人們存儲(chǔ)的數(shù)據(jù)包括環(huán)境數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)、醫(yī)療數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)等等,數(shù)據(jù)量不可避免地會(huì)轉(zhuǎn)向ZB級別。另一方面,隨著可供使用的數(shù)據(jù)量不斷增長,可處理、理解和分析的數(shù)據(jù)的比例卻在不斷下降。1.2.2大數(shù)據(jù)的3V特征(2)Variety(種類、多樣性)。隨著傳感器、智能設(shè)備以及社交協(xié)作技術(shù)的激增,數(shù)據(jù)也變得更加復(fù)雜,因?yàn)樗粌H包含傳統(tǒng)的關(guān)系型(結(jié)構(gòu)化)數(shù)據(jù),還包含來自網(wǎng)頁、互聯(lián)網(wǎng)日志文件(流數(shù)據(jù))、搜索索引、社交媒體、電子郵件、文檔、主動(dòng)和被動(dòng)系統(tǒng)的傳感器數(shù)據(jù)等原始、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。和過去不同的是,除了存儲(chǔ)數(shù)據(jù),還需要分析并從中獲得有用的信息。1.2.2大數(shù)據(jù)的3V特征(3)Velocity(速度)。數(shù)據(jù)產(chǎn)生和更新的頻率也是衡量大數(shù)據(jù)的一個(gè)重要特征。這里,速度的概念不僅是與數(shù)據(jù)存儲(chǔ)相關(guān)的增長速率,還包括數(shù)據(jù)流動(dòng)的速度。有效地處理大數(shù)據(jù),需要在數(shù)據(jù)變化的過程中動(dòng)態(tài)地對它的數(shù)量和種類執(zhí)行分析。在3V的基礎(chǔ)上,IBM又歸納總結(jié)了第四個(gè)V——Veracity(真實(shí)和準(zhǔn)確)?!爸挥姓鎸?shí)而準(zhǔn)確的數(shù)據(jù)才能讓對數(shù)據(jù)的管控和治理真正有意義?!笨傊?,大數(shù)據(jù)是個(gè)動(dòng)態(tài)的定義,不同行業(yè)根據(jù)其應(yīng)用的不同有著不同的理解,其衡量標(biāo)準(zhǔn)也在隨著技術(shù)的進(jìn)步而改變。1.2.2大數(shù)據(jù)的3V特征PART03AI時(shí)代將人類與一般動(dòng)物區(qū)分開的特征之一就是省力工具的使用。人類發(fā)明了車輪和杠桿,以減輕遠(yuǎn)距離攜帶重物的負(fù)擔(dān)。人類發(fā)明了長矛,從此不再需要徒手與獵物搏斗。數(shù)千年來,人類一直致力于創(chuàng)造越來越精密復(fù)雜的機(jī)器來節(jié)省體力,然而,能夠幫助人們節(jié)省腦力的機(jī)器卻一直是一個(gè)遙遠(yuǎn)的夢想。時(shí)至今日,人們才具備了足夠的技術(shù)實(shí)力來探索更加通用的思考機(jī)器。雖然計(jì)算機(jī)面世還不到百年,但人們?nèi)粘I钪械脑S多設(shè)備都蘊(yùn)藏著AI技術(shù)。AI最根本也是最宏偉的目標(biāo)之一就是建立人腦般的計(jì)算機(jī)模型,也許,精確性稍遜的模型也同樣十分有效。1.3AI時(shí)代1950年,在計(jì)算機(jī)發(fā)明后不久,“AI之父”圖靈提出一套檢測機(jī)器智能的測試方法,這就是后來廣為人知的圖靈測試。在測試中,測試者在不知情的情況下分別與計(jì)算機(jī)和人類各交談五分鐘,隨后判斷哪個(gè)是計(jì)算機(jī),哪個(gè)是人類。此后的每一年,在所有參加測試的程序中,最接近人類的那一個(gè)將被授予由圖靈創(chuàng)辦的勒布納AI獎(jiǎng)?!俺绦颉眰兊谋憩F(xiàn)確實(shí)越來越好了,就像象棋程序能夠擊敗象棋大師一樣,計(jì)算機(jī)最終一定可以像人類一般流暢交談。圖1-3圖靈測試1.3.1圖靈測試及其發(fā)展隨著計(jì)算機(jī)技術(shù)的不管演進(jìn),研究者們認(rèn)為圖靈測試也應(yīng)該更新?lián)Q代,開發(fā)出新的評判標(biāo)準(zhǔn),以驅(qū)動(dòng)AI研究在現(xiàn)代化方向上更進(jìn)一步。加拿大多倫多大學(xué)的計(jì)算機(jī)科學(xué)家赫克托·萊維斯克建議了“威諾格拉德模式挑戰(zhàn)”,要求AI回答關(guān)于語句理解的一些常識(shí)性問題。1.3.1圖靈測試及其發(fā)展例如:這個(gè)紀(jì)念品無法裝在棕色手提箱內(nèi),因?yàn)樗罅?。問:什么太大了?回?表示紀(jì)念品,回答1表示手提箱。也有學(xué)者建議在圖靈測試中增加對復(fù)雜資料的理解,包括視頻、文本、照片和播客。比如,一個(gè)計(jì)算機(jī)程序可能會(huì)被要求“觀看”一個(gè)電視節(jié)目或者抖音視頻,然后根據(jù)內(nèi)容來回答問題,像是“為什么電視劇《天龍八部》中,契丹人蕭遠(yuǎn)山的兒子叫喬峰?”1.3.1圖靈測試及其發(fā)展谷歌DeepMind的聯(lián)合創(chuàng)始人穆斯塔法·蘇萊曼提出了一種新的測試AI是否具有人類水平智能的方法。他認(rèn)為,傳統(tǒng)的圖靈測試并不能真正反映AI的能力,也不能說明它們是否具有復(fù)雜的內(nèi)部對話或者能否進(jìn)行抽象時(shí)間范圍內(nèi)的規(guī)劃,這些都是人類智能的關(guān)鍵特征。蘇萊曼認(rèn)為應(yīng)該給它們一些短期的目標(biāo)和任務(wù),讓它們在盡量少地依賴人類輸入的情況下完成一些具體工作,他稱這種過程為“人工能力智能”。1.3.1圖靈測試及其發(fā)展為了實(shí)現(xiàn)它,蘇萊曼說,AI機(jī)器人應(yīng)該通過一種新的圖靈測試,即它得到10萬美元的種子投資,必須將其變成100萬美元。作為測試的一部分,機(jī)器人必須研究一個(gè)電子商務(wù)的想法,制定產(chǎn)品計(jì)劃,找到制造商并銷售產(chǎn)品。蘇萊曼甚至預(yù)計(jì)AI很快將達(dá)到這一里程碑:“我們不僅關(guān)心機(jī)器能說什么,我們也關(guān)心它能做什么。”1.3.1圖靈測試及其發(fā)展作為計(jì)算機(jī)科學(xué)的一個(gè)分支,AI是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),是一門自然科學(xué)、社會(huì)科學(xué)和技術(shù)科學(xué)交叉的邊緣學(xué)科,它涉及的學(xué)科內(nèi)容包括哲學(xué)和認(rèn)知科學(xué)、數(shù)學(xué)、神經(jīng)生理學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、信息論、控制論、不定性論、仿生學(xué)、社會(huì)結(jié)構(gòu)學(xué)與科學(xué)發(fā)展觀等。1.3.2AI的定義AI研究領(lǐng)域的一個(gè)較早流行的定義,是由約翰·麥卡錫在1956年的達(dá)特茅斯會(huì)議上提出的,即:AI就是要讓機(jī)器的行為看起來像是人類所表現(xiàn)出的智能行為一樣。另一個(gè)定義指出:AI是人造機(jī)器所表現(xiàn)出來的智能性??傮w來講,對AI的定義大多可劃分為四類,即機(jī)器“像人一樣思考”“像人一樣行動(dòng)”“理性地思考”和“理性地行動(dòng)”。這里“行動(dòng)”應(yīng)廣義地理解為采取行動(dòng)或制定行動(dòng)的決策,而不是肢體動(dòng)作。1.3.2AI的定義美國斯坦福大學(xué)AI研究中心尼爾遜教授對AI下了這樣一個(gè)定義:“AI是關(guān)于知識(shí)的學(xué)科――怎樣表示知識(shí)以及怎樣獲得知識(shí)并使用知識(shí)的科學(xué)?!倍鴾厮诡D教授認(rèn)為:“AI就是研究如何使計(jì)算機(jī)去做過去只有人才能做的智能工作。”這些說法反映了AI學(xué)科的基本思想和基本內(nèi)容。即AI是研究人類智能活動(dòng)的規(guī)律,構(gòu)造具有一定智能的人工系統(tǒng),研究如何讓計(jì)算機(jī)去完成以往需要人的智力才能勝任的工作,也就是研究如何應(yīng)用計(jì)算機(jī)的軟/硬件來模擬人類某些智能行為的基本理論、方法和技術(shù)。1.3.2AI的定義可以把AI定義為一種工具,它用來幫助或者替代人類思維。它是一項(xiàng)計(jì)算機(jī)程序,可以獨(dú)立存在于數(shù)據(jù)中心,在個(gè)人計(jì)算機(jī)里,也可以通過諸如機(jī)器人之類的設(shè)備體現(xiàn)出來。它具備智能的外在特征,有能力在特定環(huán)境中有目的地獲取和應(yīng)用知識(shí)與技能。AI是對人的意識(shí)、思維的信息過程的模擬。AI不是人的智能,但能像人那樣思考,甚至也可能超過人的智能。自誕生以來,AI的理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域也不斷擴(kuò)大,可以預(yù)期,AI所帶來的科技產(chǎn)品將會(huì)是人類智慧的“容器”,因此,AI是一門極富挑戰(zhàn)性的學(xué)科。1.3.2AI的定義AI的傳說甚至可以追溯到古埃及,而電子計(jì)算機(jī)的誕生使信息存儲(chǔ)和處理的各個(gè)方面都發(fā)生了革命,計(jì)算機(jī)理論的發(fā)展產(chǎn)生了計(jì)算機(jī)科學(xué)并最終促使AI的出現(xiàn)。計(jì)算機(jī)這個(gè)用電子方式處理數(shù)據(jù)的發(fā)明,為AI的可能實(shí)現(xiàn)提供了一種媒介。對于人的思維模擬的研究可以從兩個(gè)方向進(jìn)行,一是結(jié)構(gòu)模擬,仿照人腦的結(jié)構(gòu)機(jī)制,制造出“類人腦”的機(jī)器;二是功能模擬,從人腦的功能過程進(jìn)行模擬。現(xiàn)代電子計(jì)算機(jī)的產(chǎn)生便是對人腦思維功能的模擬,是對人腦思維的信息過程的模擬。于是,實(shí)現(xiàn)AI有三種途徑,即強(qiáng)AI、弱AI和實(shí)用型AI。1.3.3強(qiáng)AI與弱AI1.強(qiáng)AI強(qiáng)AI又稱多元智能,研究人員希望AI最終能成為多元智能并且超越大部分人類的能力。有些人認(rèn)為要達(dá)成以上目標(biāo),可能需要擬人化的特性,如人工意識(shí)或人工大腦。上述問題被認(rèn)為是AI的完整性:為了解決其中一個(gè)問題,你必須解決全部問題。即使一個(gè)簡單和特定的任務(wù),如機(jī)器翻譯,會(huì)要求機(jī)器按照作者的論點(diǎn)(推理),知道什么是被人談?wù)摚ㄖR(shí)),忠實(shí)地再現(xiàn)作者的意圖(情感計(jì)算)。1.3.3強(qiáng)AI與弱AI強(qiáng)AI不局限于模仿人類的行為,它被認(rèn)為具有真正獨(dú)立的思想和意識(shí),并且具有推理并解決問題的能力,甚至這種AI具有和人類類似的情感,可以與個(gè)體進(jìn)行共情(體驗(yàn)別人內(nèi)心世界的能力)。強(qiáng)AI觀點(diǎn)的倡導(dǎo)者指出,具有這種智能級別的事物,已經(jīng)不再是人類所開發(fā)的工具,而是具有思維的個(gè)體,從本質(zhì)上來說已經(jīng)和人類沒有差別了——因?yàn)槿祟愐膊贿^是一臺(tái)有靈魂的機(jī)器而已。既然機(jī)器有了靈魂,為何不能成為“人類”?這其中更是涉及到了“何為人”的哲學(xué)探討,這種探討在諸多的科幻小說也多有描述,其中重要的載體就是這種“強(qiáng)AI”。1.3.3強(qiáng)AI與弱AI雖然強(qiáng)AI和弱AI只有一字之差,但二者含義有巨大差別:這種“強(qiáng)”其實(shí)是一種斷層式的飛躍,是一種哲學(xué)意義上的升華。強(qiáng)AI的觀點(diǎn)認(rèn)為有可能制造出真正能推理和解決問題的智能機(jī)器,并且這樣的機(jī)器將被認(rèn)為是有知覺的,有自我意識(shí)的。1.3.3強(qiáng)AI與弱AI強(qiáng)AI可以有兩類:(1)類人的AI,即機(jī)器的思考和推理就像人的思維一樣;(2)非類人的AI,即機(jī)器產(chǎn)生了和人完全不一樣的知覺和意識(shí),使用和人完全不一樣的推理方式。強(qiáng)AI即便可以實(shí)現(xiàn)也很難被證實(shí)。為了創(chuàng)建具備強(qiáng)AI的計(jì)算機(jī)程序,首先必須清楚了解人類思維的工作原理,而想要實(shí)現(xiàn)這樣的目標(biāo),人類還有很長的路要走。1.3.3強(qiáng)AI與弱AI2.弱AI弱AI指的是利用設(shè)計(jì)好的程序?qū)?dòng)物以及人類邏輯思維進(jìn)行模擬,所指的智能體表現(xiàn)出與人類相似的活動(dòng),但是這種智能體缺乏獨(dú)立的思想和意識(shí)。弱AI觀點(diǎn)認(rèn)為不可能制造出能真正地推理和解決問題的智能機(jī)器,這些機(jī)器只不過看起來像是智能的,但是并不真正擁有智能,也不會(huì)有自主意識(shí)。目前就算最尖端的AI領(lǐng)域也僅僅停留在弱AI的階段,即使這種AI可以做到人類難以完成的事情。甚至有AI學(xué)者認(rèn)為,人類作為智能體,永遠(yuǎn)不可能制造出真正能理解和解決問題的智能機(jī)器。1.3.3強(qiáng)AI與弱AI就目前的生活來看,這種弱AI已經(jīng)完全融入到了我們的生活環(huán)境之中:譬如手機(jī)中的語音助手、智能音箱等等。但說到底,這些只是工具,被稱為“機(jī)器智能”或許更為貼切。例如,1979年漢斯·莫拉維克制成的斯坦福馬車,這是歷史上首臺(tái)無人駕駛汽車,能夠穿過布滿障礙物的房間,也能夠環(huán)繞AI實(shí)驗(yàn)室行駛。
圖1-4斯坦福馬車1.3.3強(qiáng)AI與弱AI弱AI只要求機(jī)器能夠擁有智能行為,具體的實(shí)施細(xì)節(jié)并不重要。深藍(lán)計(jì)算機(jī)就是在這樣的理念下產(chǎn)生的,它沒有試圖模仿國際象棋大師的思維,僅僅遵循既定的操作步驟。倘若人類和計(jì)算機(jī)遵照同樣的步驟,那么比賽時(shí)間將會(huì)大大延長,因?yàn)橛?jì)算機(jī)每秒驗(yàn)算的可能走位就高達(dá)2億個(gè),就算思維驚人的象棋大師也不太可能達(dá)到這樣的速度。1.3.3強(qiáng)AI與弱AI人類擁有高度發(fā)達(dá)的戰(zhàn)略意識(shí),這種意識(shí)將需要考慮的走位限制在幾步或是幾十步以內(nèi),而計(jì)算機(jī)的考慮數(shù)以百萬計(jì)。就弱AI而言,這種差異無關(guān)緊要,能證明計(jì)算機(jī)比人類更會(huì)下象棋就足夠了。如今主流的研究活動(dòng)都集中在弱AI上,并且一般認(rèn)為這一研究領(lǐng)域已經(jīng)取得可觀的成就,而強(qiáng)AI的研究則處于停滯不前的狀態(tài)。1.3.3強(qiáng)AI與弱AI3.實(shí)用型AI實(shí)用型AI的研究者們將目標(biāo)放低,不再試圖創(chuàng)造出像人類一般智慧的機(jī)器。眼下人們已經(jīng)能制造出能模擬昆蟲行為的機(jī)器人。機(jī)械家蠅看起來似乎并沒有什么用,但即使是這樣的機(jī)器人,在完成某些特定任務(wù)時(shí)也是大有裨益的。比如,一群如狗大小,具備螞蟻智商的機(jī)器人在清理碎石和在災(zāi)區(qū)找尋幸存者時(shí)就能夠發(fā)揮很大的作用。圖1-5華盛頓大學(xué)研制的靠激光束驅(qū)動(dòng)的RoboFly昆蟲機(jī)器人1.3.3強(qiáng)AI與弱AI隨著我們的模型變得越來越精細(xì),機(jī)器能夠模仿的生物會(huì)越來越高等,最終,我們可能必須接受這樣的事實(shí):機(jī)器似乎變得像人類一樣智慧了。也許實(shí)用型AI與強(qiáng)AI殊途同歸,但考慮到一切的復(fù)雜性,我們不會(huì)相信機(jī)器人是有自我意識(shí)的。1.3.3強(qiáng)AI與弱AI大數(shù)據(jù)是物聯(lián)網(wǎng)、Web和信息系統(tǒng)發(fā)展的綜合結(jié)果。大數(shù)據(jù)的價(jià)值主要體現(xiàn)在分析和應(yīng)用上,比如大數(shù)據(jù)場景分析等。與大數(shù)據(jù)相關(guān)的技術(shù)緊緊圍繞著數(shù)據(jù)展開,包括數(shù)據(jù)的采集、整理、傳輸、存儲(chǔ)、安全、分析、呈現(xiàn)和應(yīng)用等。1.3.4大數(shù)據(jù)造就大智慧AI是典型的交叉學(xué)科,其研究內(nèi)容集中在機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、NLP、計(jì)算機(jī)視覺、機(jī)器人學(xué)、自動(dòng)推理和知識(shí)表示等六大方向。機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的應(yīng)用范圍比較廣泛,比如自動(dòng)駕駛、智慧醫(yī)療等領(lǐng)域。AI的核心在于“思考”和“決策”,如何進(jìn)行合理的思考和合理的行動(dòng)是AI研究的主流方向之一。1.3.4大數(shù)據(jù)造就大智慧大數(shù)據(jù)和AI雖然關(guān)注點(diǎn)不同,但卻有密切的聯(lián)系,一方面,AI需要大量的數(shù)據(jù)作為“思考”和“決策”的基礎(chǔ),另一方面大數(shù)據(jù)也需要AI技術(shù)進(jìn)行數(shù)據(jù)價(jià)值化操作,比如機(jī)器學(xué)習(xí)就是數(shù)據(jù)分析的常用方式。在大數(shù)據(jù)價(jià)值的兩個(gè)主要體現(xiàn)當(dāng)中,數(shù)據(jù)應(yīng)用的主要渠道之一就是智能體(AI產(chǎn)品),為智能體提供的數(shù)據(jù)量越大,智能體運(yùn)行的效果就會(huì)越好,因?yàn)橹悄荏w通常需要大量的數(shù)據(jù)進(jìn)行“訓(xùn)練”和“驗(yàn)證”,從而保障運(yùn)行的可靠性和穩(wěn)定性。1.3.4大數(shù)據(jù)造就大智慧大數(shù)據(jù)相關(guān)技術(shù)已經(jīng)趨于成熟,相關(guān)的理論體系逐步完善,而AI尚處在行業(yè)發(fā)展的初期,理論體系依然有巨大的發(fā)展空間。從學(xué)習(xí)的角度來說,從大數(shù)據(jù)開始是個(gè)不錯(cuò)的選擇,從大數(shù)據(jù)過渡到AI也會(huì)相對比較容易。總的來說,兩個(gè)技術(shù)的發(fā)展空間都非常大。1.3.4大數(shù)據(jù)造就大智慧PART04機(jī)器學(xué)習(xí)與深度學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是AI領(lǐng)域中兩個(gè)密切相關(guān)但又有所區(qū)別的概念。機(jī)器學(xué)習(xí)是一種通過算法使計(jì)算機(jī)系統(tǒng)利用數(shù)據(jù)進(jìn)行自我優(yōu)化并改進(jìn)性能的技術(shù),而深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)的一個(gè)子集,它使用多層神經(jīng)網(wǎng)絡(luò)從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)復(fù)雜的特征表示,以實(shí)現(xiàn)更高級別的任務(wù)處理和決策能力。1.4機(jī)器學(xué)習(xí)與深度學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)習(xí)的應(yīng)用非常廣泛,幾乎涵蓋了所有行業(yè)和領(lǐng)域。還有很多其他重要的應(yīng)用場景,如醫(yī)療診斷、自動(dòng)駕駛、語音識(shí)別等。如何有效地選擇和處理輸入特征對于模型性能有著至關(guān)重要的影響。1.4.1機(jī)器學(xué)習(xí)定義:機(jī)器學(xué)習(xí)是一種讓計(jì)算機(jī)系統(tǒng)通過經(jīng)驗(yàn)(數(shù)據(jù))自動(dòng)改進(jìn)的技術(shù),而無需明確編程指令。它依賴于算法來構(gòu)建數(shù)學(xué)模型,這些模型可以從歷史數(shù)據(jù)中學(xué)習(xí),并用于對未來事件進(jìn)行預(yù)測或決策。機(jī)器學(xué)習(xí)主要類型如下。圖1-6機(jī)器學(xué)習(xí)的三種主要類型1.4.1機(jī)器學(xué)習(xí)(1)監(jiān)督學(xué)習(xí):使用標(biāo)記的數(shù)據(jù)集訓(xùn)練模型,目標(biāo)是最小化預(yù)測值與真實(shí)標(biāo)簽之間的誤差。例如分類問題(如垃圾郵件檢測)、回歸問題(如房價(jià)預(yù)測)。(2)無監(jiān)督學(xué)習(xí):處理未標(biāo)記的數(shù)據(jù),旨在發(fā)現(xiàn)隱藏的模式或結(jié)構(gòu)。常見的應(yīng)用包括聚類分析(如客戶細(xì)分)、降維(如主成分分析PCA)。(3)強(qiáng)化學(xué)習(xí):通過試錯(cuò)機(jī)制與環(huán)境互動(dòng),學(xué)習(xí)如何采取一系列動(dòng)作以最大化累積獎(jiǎng)勵(lì)。適用于游戲、機(jī)器人導(dǎo)航等領(lǐng)域。1.4.1機(jī)器學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)習(xí)的主要特點(diǎn)如下。(1)特征工程:在傳統(tǒng)機(jī)器學(xué)習(xí)中,特征選擇和提取是非常重要的步驟,因?yàn)槟P偷谋憩F(xiàn)很大程度上取決于輸入特征的質(zhì)量。(2)可解釋性:許多傳統(tǒng)的機(jī)器學(xué)習(xí)模型相對簡單,易于理解和解釋,這對于某些應(yīng)用場景(如醫(yī)療診斷)非常重要。1.4.1機(jī)器學(xué)習(xí)示例1:垃圾郵件過濾。通過分析大量已知類別(垃圾/非垃圾)的郵件文本,模型可以學(xué)會(huì)區(qū)分不同類型的郵件特征,并據(jù)此對新收到的郵件進(jìn)行分類預(yù)測,自動(dòng)識(shí)別并過濾掉電子郵件中的垃圾信息。使用技術(shù):(1)算法:樸素貝葉斯分類器、支持向量機(jī)(SVM)。(2)特征工程:提取郵件內(nèi)容的關(guān)鍵字、短語、發(fā)件人信息等作為輸入特征。(3)訓(xùn)練數(shù)據(jù):標(biāo)記為“垃圾”或“非垃圾”的歷史郵件樣本。(4)評估指標(biāo):準(zhǔn)確率、召回率、F1分?jǐn)?shù)等。1.4.1機(jī)器學(xué)習(xí)示例2:信用卡欺詐檢測。通過對歷史交易數(shù)據(jù)的學(xué)習(xí),模型能夠識(shí)別出哪些因素組合最有可能導(dǎo)致欺詐行為的發(fā)生,并在新的交易中快速做出風(fēng)險(xiǎn)評估,實(shí)時(shí)監(jiān)控交易活動(dòng),及時(shí)發(fā)現(xiàn)潛在的欺詐行為。使用技術(shù):(1)算法:決策樹、隨機(jī)森林、梯度提升機(jī)(GBM)。(2)特征工程:包括交易金額、時(shí)間戳、地理位置、用戶行為模式等。(3)訓(xùn)練數(shù)據(jù):過去一段時(shí)間內(nèi)的所有交易記錄,其中包含正常和異常交易。(4)評估指標(biāo):ROC曲線下面積(AUC-ROC)、混淆矩陣。1.4.1機(jī)器學(xué)習(xí)示例3:客戶細(xì)分與市場定位。聚類算法可以幫助企業(yè)從龐大的客戶數(shù)據(jù)庫中找出具有相似特征的子集,從而實(shí)現(xiàn)更加精準(zhǔn)的目標(biāo)市場營銷。根據(jù)消費(fèi)者的購買習(xí)慣和其他屬性將他們分成不同的群體,以便制定個(gè)性化的營銷策略。使用技術(shù):(1)算法:K均值聚類、層次聚類。(2)特征工程:年齡、性別、收入水平、消費(fèi)頻率、偏好商品種類等。(3)訓(xùn)練數(shù)據(jù):客戶的個(gè)人信息及歷史購物記錄。(4)評估指標(biāo):輪廓系數(shù)、卡林斯基-哈拉巴斯指數(shù)。1.4.1機(jī)器學(xué)習(xí)示例4:推薦系統(tǒng)。其核心在于理解用戶的偏好,并通過算法找到最符合其需求的商品或信息,從而增加點(diǎn)擊率、購買轉(zhuǎn)化率等關(guān)鍵業(yè)務(wù)指標(biāo),為用戶提供個(gè)性化的產(chǎn)品或服務(wù)推薦,提高用戶體驗(yàn)和滿意度。使用技術(shù):(1)協(xié)同過濾:基于用戶評分或交互行為構(gòu)建用戶-物品矩陣,推薦相似用戶或物品。(2)內(nèi)容基礎(chǔ)推薦:利用項(xiàng)目本身的特性(如書籍的主題、電影的類型),找到與用戶興趣相匹配的內(nèi)容。(3)混合推薦系統(tǒng):結(jié)合上述兩種方法的優(yōu)點(diǎn),提供更準(zhǔn)確的建議。1.4.1機(jī)器學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)能夠自動(dòng)從原始數(shù)據(jù)中提取高層次的抽象特征,減少了對人工設(shè)計(jì)特征的需求。定義:深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,特別是那些基于多層神經(jīng)網(wǎng)絡(luò)架構(gòu)的學(xué)習(xí)方法。1.4.2深度學(xué)習(xí)深度學(xué)習(xí)的核心技術(shù)是:通過多層神經(jīng)網(wǎng)絡(luò)自動(dòng)從大量數(shù)據(jù)中學(xué)習(xí)特征表示,從而實(shí)現(xiàn)對復(fù)雜模式的識(shí)別和預(yù)測。圖1-7通過多層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)復(fù)雜模式的識(shí)別和預(yù)測1.4.2深度學(xué)習(xí)(1)神經(jīng)網(wǎng)絡(luò)(NNs):模擬生物神經(jīng)系統(tǒng)的工作原理,由多個(gè)節(jié)點(diǎn)(神經(jīng)元)組成,通過權(quán)重連接形成層次結(jié)構(gòu)。每一層負(fù)責(zé)捕捉特定類型特征,隨著層數(shù)增加,模型可以學(xué)習(xí)到更加復(fù)雜的表示。(2)卷積神經(jīng)網(wǎng)絡(luò)(CNNs):廣泛應(yīng)用于圖像識(shí)別任務(wù),因其局部感知野和權(quán)值共享機(jī)制,非常適合處理二維空間信息。(3)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNs):適用于序列數(shù)據(jù)處理,如NLP、語音識(shí)別等。LSTM(長短期記憶網(wǎng)絡(luò))和GRU(門控循環(huán)單元)是RNN的變體,解決了傳統(tǒng)RNN中的梯度消失問題。1.4.2深度學(xué)習(xí)(4)變壓器(Transformers):這是近年來興起的一種以自注意力機(jī)制聞名的新型架構(gòu),能夠在不依賴遞歸的情況下高效處理長距離依賴關(guān)系,在大規(guī)模文本生成、翻譯等方面表現(xiàn)出色。1.4.2深度學(xué)習(xí)深度學(xué)習(xí)的主要特點(diǎn)如下。(1)自動(dòng)化特征學(xué)習(xí):深度學(xué)習(xí)模型可以通過大量參數(shù)自動(dòng)調(diào)整內(nèi)部表征,從而減少對外部特征工程的依賴。(2)大數(shù)據(jù)驅(qū)動(dòng):深度學(xué)習(xí)通常需要大量的標(biāo)注數(shù)據(jù)來進(jìn)行有效的訓(xùn)練,這使得它在互聯(lián)網(wǎng)、社交媒體等數(shù)據(jù)豐富的領(lǐng)域具有優(yōu)勢。(3)高性能計(jì)算資源:由于模型復(fù)雜度高,訓(xùn)練過程往往需要強(qiáng)大的GPU集群支持,以及優(yōu)化后的框架(如TensorFlow、PyTorch)。1.4.2深度學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)都是推動(dòng)現(xiàn)代AI發(fā)展的關(guān)鍵技術(shù)。雖然它們各自有獨(dú)特的特性和應(yīng)用場景,但在很多情況下是可以相輔相成的。(1)適用場景差異:傳統(tǒng)機(jī)器學(xué)習(xí)更合適于較小規(guī)模的數(shù)據(jù)集或較為簡單的任務(wù);而對于大型復(fù)雜任務(wù),尤其是涉及多媒體內(nèi)容時(shí),深度學(xué)習(xí)則顯示出更大的潛力。(2)互補(bǔ)作用:兩者可以結(jié)合使用。例如,在一些實(shí)際項(xiàng)目中,可能會(huì)先用機(jī)器學(xué)習(xí)方法進(jìn)行初步篩選或預(yù)處理,然后再利用深度學(xué)習(xí)進(jìn)一步優(yōu)化結(jié)果。1.4.3機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的關(guān)系深度學(xué)習(xí)本質(zhì)上是機(jī)器學(xué)習(xí)的一部分,但它采用了更復(fù)雜的模型和算法,特別是在處理非結(jié)構(gòu)化數(shù)據(jù)(如圖像、音頻、文本)方面取得了顯著成就。隨著技術(shù)的進(jìn)步,可以期待這兩個(gè)領(lǐng)域?qū)⒗^續(xù)交叉融合,帶來更多創(chuàng)新性的解決方案。1.4.3機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的關(guān)系01計(jì)算機(jī)的淵源02大數(shù)據(jù)基礎(chǔ)03AI時(shí)代04機(jī)器學(xué)習(xí)與深度學(xué)習(xí)目錄/CONTENTS第1章周蘇教授QQ:81505050人工智能基礎(chǔ)第1版·微課版生成式人工智能基礎(chǔ)第2章周蘇教授QQ:81505050生成式AI與AIGC本章深入探討了生成式人工智能(生成式AI)與人工智能生成內(nèi)容(AIGC)的關(guān)鍵概念、技術(shù)發(fā)展、應(yīng)用場景以及面臨的倫理挑戰(zhàn)。通過Blockhead思維實(shí)驗(yàn)引出對智能本質(zhì)的思考,指出LLM雖在文本生成中表現(xiàn)出色,但存在數(shù)據(jù)污染等問題。接著,回顧了NLP從基于規(guī)則的方法到統(tǒng)計(jì)方法,再到深度學(xué)習(xí)方法的演變歷程,強(qiáng)調(diào)LLM在NLP領(lǐng)域的里程碑意義。第2章生成式AI與AIGC本章中闡述了LLM的定義、核心特征,以及生成式AI與判別式AI的區(qū)別,明確了生成式AI的定義、應(yīng)用場景、未來發(fā)展趨勢及倫理挑戰(zhàn),并對AIGC進(jìn)行了定義,探討了其關(guān)鍵步驟、廣泛應(yīng)用場景以及與生成式AI的緊密聯(lián)系。在很多語境下,AIGC也被用于指代生成式AI。第2章生成式AI與AIGC此外,本章還分析了生成式AI的層次結(jié)構(gòu),包括應(yīng)用層、平臺(tái)層、模型層和基礎(chǔ)設(shè)施層,并討論了AIGC在內(nèi)容生成領(lǐng)域的具體應(yīng)用,如內(nèi)容孿生、內(nèi)容編輯和內(nèi)容理解,展示了其在多模態(tài)內(nèi)容生成中的潛力。最后,總結(jié)了AIGC在文本、音頻、圖像、視頻、代碼生成等多個(gè)領(lǐng)域的廣泛應(yīng)用場景,強(qiáng)調(diào)其在推動(dòng)內(nèi)容創(chuàng)作方式變革中的重要作用。第2章生成式AI與AIGC01Blockhead思維實(shí)驗(yàn)02從自然語言處理起步03生成式人工智能04智能內(nèi)容生成目錄/CONTENTS05生成式AI應(yīng)用場景PART01Blockhead思維實(shí)驗(yàn)在任何現(xiàn)有或想象中的未來計(jì)算機(jī)系統(tǒng)中,存儲(chǔ)數(shù)千個(gè)單詞的所有可能序列都是不現(xiàn)實(shí)的:與之相比,這些序列的數(shù)量使得宇宙中的原子數(shù)量都看起來是微不足道的。因此,研究人員重新利用神經(jīng)網(wǎng)絡(luò)的試驗(yàn)和真實(shí)方法,將這些巨大的集合減少到更易管理的形式。神經(jīng)網(wǎng)絡(luò)最初被應(yīng)用于解決分類問題——決定某物是什么,例如輸入一張圖片,網(wǎng)絡(luò)將確定它是狗還是貓的圖像。神經(jīng)網(wǎng)絡(luò)必須以一種使相關(guān)的輸入產(chǎn)生相似結(jié)果的方式來壓縮數(shù)據(jù)。2.1Blockhead思維實(shí)驗(yàn)1981年,內(nèi)德·布洛克構(gòu)建了一個(gè)“Blockhead(傻瓜)”假說——假定科學(xué)家們通過編程,在Blockhead內(nèi)預(yù)先設(shè)定好了近乎所有問題的答案,那么,當(dāng)它回答問題的時(shí)候,人們也許就根本無法區(qū)分是Blockhead還是人類在回答問題。顯然,這里的Blockhead并不被認(rèn)為是智能的,因?yàn)樗卮饐栴}的方式僅僅是從其龐大的記憶知識(shí)庫中檢索并復(fù)述,并非通過理解問題之后給出答案。哲學(xué)家們一致認(rèn)為,這樣的系統(tǒng)不符合智能的標(biāo)準(zhǔn)。2.1Blockhead思維實(shí)驗(yàn)對于多年來一直在思考AI的哲學(xué)家來說,GPT-x(各種版本的GPT軟件)就像是一個(gè)已經(jīng)實(shí)現(xiàn)了的思維實(shí)驗(yàn)。實(shí)際上,GPT-x的許多成就就是通過類似的內(nèi)存檢索操作產(chǎn)生的。GPT-x的訓(xùn)練集中包括了數(shù)億個(gè)人類個(gè)體生成的對話和數(shù)以千計(jì)的學(xué)術(shù)出版物,涵蓋了潛在的問答對。研究發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)多層結(jié)構(gòu)的設(shè)計(jì)使其能夠有效地從訓(xùn)練數(shù)據(jù)中檢索到正確答案。這表明,GPT-x的回答其實(shí)是通過近似甚至是精確復(fù)制訓(xùn)練集中的樣本生成的。2.1Blockhead思維實(shí)驗(yàn)如果GPT-x真的是以這種方式運(yùn)行,那么它就只是Blockhead的現(xiàn)實(shí)版本。由此,人們在評估LLM時(shí)存在一個(gè)關(guān)鍵問題:它的訓(xùn)練集中可能包含了評估時(shí)使用的測試問題,即“數(shù)據(jù)污染”,而這些問題應(yīng)該在評估之前予以排除。事實(shí)上,LLM不僅可以簡單地復(fù)述其提示的或訓(xùn)練集的大部分內(nèi)容,它們還能夠靈活地融合來自訓(xùn)練集的內(nèi)容,產(chǎn)生新的輸出。許多經(jīng)驗(yàn)主義哲學(xué)家提出,能夠靈活復(fù)制先前經(jīng)驗(yàn)中的抽象模式,可能不僅是智能的基礎(chǔ),還是創(chuàng)造力和理性決策的基礎(chǔ)。2.1Blockhead思維實(shí)驗(yàn)PART02從自然語言處理起步NLP(自然語言處理)是一門研究如何讓計(jì)算機(jī)理解、生成和分析人類自然語言的學(xué)科,它是AI和計(jì)算機(jī)科學(xué)的重要分支。NLP的發(fā)展經(jīng)歷了從基于規(guī)則的方法到統(tǒng)計(jì)方法,再到深度學(xué)習(xí)方法的轉(zhuǎn)變。LLM的興起標(biāo)志著NLP領(lǐng)域的一個(gè)重要里程碑,它們代表了深度學(xué)習(xí)方法在處理自然語言上的最新進(jìn)展。2.2從自然語言處理起步NLP研究的主要內(nèi)容大致可以分為以下幾個(gè)方面。隨著技術(shù)的不斷進(jìn)步,新的研究方向和應(yīng)用場景也在不斷涌現(xiàn)。(1)文本預(yù)處理:這是NLP的基礎(chǔ)步驟,包括文本清洗(去除無關(guān)字符、標(biāo)點(diǎn)符號(hào)等)、分詞(將文本切分成單詞或詞匯單元)、詞性標(biāo)注(為每個(gè)詞匯分配語法類別,如名詞、動(dòng)詞等)、命名實(shí)體識(shí)別(識(shí)別文本中的特定實(shí)體,如人名、地點(diǎn)、組織機(jī)構(gòu)名等)。2.2.1NLP研究內(nèi)容(2)詞法分析:如何分析詞匯的形式和意義,包括詞干提取(將詞匯還原為其詞根形式)、詞形還原(將詞匯還原為標(biāo)準(zhǔn)詞典形式)等。(3)句法分析:分析句子的結(jié)構(gòu)和組成成分,包括句法樹結(jié)構(gòu)的構(gòu)建、依存關(guān)系分析(確定詞匯間的語法關(guān)系)等。(4)語義分析:理解文本的深層含義,包括情感分析(判斷文本的情感傾向)、主題抽取(識(shí)別文本的主題內(nèi)容)、篇章理解(理解長篇文本的連貫性和邏輯關(guān)系)等。2.2.1NLP研究內(nèi)容(5)自然語言生成:將非自然語言形式的信息轉(zhuǎn)換成自然語言文本,如自動(dòng)生成報(bào)告、新聞?wù)?、對話?yīng)答等。(6)機(jī)器翻譯:將一種自然語言自動(dòng)轉(zhuǎn)換為另一種自然語言,這是NLP的重要應(yīng)用之一。(7)對話系統(tǒng):構(gòu)建能夠與人類進(jìn)行自然對話的系統(tǒng),包括聊天機(jī)器人、語音助手等,涉及對話管理、上下文理解、自然語言生成等技術(shù)。(8)信息檢索與過濾:從大量文本中找出與查詢條件相匹配的信息,如搜索引擎、推薦系統(tǒng)等。2.2.1NLP研究內(nèi)容(9)語音識(shí)別與語音合成:將語音信號(hào)轉(zhuǎn)換為文本(語音識(shí)別),或?qū)⑽谋巨D(zhuǎn)換為語音信號(hào)(語音合成)。(10)知識(shí)圖譜與語義網(wǎng):構(gòu)建和利用知識(shí)圖譜來增強(qiáng)機(jī)器對世界的理解和推理能力,用于問答系統(tǒng)、智能推薦等場景。(11)深度學(xué)習(xí)模型:使用深度神經(jīng)網(wǎng)絡(luò)(如RNN、LSTM、Transformer等)來處理自然語言任務(wù),包括語言模型、詞向量表示(如Word2Vec、GloVe)、注意力機(jī)制等。2.2.1NLP研究內(nèi)容早期的NLP系統(tǒng)依賴于手工編寫的規(guī)則來解析和理解語言。這些規(guī)則基于語言學(xué)理論,試圖直接編碼語法和語義規(guī)則,但這種方法難以擴(kuò)展到大規(guī)模文本和處理語言的靈活性。隨著數(shù)據(jù)量的增長和計(jì)算能力的提升,統(tǒng)計(jì)方法開始主導(dǎo)NLP領(lǐng)域。這些方法利用概率模型來處理語言,比如n元模型,能夠更好地處理語言的變異性,但仍然有局限性,尤其是在處理長距離依賴和復(fù)雜語言結(jié)構(gòu)時(shí)。2.2.2深度學(xué)習(xí)的影響深度學(xué)習(xí)對NLP領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響,徹底改變了人們處理、理解和生成人類語言的方式。深度學(xué)習(xí)對NLP影響的幾個(gè)關(guān)鍵點(diǎn)如下。(1)提升理解能力:深度學(xué)習(xí)模型,尤其是基于Transformer架構(gòu)的模型如BERT、GPT系列等,能夠?qū)W習(xí)到語言的深層結(jié)構(gòu)和語境依賴性,極大地提升了計(jì)算機(jī)理解復(fù)雜語言任務(wù)的能力,比如問答系統(tǒng)、文本蘊(yùn)含判斷和語義理解。2.2.2深度學(xué)習(xí)的影響(2)文本生成與創(chuàng)意寫作:通過使用序列到序列模型(seq2seq)結(jié)合注意力機(jī)制,深度學(xué)習(xí)模型能夠生成連貫、有邏輯的文本,應(yīng)用于文章創(chuàng)作、新聞?wù)伞υ捪到y(tǒng)響應(yīng)生成等,甚至可以模仿特定風(fēng)格或作者的寫作風(fēng)格。(3)詞嵌入與表征學(xué)習(xí):詞嵌入技術(shù)(如Word2Vec、GloVe)以及更先進(jìn)的上下文敏感的詞嵌入(如BERT中的詞塊嵌入)為詞語提供了高維向量表示,這些表示能夠捕捉詞匯之間的語義和語法關(guān)系,使得模型能夠更好地理解和處理文本,為深度學(xué)習(xí)應(yīng)用于NLP奠定了基礎(chǔ)。2.2.2深度學(xué)習(xí)的影響(4)情感分析與語義理解:深度學(xué)習(xí)模型能夠更準(zhǔn)確地識(shí)別文本中的情緒、態(tài)度和觀點(diǎn),這對于社交媒體分析、客戶服務(wù)、產(chǎn)品反饋分析等領(lǐng)域至關(guān)重要,幫助企業(yè)和機(jī)構(gòu)更好地理解用戶需求和市場趨勢。(5)機(jī)器翻譯:基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng),如Transformer模型,相比傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯方法,能夠提供更流暢、更準(zhǔn)確的翻譯結(jié)果,大大推進(jìn)了跨語言溝通的便利性。2.2.2深度學(xué)習(xí)的影響(6)對話系統(tǒng)與聊天機(jī)器人:深度學(xué)習(xí)技術(shù)使得聊天機(jī)器人更加智能化,能夠進(jìn)行多輪對話、理解用戶意圖并作出恰當(dāng)反應(yīng),改善了用戶體驗(yàn),廣泛應(yīng)用于客戶服務(wù)、教育、娛樂等多個(gè)行業(yè)。(7)命名實(shí)體識(shí)別與信息抽?。荷疃葘W(xué)習(xí)模型在識(shí)別文本中的命名實(shí)體(如人名、地點(diǎn)、組織機(jī)構(gòu)等)和抽取關(guān)鍵信息方面展現(xiàn)出了強(qiáng)大性能,對于構(gòu)建知識(shí)圖譜、信息檢索和智能文檔處理等應(yīng)用極為重要。2.2.2深度學(xué)習(xí)的影響(8)解決數(shù)據(jù)稀疏性問題:盡管NLP任務(wù)常面臨數(shù)據(jù)稀疏性(指數(shù)據(jù)框中絕大多數(shù)數(shù)值缺失或者為零的數(shù)據(jù))挑戰(zhàn),深度學(xué)習(xí)模型通過學(xué)習(xí)更高級別的抽象特征,能在一定程度上緩解這一問題,尤其是在少數(shù)族裔語言、專業(yè)領(lǐng)域術(shù)語等方面。(9)模型可擴(kuò)展性與遷移學(xué)習(xí):預(yù)訓(xùn)練的LLM,如T5、BERT等,通過遷移學(xué)習(xí)策略,能夠在少量樣本上快速適應(yīng)新的任務(wù),降低了特定領(lǐng)域應(yīng)用的門檻,加速NLP技術(shù)的普及和應(yīng)用。2.2.2深度學(xué)習(xí)的影響(10)持續(xù)推動(dòng)技術(shù)創(chuàng)新:深度學(xué)習(xí)的引入激發(fā)了一系列研究和開發(fā)活動(dòng),不斷推動(dòng)NLP技術(shù)邊界,包括但不限于模型結(jié)構(gòu)創(chuàng)新、訓(xùn)練策略優(yōu)化、計(jì)算效率提升等,為未來的自然語言處理技術(shù)發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。2.2.2深度學(xué)習(xí)的影響源自NLP,LLM是近年來AI領(lǐng)域的一項(xiàng)重要進(jìn)展,是一種基于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和NLP技術(shù)的先進(jìn)AI模型。這類模型具有大規(guī)模參數(shù)和復(fù)雜結(jié)構(gòu),其參數(shù)數(shù)量可達(dá)到數(shù)十億乃至數(shù)萬億之多。經(jīng)過大規(guī)模的文本數(shù)據(jù)訓(xùn)練,通過深度學(xué)習(xí)架構(gòu),其中尤其是Transformer模型,LLM能夠?qū)W習(xí)到自然語言的復(fù)雜特征、模式和結(jié)構(gòu)。其設(shè)計(jì)目的是廣泛理解和生成類似于人類的自然語言,從而在多種NLP任務(wù)中展現(xiàn)卓越性能,而無需針對每個(gè)任務(wù)單獨(dú)編程。2.2.3LLM崛起如今,LLM已被應(yīng)用于各種場景,極大地推動(dòng)了AI的實(shí)用化進(jìn)程,也對模型的效率、經(jīng)濟(jì)成本、倫理和隱私等方面提出了新的挑戰(zhàn)。隨著技術(shù)的持續(xù)發(fā)展,LLM正逐步成為AI領(lǐng)域的重要基石、NLP領(lǐng)域的新常態(tài),不斷拓展人類與機(jī)器交互的邊界,推動(dòng)著從個(gè)人助手、客戶服務(wù)、內(nèi)容創(chuàng)造到教育、醫(yī)療等眾多行業(yè)和領(lǐng)域的創(chuàng)新與發(fā)展。2.2.3LLM崛起LLM能夠完成從簡單的問答、文本翻譯到復(fù)雜的對話、文本創(chuàng)作等多種任務(wù)。例如,OpenAI的GPT系列、阿里云的通義千問等,都是此類模型的代表。它們的核心優(yōu)勢在于能夠捕捉語言的細(xì)微差別、對語言的泛化理解、上下文敏感的生成以及一定程度的創(chuàng)造性表達(dá)。這使得它們在處理自然語言時(shí)更為靈活和準(zhǔn)確,此外還能在一定程度上展現(xiàn)邏輯思維、推理能力和創(chuàng)造性。2.2.3LLM崛起實(shí)際上,“大語言模型”和“通用語言模型”這兩個(gè)術(shù)語在很多情況下可以看作是同義或高度相關(guān)的概念,在實(shí)際討論中,兩者常常被交互使用。不過,為了細(xì)微區(qū)分,我們可以這樣理解:前者往往指的是模型的技術(shù)特征,強(qiáng)調(diào)其規(guī)模和技術(shù)復(fù)雜度,而后者則更多地描述了模型的應(yīng)用范圍和靈活性。2.2.3LLM崛起在LLM的上下文中,“大”主要有兩層含義。一方面,它指的是模型的參數(shù)數(shù)量通常會(huì)非常大,這使得模型能夠?qū)W習(xí)和表示語言中細(xì)微且非常復(fù)雜的模式。另一方面,“大”也指的是訓(xùn)練數(shù)據(jù)的規(guī)模,它通常在來自互聯(lián)網(wǎng)、書籍、新聞等各種來源的大規(guī)模文本數(shù)據(jù)上進(jìn)行訓(xùn)練。2.2.3LLM特征LLM的核心特征還包括:(1)深度學(xué)習(xí)架構(gòu):它們通常基于先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu),尤其是Transformer模型,該架構(gòu)擅長處理序列數(shù)據(jù),通過自注意力機(jī)制理解長距離的依賴關(guān)系。(2)無監(jiān)督預(yù)訓(xùn)練:首先在大量未標(biāo)注文本上進(jìn)行無監(jiān)督學(xué)習(xí),預(yù)訓(xùn)練讓模型學(xué)習(xí)語言的統(tǒng)計(jì)規(guī)律和潛在結(jié)構(gòu),之后可以根據(jù)具體任務(wù)進(jìn)行有監(jiān)督的微調(diào)。2.2.3LLM特征(3)生成與理解并重:既能根據(jù)上下文生成連貫、有邏輯的新文本,也能理解輸入文本的意義,進(jìn)行精準(zhǔn)的語義解析和信息提取。(4)持續(xù)學(xué)習(xí)與適應(yīng)性:具有持續(xù)學(xué)習(xí)能力,可以通過接收新數(shù)據(jù)不斷優(yōu)化和擴(kuò)展知識(shí),保持模型的時(shí)效性和準(zhǔn)確性。2.2.3LLM特征PART03生成式人工智能生成式人工智能(生成式AI)是近年來備受社會(huì)矚目的技術(shù)領(lǐng)域,它利用深度學(xué)習(xí)和大數(shù)據(jù)等技術(shù),能夠自主生成全新的、具有創(chuàng)新性的內(nèi)容。這些新數(shù)據(jù)或內(nèi)容與訓(xùn)練數(shù)據(jù)具有相似的特征但并非完全相同,可以是文本、圖像、音頻等形式。2.3生成式人工智能判別式AI是一種專注于學(xué)習(xí)輸入數(shù)據(jù)與輸出標(biāo)簽之間映射關(guān)系的AI方法。它主要關(guān)注如何從給定的輸入中準(zhǔn)確地預(yù)測或分類輸出,而不試圖理解生成這些數(shù)據(jù)的底層概率分布。判別式模型直接學(xué)習(xí)從特征到類別的決策邊界,因此它們在許多實(shí)際應(yīng)用中表現(xiàn)出色,尤其是在需要高精度和快速響應(yīng)的任務(wù)上。2.3.1什么是判別式AI判別式AI的特點(diǎn)主要如下。(1)直接映射:直接從輸入特征空間映射到輸出類別或值,如圖像分類、語音識(shí)別等任務(wù)。(2)高效訓(xùn)練:通常比生成式模型更容易訓(xùn)練,因?yàn)樗鼈儾恍枰U麄€(gè)數(shù)據(jù)分布。(3)高精度:在特定任務(wù)上的表現(xiàn)優(yōu)于生成式模型,特別是在大量標(biāo)注數(shù)據(jù)可用的情況下。(4)廣泛應(yīng)用:廣泛應(yīng)用于NLP、計(jì)算機(jī)視覺、推薦系統(tǒng)等領(lǐng)域。2.3.1什么是判別式AI常見的判別式模型主要如下。(1)支持向量機(jī)(SVM):尋找最優(yōu)超平面以最大化不同類別之間的間隔,適用于線性和非線性分類問題。(2)邏輯回歸:用于二分類或多分類問題,通過估計(jì)事件發(fā)生的概率來進(jìn)行預(yù)測。(3)神經(jīng)網(wǎng)絡(luò):包括多層感知器(MLP)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其變體,如長短期記憶網(wǎng)絡(luò)(LSTM),廣泛應(yīng)用于各種復(fù)雜的模式識(shí)別任務(wù)。2.3.1什么是判別式AI(4)隨機(jī)森林:由多個(gè)決策樹組成,通過對各棵樹的結(jié)果進(jìn)行投票來做出最終預(yù)測,具有較強(qiáng)的抗過擬合能力。(5)梯度提升決策樹(GBDT):通過迭代地添加新的弱學(xué)習(xí)器來逐步改進(jìn)模型性能,常用于結(jié)構(gòu)化數(shù)據(jù)分析。(6)深度學(xué)習(xí)中的變換器(Transformer):特別適合處理序列數(shù)據(jù),如文本和時(shí)間序列,在自然語言處理領(lǐng)域取得了巨大成功。(7)線性判別分析(LDA):一種經(jīng)典的降維技術(shù),也可作為監(jiān)督學(xué)習(xí)算法用于分類任務(wù)。2.3.1什么是判別式AI判別式AI的應(yīng)用場景主要如下。(1)圖像分類:使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對圖片內(nèi)容進(jìn)行分類,例如區(qū)分貓狗照片。(2)情感分析:基于文本的情感分類任務(wù),如判斷評論是正面還是負(fù)面。(3)語音識(shí)別:將音頻信號(hào)轉(zhuǎn)換為文字轉(zhuǎn)錄,涉及聲學(xué)模型和語言模型的結(jié)合。(4)推薦系統(tǒng):根據(jù)用戶的歷史行為和其他相關(guān)因素推薦商品或內(nèi)容。(5)醫(yī)療診斷輔助:分析醫(yī)學(xué)影像或患者病歷信息,幫助醫(yī)生做出更準(zhǔn)確的診斷。2.3.1什么是判別式AI判別式AI的優(yōu)勢主要是:?高性能:在很多情況下,判別式模型能夠提供更高的準(zhǔn)確率和更快的速度。?簡單易用:相比生成式模型,判別式模型通常更易于實(shí)現(xiàn)和優(yōu)化。?針對性強(qiáng):針對具體任務(wù)定制,可以達(dá)到非常好的效果。2.3.1什么是判別式AI而它的局限性主要如下:?缺乏泛化能力:對于未見過的數(shù)據(jù)類型或異常情況,可能表現(xiàn)不佳。?依賴標(biāo)注數(shù)據(jù):大多數(shù)判別式模型需要大量標(biāo)注數(shù)據(jù)來進(jìn)行有效訓(xùn)練。?難以解釋:尤其是復(fù)雜模型,如深度神經(jīng)網(wǎng)絡(luò),其內(nèi)部運(yùn)作機(jī)制較難解釋,存在“黑箱”問題。判別式AI因其高效性和準(zhǔn)確性,在眾多應(yīng)用場景中占據(jù)重要地位。然而,隨著技術(shù)的發(fā)展,人們也在探索如何結(jié)合生成式模型的優(yōu)勢,開發(fā)出更加全面和強(qiáng)大的AI系統(tǒng)。2.3.1什么是判別式AI定義:生成式AI是AI的一個(gè)分支,是一種基于機(jī)器學(xué)習(xí)的方法,它通過學(xué)習(xí)大量數(shù)據(jù),能夠生成與原始數(shù)據(jù)相似的全新內(nèi)容。這種技術(shù)可以應(yīng)用于多個(gè)領(lǐng)域,如NLP、圖像生成、音頻合成等。2.3.2定義生成式AI如圖2-1所示,判別模型需要求出一條決策邊界,而生成模型需要計(jì)算聯(lián)合概率分布。與傳統(tǒng)的判別式AI相比,生成式AI更注重于創(chuàng)造和生成,而非簡單的分類和識(shí)別,它專注于學(xué)習(xí)現(xiàn)有數(shù)據(jù)集的模式并基于這些模式創(chuàng)造新的、之前未存在的內(nèi)容。這種技術(shù)使得機(jī)器能夠模仿創(chuàng)造性過程,生成包括但不限于文本、圖像、音頻和視頻的各種類型的內(nèi)容。生成式模型通過深度學(xué)習(xí)網(wǎng)絡(luò),如變分自編碼器(VAEs)、生成對抗網(wǎng)絡(luò)(GANs)或Transformer模型(如ChatGPT)等,來實(shí)現(xiàn)這一目標(biāo)的。2.3.2定義生成式AI
圖2-1判別模型(左)與生成模型2.3.2定義生成式AI生成式AI的主要應(yīng)用場景如下。(1)文本生成:可以生成各種類型的文本,如新聞報(bào)道、小說、詩歌等。這種技術(shù)可以大大提高文本創(chuàng)作的效率和質(zhì)量,為內(nèi)容創(chuàng)作者提供更多的靈感和選擇。(2)圖像生成:能夠根據(jù)用戶的描述或輸入的關(guān)鍵詞,生成符合要求的圖像。這種技術(shù)在設(shè)計(jì)、藝術(shù)等領(lǐng)域具有廣泛的應(yīng)用前景。(3)音頻合成:可以模擬各種聲音,生成逼真的語音、音樂等音頻內(nèi)容。這對于語音助手、音樂創(chuàng)作等領(lǐng)域具有重要意義。2.3.2定義生成式AI生成式AI的未來發(fā)展趨勢包括:(1)技術(shù)創(chuàng)新:隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)的不斷發(fā)展,生成式AI的性能將得到進(jìn)一步提升。未來,人們可以期待更加高效、精準(zhǔn)的生成式AI模型的出現(xiàn)。(2)應(yīng)用拓展:生成式AI將在更多領(lǐng)域得到應(yīng)用,如虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、自動(dòng)駕駛等。這些應(yīng)用將進(jìn)一步提升生成式AI的實(shí)用價(jià)值和社會(huì)影響力。2.3.2定義生成式AI(3)倫理挑戰(zhàn):隨著生成式AI的普及,我們也需要關(guān)注其可能帶來的倫理挑戰(zhàn)。例如,如何確保生成的內(nèi)容符合道德和法律要求,如何保護(hù)原創(chuàng)作品的權(quán)益等。2.3.2定義生成式AI作為一種新興的技術(shù)領(lǐng)域,生成式AI帶來了許多創(chuàng)新和機(jī)遇,具有廣闊的應(yīng)用前景和巨大的發(fā)展?jié)摿?。但是,生成式AI也存在一些潛在的風(fēng)險(xiǎn)和挑戰(zhàn),因此,需要在推進(jìn)生成式AI應(yīng)用的同時(shí),不斷創(chuàng)新和完善生成式AI技術(shù),加強(qiáng)風(fēng)險(xiǎn)管理和監(jiān)管,推動(dòng)其健康、可持續(xù)的發(fā)展。首先,對于生成式AI生成的內(nèi)容需要建立有效的審核機(jī)制,確保其內(nèi)容符合法律法規(guī)和道德標(biāo)準(zhǔn)。同時(shí),也需要加強(qiáng)對原創(chuàng)作品的保護(hù),防止侵權(quán)行為的發(fā)生。2.3.2定義生成式AI其次,還需要關(guān)注生成式AI的濫用問題。例如,一些人可能會(huì)利用生成式AI生成虛假信息或進(jìn)行惡意攻擊。因此,我們需要加強(qiáng)技術(shù)監(jiān)管和法律制約,防止生成式AI被用于非法活動(dòng)。最后,我們還需要加強(qiáng)公眾對生成式AI的認(rèn)知和了解。通過普及相關(guān)知識(shí),提高公眾的辨識(shí)能力和風(fēng)險(xiǎn)意識(shí),可以更好地應(yīng)對生成式AI帶來的挑戰(zhàn)和風(fēng)險(xiǎn)。2.3.2定義生成式AI生成式AI是一個(gè)充滿機(jī)遇和挑戰(zhàn)的領(lǐng)域。通過深入了解其基本概念、應(yīng)用場景以及未來發(fā)展趨勢,我們可以更好地把握這一技術(shù)的發(fā)展脈搏,為未來的創(chuàng)新和發(fā)展提供有力支持。2.3.2定義生成式AI為了更全面地了解生成式AI領(lǐng)域,分析該技術(shù)的價(jià)值鏈,考慮將其分為四個(gè)相互關(guān)聯(lián)的層,即應(yīng)用層、平臺(tái)層、模型層和基礎(chǔ)設(shè)施層,它們共同創(chuàng)造新內(nèi)容,其中每一層在整個(gè)過程中都發(fā)揮著獨(dú)特作用。2.3.3生成式AI的層次1.應(yīng)用層生成式AI的應(yīng)用層通過允許動(dòng)態(tài)創(chuàng)建內(nèi)容來使用專門算法實(shí)現(xiàn)簡化人類與AI的交互。這些算法提供了定制和自動(dòng)化的企業(yè)對企業(yè)(B2B)和企業(yè)對消費(fèi)者(B2C)應(yīng)用程序和服務(wù),而用戶無需直接訪問底層基礎(chǔ)模型。這些應(yīng)用程序的開發(fā)可以由基礎(chǔ)模型的所有者(例如ChatGPT的OpenAI)和包含生成式AI模型的第三方軟件公司(例如JasperAI)來承擔(dān)。2.3.3生成式AI的層次生成式AI的應(yīng)用層由通用應(yīng)用程序、特定領(lǐng)域應(yīng)用程序和集成應(yīng)用程序三個(gè)不同子組組成。(1)通用應(yīng)用程序:包括旨在執(zhí)行廣泛任務(wù)的軟件,以各種形式生成新內(nèi)容。此類示例包括ChatGPT、DALL-E2、GitHubCopilot、Character.ai(一種聊天機(jī)器人服務(wù),允許用戶創(chuàng)建AI角色并與之交談)和JasperAI(一種AI驅(qū)動(dòng)的寫作工具)。2.3.3生成式AI的層次(2)特定領(lǐng)域的應(yīng)用程序:這些是為滿足特定行業(yè)(如金融、醫(yī)療保健、制造和教育)的特定需求和要求而量身定制的軟件解決方案。這些應(yīng)用程序在各自的領(lǐng)域更加專業(yè)化和響應(yīng)更快,特別是當(dāng)公司對它們進(jìn)行高質(zhì)量、獨(dú)特和專有數(shù)據(jù)的培訓(xùn)時(shí)。例子包括金融數(shù)據(jù)分析的BloombergGPT以及谷歌的接受醫(yī)療數(shù)據(jù)訓(xùn)練以回答醫(yī)療查詢的Med-PaLM2。2.3.3生成式AI的層次(3)集成應(yīng)用程序:該子組由現(xiàn)有軟件解決方案組成,其中融入了生成式AI功能以增強(qiáng)其主流產(chǎn)品。主要示例包括微軟365Copilot(適用于各種微軟產(chǎn)品的AI驅(qū)動(dòng)助手)、Salesforce的EinsteinGPT(生成式AICRM技術(shù))以及Adobe與Photoshop的生成式AI集成。2.3.3生成式AI的層次2.平臺(tái)層生成式AI的平臺(tái)層主要致力于通過托管服務(wù)提供對LLM的訪問。這項(xiàng)服務(wù)簡化了通用預(yù)訓(xùn)練基礎(chǔ)模型(如OpenAI的GPT)的微調(diào)和定制過程。盡管領(lǐng)先的LLM,如GPT-4,可以僅使用其經(jīng)過訓(xùn)練的鎖定數(shù)據(jù)集立即回答大多數(shù)問題,但通過微調(diào),可以顯著提升這些LLM在特定內(nèi)容領(lǐng)域的能力。2.3.3生成式AI的層次微調(diào)涉及解鎖現(xiàn)有LLM的神經(jīng)網(wǎng)絡(luò),使用新數(shù)據(jù)進(jìn)行額外的訓(xùn)練。最終用戶或公司可以將其專有或客戶特定的數(shù)據(jù)無縫集成到這些模型中,以用于定向應(yīng)用。平臺(tái)層的最終目標(biāo)是簡化LLM的使用,降低最終用戶或公司的相關(guān)成本。這種方法消除了獨(dú)立從零開始開發(fā)這些模型的必要性,而無需投資數(shù)十億美元和數(shù)年的努力。相反,用戶可以支付月度訂閱費(fèi)用或?qū)⑵淅壍交A(chǔ)設(shè)施即服務(wù)(IaaS)的提供中。與此同時(shí),用戶還可以訪問諸如安全性、隱私性和各種平臺(tái)工具等有價(jià)值的功能,所有這些都以一種簡化的方式進(jìn)行管理。2.3.3生成式AI的層次3.模型層生成式AI的模型層啟動(dòng)基礎(chǔ)模型。這種大規(guī)模機(jī)器學(xué)習(xí)模型通常通過使用Transformer算法對未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練。訓(xùn)練和微調(diào)過程使基礎(chǔ)模型能夠發(fā)展成為一種多功能工具,可以適應(yīng)各種任務(wù),以支持各種生成式AI應(yīng)用程序的功能。2.3.3生成式AI的層次基礎(chǔ)模型可以大致分為兩大類:閉源(或?qū)S校┠P秃烷_源模型。(1)閉源基礎(chǔ)模型。這些模型由OpenAI等特定組織擁有和控制,底層源代碼、算法、訓(xùn)練數(shù)據(jù)和參數(shù)均保密。2.3.3生成式AI的層次閉源(或?qū)S校┗A(chǔ)模型可通過應(yīng)用程序編程接口(API)向公眾開放。第三方可以在其應(yīng)用程序中使用此API,查詢和呈現(xiàn)基礎(chǔ)模型中的信息,而無需在訓(xùn)練、微調(diào)或運(yùn)行模型上花費(fèi)額外的資源。這些模型通??梢栽L問專有的訓(xùn)練數(shù)據(jù),并可以優(yōu)先訪問云計(jì)算資源。大型云計(jì)算公司通常會(huì)創(chuàng)建閉源基礎(chǔ)模型,因?yàn)橛?xùn)練這些模型需要大量投資。閉源模型通過向客戶收取API使用或基于訂閱的訪問費(fèi)用來產(chǎn)生收入。2.3.3生成式AI的層次OpenAI的GPT-4和谷歌的PaLM2等LLM是專注于自然語言處理的特定閉源基礎(chǔ)模型。它們針對聊天機(jī)器人等應(yīng)用程序進(jìn)行了微調(diào),例如ChatGPT和Gemini。一個(gè)非語言的例子是OpenAI的DALL-E2,這是一種識(shí)別和生成圖像的視覺模型。2.3.3生成式AI的層次(2)開源基礎(chǔ)模型。相比之下,每個(gè)人都可以不受限制地訪問開源模型。他們鼓勵(lì)社區(qū)協(xié)作和開發(fā),允許透明地檢查和修改代碼。開源基礎(chǔ)模型是協(xié)作開發(fā)的。它們可以免費(fèi)重新分發(fā)和修改,從而提供訓(xùn)練數(shù)據(jù)和模型構(gòu)建過程的完全透明度。許多甚至是免費(fèi)分發(fā)的,具體取決于許可證和數(shù)據(jù)。2.3.3生成式AI的層次使用開源模型的好處包括:(1)對數(shù)據(jù)的完全控制和隱私;與OpenAI的GPT等閉源模型共享不同。(2)通過特定提示、微調(diào)和過濾改進(jìn)定制,以針對各個(gè)行業(yè)進(jìn)行優(yōu)化。(3)具有成本效益的特定領(lǐng)域模型的訓(xùn)練和推理(較小的模型需要較少的計(jì)算)。開源模型的例子例如Meta的Llama2、Databricks的Dolly2.0、StabilityAI的StableDiffusionXL以及Cerebras-GPT。2.3.3生成式AI的層次4.基礎(chǔ)設(shè)施層生成式AI的基礎(chǔ)設(shè)施層包含大規(guī)?;A(chǔ)模型的重要組成部分。這一過程涉及的關(guān)鍵資源是半導(dǎo)體、網(wǎng)絡(luò)、存儲(chǔ)、數(shù)據(jù)庫和云服務(wù),所有這些資源在生成式AI模型的初始訓(xùn)練和持續(xù)的微調(diào)、定制和推理中都發(fā)揮著至關(guān)重要的作用。生成式AI模型通過兩個(gè)主要階段發(fā)揮作用。2.3.3生成式AI的層次(1)訓(xùn)練階段:這是學(xué)習(xí)發(fā)生的階段,通常在云數(shù)據(jù)中心的加速計(jì)算集群中進(jìn)行。在這個(gè)計(jì)算密集型階段,LLM從給定的數(shù)據(jù)集中學(xué)習(xí)。參數(shù)是模型調(diào)整以表示訓(xùn)練數(shù)據(jù)中潛在模式的內(nèi)部變量。詞元指的是模型處理的文本的個(gè)體部分,如單詞或子詞。例如,GPT-3是在3000億個(gè)詞元上進(jìn)行訓(xùn)練的,其中一個(gè)詞元等于1.33個(gè)單詞,主要來自互聯(lián)網(wǎng)的CommonCrawl、網(wǎng)絡(luò)百科、書籍和文章。2.3.3生成式AI的層次(2)推斷階段:這是使用經(jīng)過訓(xùn)練的AI模型生成用戶響應(yīng)的過程。在這里,新的文本輸入被標(biāo)記為單獨(dú)的單位,模型使用訓(xùn)練過程中學(xué)到的參數(shù)來解釋這些詞元并生成相應(yīng)的輸出。這些經(jīng)過訓(xùn)練的AI模型需要大量的計(jì)算能力,并且必須部署在靠近最終用戶的地方(在邊緣數(shù)據(jù)中心),以最小化響應(yīng)時(shí)延(延遲),因?yàn)閷?shí)時(shí)交互對于保持用戶參與至關(guān)重要。2.3.3生成式AI的層次總體而言,生成式AI的準(zhǔn)確性取決于LLM的規(guī)模和使用的訓(xùn)練數(shù)據(jù)量。這些因素反過來需要一個(gè)由半導(dǎo)體、網(wǎng)絡(luò)、存儲(chǔ)、數(shù)據(jù)庫和云服務(wù)組成的強(qiáng)大基礎(chǔ)設(shè)施。2.3.3生成式AI的層次定義:AIGC(AI-generatedcontent,人工智能生成內(nèi)容)是指利用AI技術(shù),特別是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法,自動(dòng)生成各種形式的內(nèi)容,如文本、圖像、音頻、視頻等。這些內(nèi)容可以是創(chuàng)意性的,比如藝術(shù)作品、音樂、文章;也可以是實(shí)用性的,比如新聞報(bào)道、產(chǎn)品描述、個(gè)性化推薦信息等。AIGC的核心優(yōu)勢在于其能夠基于大量的數(shù)據(jù)學(xué)習(xí)模式,自動(dòng)創(chuàng)作新的內(nèi)容,這在很大程度上提高了內(nèi)容生產(chǎn)的效率和個(gè)性化程度。2.3.4定義AIGCAIGC代表了AI在創(chuàng)意生產(chǎn)和內(nèi)容生成領(lǐng)域的應(yīng)用,能夠自動(dòng)化或半自動(dòng)化地生產(chǎn)高質(zhì)量、個(gè)性化的內(nèi)容。應(yīng)用AGIC的關(guān)鍵步驟一般包括:數(shù)據(jù)收集、模型訓(xùn)練、內(nèi)容生成和后期優(yōu)化。通過這些過程,AI系統(tǒng)能夠理解特定主題、風(fēng)格或用戶偏好,進(jìn)而生成符合要求的內(nèi)容。2.3.4定義AIGCAIGC的應(yīng)用場景廣泛,從媒體和娛樂行業(yè)到教育、廣告、電商、個(gè)人助理等多個(gè)領(lǐng)域,都在探索如何利用這一技術(shù)來提升用戶體驗(yàn)、創(chuàng)造新價(jià)值。隨著技術(shù)的不斷進(jìn)步,AIGC的潛力持續(xù)增長,對社會(huì)經(jīng)濟(jì)活動(dòng)和個(gè)人生活方式的影響也日益顯著。2.3.4定義AIGC?用戶生成內(nèi)容(UGC)是指由用戶自發(fā)創(chuàng)建并分享的各類內(nèi)容,如評論、博客文章、視頻、圖片等,通常通過社交媒體平臺(tái)、論壇和在線社區(qū)進(jìn)行傳播。?專業(yè)生成內(nèi)容(PGC)是指由具有特定專業(yè)知識(shí)或技能的個(gè)人、團(tuán)體或機(jī)構(gòu)創(chuàng)建的內(nèi)容,如新聞報(bào)道、學(xué)術(shù)論文、行業(yè)分析報(bào)告等,旨在提供高質(zhì)量、權(quán)威性和深度的信息。2.3.4定義AIGC從用戶生成內(nèi)容到專業(yè)生成內(nèi)容,再到現(xiàn)在的AIGC,我們看到了內(nèi)容創(chuàng)作方式的巨大變革和進(jìn)步。通過深度學(xué)習(xí)與NLP的創(chuàng)新融合,AIGC就像一支神奇的畫筆,擁有無限的創(chuàng)造力。利用AI的理解力、想象力和創(chuàng)作力,根據(jù)指定的需求和風(fēng)格,創(chuàng)作出各種內(nèi)容。諸如ChatGPT、通義千問等智能系統(tǒng),AIGC的出現(xiàn)打開了一個(gè)全新的創(chuàng)作世界,為人們提供了無數(shù)的可能性,重塑了信息時(shí)代的內(nèi)容創(chuàng)作生態(tài),甚至讓人難以分清背后的創(chuàng)作者到底是人類還是AI。2.3.4定義AIGC與AIGC相關(guān)的AI領(lǐng)域術(shù)語之間的關(guān)系如圖2-2所示,它們共同構(gòu)成了AIGC的核心要素。圖2-2AIGC與AI技術(shù)譜系2.3.4定義AIGC生成式AI與AIGC這兩個(gè)概念緊密相關(guān),可以說AIGC是生成式AI的一個(gè)具體應(yīng)用方向。生成式AI的核心能力在于創(chuàng)造、預(yù)測、轉(zhuǎn)換和補(bǔ)全信息。而AIGC則更側(cè)重于描述由生成式AI技術(shù)所產(chǎn)出的實(shí)際成果,即由AI系統(tǒng)自動(dòng)生成、具體創(chuàng)造出來的作品內(nèi)容本身,包括簡單的文本創(chuàng)作、圖像合成以及復(fù)雜的音樂生成、視頻剪輯等,這些作品展現(xiàn)了AI在創(chuàng)意表達(dá)方面的潛能。因此,生成式AI是底層的技術(shù)框架和方法,而AIGC是這些技術(shù)應(yīng)用的結(jié)果,體現(xiàn)了技術(shù)在實(shí)際場景中的應(yīng)用價(jià)值和社會(huì)影響。兩者之間存在一種從技術(shù)到產(chǎn)品的邏輯聯(lián)系,生成式AI的發(fā)展推動(dòng)了AIGC的多樣化和普及化。2.3.5生成式AI與AIGC的關(guān)系PART04智能內(nèi)容生成隨著LLM技術(shù)的成熟,其應(yīng)用范圍擴(kuò)展到了內(nèi)容生成的多個(gè)領(lǐng)域。2021年之前,AIGC生成的主要還是文字,而新一代模型可以處理的格式內(nèi)容包括文字、語音、代碼、圖像、視頻、機(jī)器人動(dòng)作等等。AIGC可以在創(chuàng)意、表現(xiàn)力、迭代、傳播、個(gè)性化等方面,充分發(fā)揮技術(shù)優(yōu)勢。它不僅革新了創(chuàng)意產(chǎn)業(yè),還為個(gè)性化內(nèi)容推薦、輔助設(shè)計(jì)、娛樂等多個(gè)行業(yè)帶來了變革,例如DALL-E、Midjourney等圖像生成模型以及音樂生成軟件AmperMusic等。2.4智能內(nèi)容生成智能數(shù)字內(nèi)容孿生主要分為內(nèi)容增強(qiáng)與轉(zhuǎn)譯。增強(qiáng),即對數(shù)字內(nèi)容修復(fù)、去噪、細(xì)節(jié)增強(qiáng)等,轉(zhuǎn)譯,即對數(shù)字內(nèi)容轉(zhuǎn)換如翻譯等。該技術(shù)旨在將現(xiàn)實(shí)世界中的內(nèi)容進(jìn)行智能增強(qiáng)與智能轉(zhuǎn)譯,更好的完成現(xiàn)實(shí)世界到數(shù)字世界映射。例如,我們拍攝了一張低分辨率的圖片,通過智能增強(qiáng)中的圖像超分可對低分辨率進(jìn)行放大,同時(shí)增強(qiáng)圖像的細(xì)節(jié)信息,生成高清圖。2.4.1內(nèi)容孿生這里的超分,即超分辨率技術(shù),是通過硬件或軟件的方法提高圖像或視頻幀的分辨率,通過一系列低分辨率圖像獲取到高分辨率圖像的過程。再比如,對于老照片中的像素缺失部分,可通過智能增強(qiáng)技術(shù)進(jìn)行內(nèi)容復(fù)原。而智能轉(zhuǎn)譯則更關(guān)注不同模態(tài)之間的相互轉(zhuǎn)換。比如,錄制一段音頻,可通過智能轉(zhuǎn)譯技術(shù)自動(dòng)生成字幕;再比如,輸入一段文字可以自動(dòng)生成語音,兩個(gè)例子均為模態(tài)間智能轉(zhuǎn)譯應(yīng)用。2.4.1內(nèi)容孿生內(nèi)容孿生的應(yīng)用主要有語音轉(zhuǎn)字幕、文字轉(zhuǎn)語音、圖像超分等。其中,圖像超分辨率是指利用光學(xué)及其相關(guān)光學(xué)知識(shí),根據(jù)已知圖像信息恢復(fù)圖像細(xì)節(jié)和其他數(shù)據(jù)信息的過程,簡單來說就是增大圖像的分辨率,防止其圖像質(zhì)量下降。2.4.1內(nèi)容孿生智能數(shù)字內(nèi)容編輯是通過對內(nèi)容的理解以及屬性控制,進(jìn)而實(shí)現(xiàn)對內(nèi)容的修改。如在計(jì)算機(jī)視覺領(lǐng)域,通過對視頻內(nèi)容的理解實(shí)現(xiàn)不同場景視頻片段的剪輯。通過人體部位檢測以及目標(biāo)衣服的變形控制與截?cái)嗵幚?,將目?biāo)衣服覆蓋至人體部位,實(shí)現(xiàn)虛擬試衣。在語音信號(hào)處理領(lǐng)域,通過對音頻信號(hào)分析,實(shí)現(xiàn)人聲與背景聲分離。以上例子都是在理解數(shù)字內(nèi)容的基礎(chǔ)上對內(nèi)容的編輯與控制。2.4.2內(nèi)容編輯智能數(shù)字內(nèi)容生成是通過從海量數(shù)據(jù)中學(xué)習(xí)抽象概念,并通過概念的組合生成全新的內(nèi)容。如AI繪畫,從海量繪畫中學(xué)習(xí)作品不同筆法、內(nèi)容、藝術(shù)風(fēng)格,并基于學(xué)習(xí)內(nèi)容重新生成特定風(fēng)格的繪畫。采用此方式,AI在文本創(chuàng)作、音樂創(chuàng)作和詩詞創(chuàng)作中取得了不錯(cuò)的表現(xiàn)。再比如,在跨模態(tài)領(lǐng)域,通過輸入文本輸出特定風(fēng)格與屬性的圖像,不僅能夠描述圖像中主體的數(shù)量、形狀、顏色等屬性信息,而且能夠描述主體的行為、動(dòng)作以及主體之間的關(guān)系。2.4.2內(nèi)容編輯隨著AI技術(shù)的迅猛發(fā)展,我們見證了其從基礎(chǔ)算法到復(fù)雜應(yīng)用場景的跨越式進(jìn)步。從簡單的數(shù)據(jù)分析到復(fù)雜的決策支持,AI似乎無所不能。然而,在這波技術(shù)革新浪潮中,AI所面臨的真正挑戰(zhàn)正逐漸從形式化學(xué)習(xí)轉(zhuǎn)向內(nèi)容理解。2.4.3內(nèi)容理解當(dāng)前,大多數(shù)AI系統(tǒng),特別是深度學(xué)習(xí)模型,主要依賴于對海量數(shù)據(jù)的形式化學(xué)習(xí)。這些模型通過識(shí)別數(shù)據(jù)中的模式和關(guān)聯(lián)來做出預(yù)測或決策。然而,這種學(xué)習(xí)方式的局限性在于,它們往往缺乏對數(shù)據(jù)背后含義的深入理解和洞察。以圖像和視頻內(nèi)容的理解為例,盡管計(jì)算機(jī)視覺技術(shù)利用深度學(xué)習(xí)模型能夠識(shí)別出物體、場景和動(dòng)作等,但一個(gè)圖像識(shí)別系統(tǒng)即使能夠準(zhǔn)確地識(shí)別出一只水豚,它卻并不真正理解“水豚”這一概念所包含的深層含義,如水豚的生活方式、性格特點(diǎn)等。2.4.3內(nèi)容理解對于大數(shù)據(jù)和深度學(xué)習(xí)的局限性,有研究者認(rèn)為:“這些都是基于形式化的處理,數(shù)據(jù)被簡化為0—1的編碼序列,無法真實(shí)反映其背后的內(nèi)容。深度學(xué)習(xí)模型基于這樣的數(shù)據(jù)進(jìn)行訓(xùn)練,同樣缺乏對內(nèi)容的深入理解,因此不具備真正的理解能力?!边@一觀點(diǎn)揭示了當(dāng)前AI領(lǐng)域所面臨的挑戰(zhàn)——如何推動(dòng)AI系統(tǒng)實(shí)現(xiàn)對數(shù)據(jù)深層含義的真正理解。2.4.3內(nèi)容理解換言之,深度學(xué)習(xí)所學(xué)習(xí)到的僅僅是形式上的關(guān)聯(lián)和模式,而沒有涉及內(nèi)容上的因果關(guān)系。對于AI而言,真正的“智能”不僅要求能夠處理形式,更重要的是要能夠理解數(shù)據(jù)、信息和知識(shí)背后的深層內(nèi)容。只有這樣,AI才能做出具有智能水平的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年云南林業(yè)職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年貴州工商職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫及答案詳細(xì)解析
- 2026年河北資源環(huán)境職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試備考試題及答案詳細(xì)解析
- 2026年衡陽幼兒師范高等??茖W(xué)校單招綜合素質(zhì)筆試備考題庫含詳細(xì)答案解析
- 2026年南寧職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試備考題庫含詳細(xì)答案解析
- 2026年山西機(jī)電職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試備考題庫含詳細(xì)答案解析
- 2026湖南郴州市第二人民醫(yī)院招護(hù)理見習(xí)生5人參考考試題庫及答案解析
- 2026云南文山州財(cái)信人力資源有限公司招聘4人參考考試試題及答案解析
- 2026年四川國際標(biāo)榜職業(yè)學(xué)院單招綜合素質(zhì)考試參考題庫含詳細(xì)答案解析
- 2026年牡丹江大學(xué)單招綜合素質(zhì)筆試參考題庫含詳細(xì)答案解析
- 獨(dú)資股東協(xié)議書范本
- 2024-2025蘇教版小學(xué)數(shù)學(xué)二年級上冊期末考試測試卷及答案(共3套)
- 光伏發(fā)電項(xiàng)目風(fēng)險(xiǎn)
- 風(fēng)力發(fā)電項(xiàng)目分包合同施工合同
- GB/T 8607-2024專用小麥粉
- 新版外國人永久居住身份證考試試題
- 2024年中考數(shù)學(xué)復(fù)習(xí):瓜豆原理講解練習(xí)
- 高一歷史期末試題中國近現(xiàn)代史
- (高清版)DZT 0210-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 硫鐵礦
- QC080000體系內(nèi)部審核檢查表
- 鋼結(jié)構(gòu)課程設(shè)計(jì)-鋼結(jié)構(gòu)平臺(tái)設(shè)計(jì)
評論
0/150
提交評論