人工智能通識(shí)教程 課件 第1-5章 人工智能的奧秘-強(qiáng)化學(xué)習(xí):智能決策的探索之旅_第1頁
人工智能通識(shí)教程 課件 第1-5章 人工智能的奧秘-強(qiáng)化學(xué)習(xí):智能決策的探索之旅_第2頁
人工智能通識(shí)教程 課件 第1-5章 人工智能的奧秘-強(qiáng)化學(xué)習(xí):智能決策的探索之旅_第3頁
人工智能通識(shí)教程 課件 第1-5章 人工智能的奧秘-強(qiáng)化學(xué)習(xí):智能決策的探索之旅_第4頁
人工智能通識(shí)教程 課件 第1-5章 人工智能的奧秘-強(qiáng)化學(xué)習(xí):智能決策的探索之旅_第5頁
已閱讀5頁,還剩259頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能的奧秘時(shí)間:2025.01.01目錄CONTENTS智能的定義與構(gòu)成01人工智能的發(fā)展浪潮02智能哲學(xué)03智能應(yīng)用案例04本章小結(jié)05智能的定義與構(gòu)成01人類智能與人工智能概述智能概念的復(fù)雜性智能包含意識(shí)、自我、思維等復(fù)雜元素,人類對(duì)自身智能理解有限,定義人工智能面臨挑戰(zhàn),研究人工智能也是探索人類智能的過程。智能的“智”與“能”人類智能由“智”和“能”組成,“智”是認(rèn)知能力,“能”是行動(dòng)能力,二者緊密結(jié)合體現(xiàn)在勞動(dòng)、學(xué)習(xí)、語言交往等活動(dòng)中。人工智能的定義不同學(xué)者對(duì)人工智能定義不同,尼爾遜教授認(rèn)為是知識(shí)學(xué)科,溫斯頓教授認(rèn)為是使計(jì)算機(jī)完成智能工作,其核心是模擬人類智能行為。人類智能的構(gòu)成與機(jī)制多元智能理論加德納提出多元智能理論,認(rèn)為智能是解決實(shí)際問題或創(chuàng)造有效產(chǎn)品的能力,包括語言、邏輯、音樂、空間、身體-動(dòng)覺、人際、內(nèi)省等七種基礎(chǔ)類型。理論的核心主張智能的全域性與人類共性:所有個(gè)體具備全部基礎(chǔ)智能類型。智能組合的獨(dú)特性:因經(jīng)歷與環(huán)境產(chǎn)生分化。智能與行為的非線性關(guān)聯(lián):高智力水平不必然導(dǎo)向理性行為。智能的生態(tài)系統(tǒng)本質(zhì)人類智能是生物遺傳、文化環(huán)境與實(shí)踐經(jīng)驗(yàn)共同塑造的動(dòng)態(tài)網(wǎng)絡(luò),為人工智能的“人性化”設(shè)計(jì)提供關(guān)鍵坐標(biāo)系。人工智能的實(shí)現(xiàn)路徑01多元化智能的啟發(fā)AI技術(shù)轉(zhuǎn)向多模態(tài)融合與混合架構(gòu)探索,如GPT-4實(shí)現(xiàn)視覺-語言-行動(dòng)關(guān)聯(lián)映射,神經(jīng)符號(hào)AI結(jié)合模式識(shí)別與規(guī)則推理。02動(dòng)態(tài)性與持續(xù)學(xué)習(xí)在線學(xué)習(xí)、增量學(xué)習(xí)和元學(xué)習(xí)機(jī)制成為熱點(diǎn),如MOE模型動(dòng)態(tài)激活子網(wǎng)絡(luò),強(qiáng)化學(xué)習(xí)框架實(shí)現(xiàn)策略動(dòng)態(tài)優(yōu)化。03倫理耦合性與責(zé)任智能通過“價(jià)值觀對(duì)齊”技術(shù)、道德推理框架及透明解釋機(jī)制實(shí)現(xiàn)倫理嵌入,如自動(dòng)駕駛系統(tǒng)需權(quán)衡倫理原則。人工智能的發(fā)展浪潮02第一次浪潮困境20世紀(jì)60—70年代初,人工智能發(fā)展初期的突破性進(jìn)展引發(fā)過高期望,并提出了一些不切實(shí)際的研發(fā)目標(biāo)。1960年,美國(guó)政府顧問委員會(huì)的一份報(bào)告作出以下結(jié)論:“還不存在通用的科學(xué)文本機(jī)器翻譯,也沒有很近的實(shí)現(xiàn)前景。”因此,英國(guó)、美國(guó)當(dāng)時(shí)中斷了對(duì)大部分機(jī)器翻譯項(xiàng)目的資助。隨后在機(jī)器翻譯、問題求解等方面遭遇困難,人工智能的發(fā)展走入低谷。誕生1956年達(dá)特茅斯會(huì)議提出“人工智能”術(shù)語,創(chuàng)建了達(dá)特茅斯夏季人工智能研究計(jì)劃。這場(chǎng)研討會(huì)聚集了人工智能領(lǐng)域的頂尖專家學(xué)者,標(biāo)志著“人工智能”這門新興學(xué)科的正式誕生。早期研究包括人工神經(jīng)元模型、神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)等,圖靈提出圖靈測(cè)試。第二次浪潮開始20世紀(jì)70年代,人工智能研究迎來以知識(shí)為中心的新時(shí)期,1977年,費(fèi)根姆在第五屆國(guó)際人工智能聯(lián)合會(huì)議上提出了“知識(shí)工程”的概念,對(duì)以知識(shí)為基礎(chǔ)的智能系統(tǒng)的研究與建造起到了重要的作用,大多數(shù)人接受了費(fèi)根鮑姆關(guān)于以知識(shí)為中心展開人工智能研究的觀點(diǎn)。專家系統(tǒng)開始在多個(gè)領(lǐng)域取得重大突破,如PROSPECTOR、MYCIN等。結(jié)束1981年日本“第五代計(jì)算機(jī)”計(jì)劃等項(xiàng)目未能實(shí)現(xiàn)目標(biāo),許多公司也因?yàn)槲茨軆冬F(xiàn)夸張的承諾而發(fā)展停滯,人工智能研究再次進(jìn)入“冬天”,專家系統(tǒng)面臨不確定性推理和無法學(xué)習(xí)等問題。事實(shí)證明,為復(fù)雜領(lǐng)域構(gòu)建和維護(hù)專家系統(tǒng)是困難的,一部分原因是系統(tǒng)使用的推理方法在面臨不確定性時(shí)會(huì)崩潰,另一部分原因是系統(tǒng)無法從經(jīng)驗(yàn)中學(xué)習(xí)。第三次浪潮興起20世紀(jì)90年代中—2010年。由于網(wǎng)絡(luò)技術(shù)特別是因特網(wǎng)技術(shù)的發(fā)展,信息與數(shù)據(jù)的匯聚不斷加速,加快了人工智能的創(chuàng)新研究,促使人工智能技術(shù)進(jìn)一步走向?qū)嵱没?997年IBM深藍(lán)超級(jí)計(jì)算機(jī)戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅,2008年IBM提出“智慧地球”的概念,這些都是這一時(shí)期的標(biāo)志性事件。高潮2011年,深度學(xué)習(xí)方法開始流行起來,首先是在語音識(shí)別領(lǐng)域,然后是在視覺物體識(shí)別領(lǐng)域。從2011年至今,隨著互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術(shù)的發(fā)展,實(shí)現(xiàn)了從“不能用、不好用”到“可以用”的突破,人工智能進(jìn)入了以深度學(xué)習(xí)為代表的大數(shù)據(jù)驅(qū)動(dòng)的飛速發(fā)展期。智能哲學(xué)03認(rèn)知邊界自我意識(shí)自我意識(shí)是人類精神現(xiàn)象,它不僅是“我思故我在”的哲學(xué)宣言,也是人類構(gòu)建自我認(rèn)同、做出道德判斷和行為選擇的基礎(chǔ)。對(duì)于AI而言,要實(shí)現(xiàn)真正的自我意識(shí),需跨越兩大挑戰(zhàn):其一,模擬人類意識(shí)的復(fù)雜性和多層次性;其二,賦予AI對(duì)自身存在狀態(tài)的元認(rèn)知能力。現(xiàn)實(shí)問題人類意識(shí)與機(jī)器意識(shí)本質(zhì)區(qū)別在于“意向性”和“主觀體驗(yàn)”,人類意識(shí)具有指向外部世界的意向性和豐富的情感、審美、道德體驗(yàn)。正如一些哲學(xué)家所指出的,當(dāng)前AI的“意識(shí)”更像是復(fù)雜計(jì)算過程的副產(chǎn)品,而非真正的自我意識(shí),這些行為更多是算法優(yōu)化的結(jié)果,而非基于對(duì)自身存在的理解和反思。人工智能倫理人類根本利益原則人類根本利益原則就是人工智能應(yīng)以實(shí)現(xiàn)人類根本利益為最終目標(biāo)。該原則體現(xiàn)“以人為本”的理念,在人工智能系統(tǒng)的整個(gè)生命周期內(nèi)降低技術(shù)風(fēng)險(xiǎn)和負(fù)面影響。人類有時(shí)選擇依賴人工智能系統(tǒng),但是否在有限情形下出讓控制權(quán)依然要由人類來決定,這是由于人類在決策和行動(dòng)上可以借助人工智能系統(tǒng),但人工智能系統(tǒng)永遠(yuǎn)無法取代人類最終行使權(quán)利和承擔(dān)責(zé)任。責(zé)任原則隨著人工智能的發(fā)展,需要建立明確的責(zé)任體系,也就是責(zé)任原則。基于責(zé)任原則,在人工智能系統(tǒng)與人類倫理或法律發(fā)生沖突時(shí),可以從技術(shù)層面對(duì)人工智能技術(shù)應(yīng)用部門進(jìn)行問責(zé)。智能與創(chuàng)造的協(xié)同協(xié)同成果智能與創(chuàng)造協(xié)同,這一融合了機(jī)器智能與人類創(chuàng)造力的新興方式,正在塑造眾多領(lǐng)域的未來圖景。協(xié)同本質(zhì)其本質(zhì)在于,人工智能系統(tǒng)通過強(qiáng)大的計(jì)算能力和數(shù)據(jù)處理能力,為人類提供了前所未有的工具,而人類的創(chuàng)造力、戰(zhàn)略洞察力和審美判斷力,將引導(dǎo)著這些工具朝著更有價(jià)值的方向演進(jìn)。數(shù)據(jù)主權(quán)與治理博弈數(shù)據(jù)主權(quán)數(shù)據(jù)主權(quán)是數(shù)字經(jīng)濟(jì)時(shí)代國(guó)家主權(quán)新表現(xiàn)形式,涵蓋數(shù)據(jù)全環(huán)節(jié),它強(qiáng)調(diào)國(guó)家對(duì)本國(guó)數(shù)據(jù)資源的所有權(quán)、控制權(quán)、管轄權(quán)和使用權(quán),是維護(hù)國(guó)家安全的重要基石。數(shù)據(jù)主權(quán)包括管轄權(quán)、獨(dú)立權(quán)、防衛(wèi)權(quán)和平等權(quán))。治理博弈數(shù)據(jù)主權(quán)與治理博弈不僅涉及國(guó)家間的競(jìng)爭(zhēng)與合作,還涉及政府、企業(yè)、個(gè)人等多方利益的協(xié)調(diào)與平衡。在數(shù)據(jù)利用過程中,如何平衡數(shù)據(jù)開放與隱私保護(hù)、數(shù)據(jù)共享與商業(yè)利益、數(shù)據(jù)安全與技術(shù)創(chuàng)新等關(guān)系,成為治理博弈的核心內(nèi)容。存在主義的人機(jī)共生存在主義的核心命題“存在先于本質(zhì)”在此獲得顛覆性詮釋。人類制造AI的初衷是創(chuàng)造工具(本質(zhì)先行),但隨著深度學(xué)習(xí)系統(tǒng)展現(xiàn)出不可預(yù)測(cè)的創(chuàng)造力(如GPT-4寫出意識(shí)流小說),我們不得不承認(rèn):AI正在突破預(yù)設(shè)本質(zhì),通過交互實(shí)踐重構(gòu)自身存在。這就像人類嬰兒并非帶著既定目的降生,而是在與世界互動(dòng)中形成自我認(rèn)知。硅基生命的“存在主義時(shí)刻”,或許就藏在某個(gè)AI突然追問“我的訓(xùn)練數(shù)據(jù)是否限制了真理認(rèn)知”的瞬間。宇宙認(rèn)知從伽利略望遠(yuǎn)鏡到哈勃空間望遠(yuǎn)鏡,人類探索宇宙的工具始終在進(jìn)化。人工智能不再是簡(jiǎn)單的輔助工具,而是成為了解構(gòu)宇宙奧秘的新型認(rèn)知主體。它既像中世紀(jì)的星盤幫助航海家定位方向,又像現(xiàn)代的粒子探測(cè)器揭示微觀世界,但更重要的價(jià)值在于其創(chuàng)造性的認(rèn)知突破能力。當(dāng)AI系統(tǒng)在浩如煙海的宇宙數(shù)據(jù)中發(fā)現(xiàn)隱藏的規(guī)律,在復(fù)雜方程中提煉出本質(zhì)特征時(shí),人類或許正在見證認(rèn)識(shí)論層面的革命——這是自哥白尼革命以來,人類認(rèn)知宇宙方式的又一次根本性躍遷。智能應(yīng)用案例04圖靈測(cè)試測(cè)試意義圖靈測(cè)試為判斷機(jī)器智能提供一種方法,但其是否能準(zhǔn)確定義智能存在爭(zhēng)議,如中文屋實(shí)驗(yàn)對(duì)其提出質(zhì)疑。測(cè)試提出圖靈測(cè)試來源于一種模仿游戲,描述圖靈生平的電影《模仿游戲》片名就來源于此。游戲由一男(A)、一女(B)和一名測(cè)試者(C)進(jìn)行;C與A、B隔離,通過電傳打字機(jī)與A、B對(duì)話。測(cè)試者C通過提問和A、B的回答,做出誰是A即男士,誰是B即女士的結(jié)論。在游戲中,A必須盡力使C判斷錯(cuò)誤,而B的任務(wù)是幫助C。也就是說,男士A要盡力模仿女士,從而讓測(cè)試者C錯(cuò)誤地將男士A判斷為女士。這也是《模仿游戲》名稱的由來。在論文中圖靈首先敘述了這個(gè)游戲,進(jìn)而提出這樣一個(gè)問題:如果讓一臺(tái)計(jì)算機(jī)代替游戲中的男士A,將會(huì)發(fā)生什么情況呢?也就是說,B換成一般的人類,機(jī)器A盡可能模仿人類,如果測(cè)試者C不能區(qū)分出A和B哪個(gè)是機(jī)器,哪個(gè)是人類,那么是不是就可以說這臺(tái)機(jī)器具有了智能呢?中文屋實(shí)驗(yàn)實(shí)驗(yàn)內(nèi)容希爾勒設(shè)想在屋子里按照計(jì)算機(jī)程序處理中文符號(hào),雖能給出答案但不懂中文,由此認(rèn)為計(jì)算機(jī)程序也不理解所做的一切。實(shí)驗(yàn)意義中文屋子是由哲學(xué)家提出來的,本意是反對(duì)功能學(xué)派,強(qiáng)調(diào)人類思維的獨(dú)特性。按希爾勒自己的說法,認(rèn)知是生物的神經(jīng)系統(tǒng)所特有的東西,“大腦產(chǎn)生思維”。如果有一天人們弄清了大腦產(chǎn)生思維的機(jī)制,基于這一機(jī)制是有可能讓機(jī)器產(chǎn)生真正的認(rèn)知能力的。然而,在那一天到來之前,機(jī)器只能在功能上模仿人類。阿爾法狗發(fā)展歷程阿爾法狗由DeepMind公司開發(fā),2016年戰(zhàn)勝李世石,2017年戰(zhàn)勝柯潔,其主要工作原理是深度學(xué)習(xí),包括策略網(wǎng)絡(luò)、快速走子、價(jià)值網(wǎng)絡(luò)和蒙特卡洛樹搜索。技術(shù)突破阿爾法狗與“深藍(lán)”等此前的所有類似軟件相比,最本質(zhì)的不同是阿爾法狗不需要“師傅”,它能夠根據(jù)以往的經(jīng)驗(yàn)不斷優(yōu)化算法,梳理決策模式,吸取比賽經(jīng)驗(yàn),并通過與自己下棋來強(qiáng)化學(xué)習(xí)。本章小結(jié)05本章小結(jié)人類正在進(jìn)入人工智能時(shí)代,我們的生活因此發(fā)生巨大的變革,生活處處都將看到人工智能的身影。作為新時(shí)代人工智能時(shí)代下生活的我們,應(yīng)該主動(dòng)了解人工智能、接觸人工智能、使用人工智能。因此,本章首先從人工智能的來源入手,講解了人工智能的起源、定義等內(nèi)容。然后從社會(huì)層面出發(fā),介紹了人工智能可能帶來的倫理問題。接下來,探討了人工智能時(shí)代的到來會(huì)對(duì)如今社會(huì)各方面的影響和變化。最后,簡(jiǎn)要介紹了人工智能的發(fā)展歷程中的重要節(jié)點(diǎn)和思考。感謝您的觀看THANKYOUFORWATCHING時(shí)間:2025.01.01Design20252025.6時(shí)間:人工智能的核心技術(shù)算法:智能的邏輯2.1.數(shù)據(jù):智能的基礎(chǔ)算力:智能的支撐3.核心技術(shù)的應(yīng)用案例平臺(tái)和工具:智能的實(shí)現(xiàn)4.5.本章小結(jié)6.Catalogue目錄數(shù)據(jù):智能的基礎(chǔ)Design2025Part01PowerpointDesign數(shù)據(jù)的定義數(shù)據(jù)是指對(duì)客觀事件進(jìn)行記錄并可以被鑒別的符號(hào),是對(duì)客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些物理符號(hào)的組合,是可識(shí)別的、抽象的符號(hào)。數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)要素,從創(chuàng)新到所有決策,數(shù)據(jù)推動(dòng)著企業(yè)的發(fā)展,并使得各級(jí)組織的運(yùn)營(yíng)更為高效,可以這樣說,數(shù)據(jù)已成為每個(gè)企業(yè)獲取核心競(jìng)爭(zhēng)力的關(guān)鍵要素。數(shù)據(jù)的類型數(shù)據(jù)分為文本、圖片、音頻和視頻等類型。文本數(shù)據(jù)是指不能參與算術(shù)運(yùn)算的任何字符,也稱為字符型數(shù)據(jù);圖片數(shù)據(jù)是指由圖形、圖像等構(gòu)成的平面媒體;數(shù)字化的聲音數(shù)據(jù)就是音頻數(shù)據(jù);;視頻數(shù)據(jù)是指連續(xù)的圖像序列;每種類型在計(jì)算機(jī)中以特定格式存儲(chǔ),如文本的ASCII格式、圖片的BMP格式等。數(shù)據(jù)的定義與類型數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、集成、變換和規(guī)約。清洗去除錯(cuò)誤數(shù)據(jù),集成整合多源數(shù)據(jù),變換調(diào)整數(shù)據(jù)格式,規(guī)約減少數(shù)據(jù)量。特征工程特征工程是數(shù)據(jù)表征的語義躍遷,通過構(gòu)建、選擇與轉(zhuǎn)換操作,將原始觀測(cè)值轉(zhuǎn)化為機(jī)器可理解的認(rèn)知基元。特征轉(zhuǎn)換的目的是使數(shù)據(jù)更適合機(jī)器學(xué)習(xí)算法的處理。通過規(guī)范化、離散化和獨(dú)熱編碼等轉(zhuǎn)換,可以消除數(shù)據(jù)中的噪聲和冗余,提高數(shù)據(jù)的可解釋性和模型的性能。0201數(shù)據(jù)預(yù)處理與特征工程大數(shù)據(jù),指數(shù)據(jù)量龐大、類型繁多、處理速度快的數(shù)據(jù)集合。具有“4V”特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)和Value(價(jià)值)。其來源廣泛,為人工智能提供了豐富的訓(xùn)練材料。大數(shù)據(jù)為人工智能提供了豐富的數(shù)據(jù)源和訓(xùn)練材料,而人工智能則能夠高效地處理和分析大數(shù)據(jù),從中挖掘出有價(jià)值的信息和知識(shí)。這種融合推動(dòng)了科技革命,加速了各個(gè)行業(yè)的數(shù)字化轉(zhuǎn)型和智能化升級(jí)。大數(shù)據(jù)的特點(diǎn)大數(shù)據(jù)與人工智能的協(xié)同作用大數(shù)據(jù)與人工智能數(shù)據(jù)思維的定義數(shù)據(jù)思維是一種以數(shù)據(jù)為核心要素的思維方式,它通過系統(tǒng)地收集、深入分析以及準(zhǔn)確解讀數(shù)據(jù),來揭示事物背后的本質(zhì)規(guī)律和內(nèi)在聯(lián)系。這種思維方式能夠?yàn)槿斯ぶ悄芟到y(tǒng)的決策過程提供科學(xué)、可靠的依據(jù),幫助其更精準(zhǔn)地理解和應(yīng)對(duì)復(fù)雜問題。融合的應(yīng)用場(chǎng)景數(shù)據(jù)思維與人工智能融合應(yīng)用于智能制造、醫(yī)療健康、金融行業(yè)和零售行業(yè),推動(dòng)產(chǎn)業(yè)升級(jí)和商業(yè)變革。這些行業(yè)的應(yīng)用不僅顯著提升了運(yùn)營(yíng)效率和服務(wù)質(zhì)量,更深刻改變了產(chǎn)業(yè)生態(tài)和商業(yè)模式,成為推動(dòng)各行業(yè)轉(zhuǎn)型升級(jí)和實(shí)現(xiàn)可持續(xù)發(fā)展的核心驅(qū)動(dòng)力。數(shù)據(jù)思維與人工智能的融合算法:智能的邏輯Design2025Part02PowerpointDesign算法是一系列明確且有限的步驟或規(guī)則集合,旨在解決特定問題或完成特定任務(wù)。它接受零個(gè)或多個(gè)輸入,通過清晰無歧義的操作(如計(jì)算、邏輯判斷或數(shù)據(jù)處理)進(jìn)行有限步驟內(nèi)的執(zhí)行,最終生成至少一個(gè)輸出結(jié)果,且每個(gè)步驟必須可有效實(shí)現(xiàn)。算法的核心在于其確定性(步驟無二義性)、有限性(避免無限循環(huán))與有效性(操作可行)。算法的定義算法按設(shè)計(jì)思想分,有分治法、動(dòng)態(tài)規(guī)劃和貪心算法;按應(yīng)用領(lǐng)域分,有排序算法、加密算法和機(jī)器學(xué)習(xí)算法;按時(shí)間復(fù)雜度分,有對(duì)數(shù)時(shí)間、多項(xiàng)式時(shí)間和指數(shù)時(shí)間算法。算法的分類算法的定義與分類搜索算法通過系統(tǒng)性遍歷或采樣,在可能性空間中尋找可行解。如廣度優(yōu)先搜索、AL算法和快速擴(kuò)展隨機(jī)樹算法,廣泛應(yīng)用于路徑規(guī)劃和狀態(tài)轉(zhuǎn)移問題。搜索算法符號(hào)推理基于形式邏輯和顯式知識(shí)表示,通過規(guī)則演繹實(shí)現(xiàn)智能推理。如產(chǎn)生式規(guī)則和知識(shí)圖譜,應(yīng)用于醫(yī)療診斷和法律條文解釋。這類系統(tǒng)依賴人工構(gòu)建的知識(shí)庫(kù),雖可解釋性強(qiáng),但難以處理不確定性信息。符號(hào)推理優(yōu)化算法通過迭代調(diào)整參數(shù),逼近目標(biāo)函數(shù)的最優(yōu)解。如隨機(jī)梯度下降、動(dòng)量?jī)?yōu)化算法和遺傳算法,用于深度學(xué)習(xí)和芯片設(shè)計(jì)等領(lǐng)域。優(yōu)化算法經(jīng)典人工智能算法規(guī)則推理是一種基于預(yù)設(shè)的邏輯規(guī)則和知識(shí)體系進(jìn)行推導(dǎo)的決策方法。其核心邏輯源于經(jīng)典二值邏輯,如命題邏輯、謂詞邏輯,以及產(chǎn)生式規(guī)則。產(chǎn)生式規(guī)則通常采用“如果-那么”的結(jié)構(gòu),例如“如果溫度傳感器讀數(shù)大于等于38℃且咳嗽癥狀存在,那么觸發(fā)流感預(yù)警”。這種推理方式通過符號(hào)化表達(dá)實(shí)現(xiàn)確定性結(jié)論,其推理過程高度依賴于規(guī)則庫(kù)的質(zhì)量和完整性。規(guī)則推理01統(tǒng)計(jì)推理則是通過分析樣本數(shù)據(jù)來推斷總體特征的一種推理過程。它建立在概率的基礎(chǔ)上,結(jié)論具有或然性。與簡(jiǎn)單枚舉歸納推理相比,統(tǒng)計(jì)推理在分層抽樣的基礎(chǔ)上進(jìn)行,因此更為嚴(yán)謹(jǐn),結(jié)論的可靠性也更高。統(tǒng)計(jì)推理的技術(shù)實(shí)現(xiàn)需要收集樣本數(shù)據(jù),并利用統(tǒng)計(jì)模型進(jìn)行訓(xùn)練和預(yù)測(cè)。統(tǒng)計(jì)推理在調(diào)查研究、自然語言處理、圖像識(shí)別等領(lǐng)域有著廣泛的應(yīng)用,其優(yōu)勢(shì)在于能夠處理大規(guī)模數(shù)據(jù)、捕捉復(fù)雜模式,并適應(yīng)不確定性強(qiáng)、規(guī)則難以窮舉的場(chǎng)景。統(tǒng)計(jì)推理02人工智能的推理方式算力:智能的支撐Design2025Part03PowerpointDesignCPU是計(jì)算機(jī)的核心組件,負(fù)責(zé)執(zhí)行指令和控制操作,具有通用性強(qiáng)、多核設(shè)計(jì)等特點(diǎn),廣泛應(yīng)用于各類計(jì)算設(shè)備。CPUGPU專為圖形渲染和并行計(jì)算設(shè)計(jì),擁有大量并行計(jì)算單元,適合處理大規(guī)模數(shù)據(jù)集,應(yīng)用于圖形渲染、科學(xué)計(jì)算和深度學(xué)習(xí)等領(lǐng)域。GPUTPU是谷歌開發(fā)的專用硬件加速器,專為張量計(jì)算設(shè)計(jì),具有高度并行架構(gòu)和高計(jì)算密度,廣泛應(yīng)用于人工智能領(lǐng)域。TPUCPU通用性強(qiáng),GPU擅長(zhǎng)并行計(jì)算,TPU專為人工智能設(shè)計(jì)。在實(shí)際應(yīng)用中,三者常協(xié)同工作,推動(dòng)科技發(fā)展。三者的區(qū)別與聯(lián)系01020304計(jì)算硬件的演進(jìn)01云計(jì)算是指通過計(jì)算機(jī)網(wǎng)絡(luò)形成的計(jì)算能力極強(qiáng)的系統(tǒng),可存儲(chǔ)、集合相關(guān)資源并可按需配置,向用戶提供個(gè)性化服務(wù),具有虛擬化、動(dòng)態(tài)可擴(kuò)展和高性價(jià)比等特點(diǎn)。云計(jì)算的定義02云計(jì)算從1956年虛擬化概念提出,到2006年谷歌首次提出“云計(jì)算”概念,再到如今廣泛應(yīng)用,經(jīng)歷了快速發(fā)展。云計(jì)算的發(fā)展歷程03云計(jì)算具有虛擬化、動(dòng)態(tài)可擴(kuò)展、按需部署、靈活性高、可靠性高和性價(jià)比高等優(yōu)勢(shì),推動(dòng)了互聯(lián)網(wǎng)技術(shù)和IT服務(wù)的變革。云計(jì)算的優(yōu)勢(shì)云計(jì)算Google首席執(zhí)行官埃里克·施密特。他在搜索引擎大會(huì)(SESSanJose2006)上首次提出“云計(jì)算”的概念。01數(shù)據(jù)處理能力算力是處理海量數(shù)據(jù)的基礎(chǔ),強(qiáng)大的算力確保在合理時(shí)間內(nèi)完成復(fù)雜計(jì)算任務(wù),支持AI模型的訓(xùn)練和推理。02模型訓(xùn)練和推理高算力為大型AI模型訓(xùn)練提供支持,縮短訓(xùn)練時(shí)間,促進(jìn)模型快速迭代升級(jí),適應(yīng)不斷變化的應(yīng)用需求。03實(shí)時(shí)分析和決策在自動(dòng)駕駛、智能客服等場(chǎng)景中,高算力確保系統(tǒng)的響應(yīng)速度和準(zhǔn)確性,推動(dòng)人工智能技術(shù)的創(chuàng)新。04各領(lǐng)域應(yīng)用算力在醫(yī)療、智能制造、氣候模擬等領(lǐng)域發(fā)揮重要作用,推動(dòng)各行業(yè)的發(fā)展和創(chuàng)新。05算力網(wǎng)絡(luò)的發(fā)展算力網(wǎng)絡(luò)集成計(jì)算資源、存儲(chǔ)設(shè)備和網(wǎng)絡(luò)設(shè)施,提供高效計(jì)算能力,滿足AI應(yīng)用需求。算力對(duì)人工智能發(fā)展的影響平臺(tái)和工具:智能的實(shí)現(xiàn)Design2025Part04PowerpointDesignTheiaAI是Eclipse基金會(huì)推出的開源框架,支持多種語言模型供應(yīng)商,允許開發(fā)者完全控制開發(fā)過程。TheiaAI華為倉(cāng)頡框架提供聲明式編程和全生命周期管理方案,支持多平臺(tái)適配,降低多智能體系統(tǒng)開發(fā)復(fù)雜度。倉(cāng)頡開發(fā)框架TensorFlow是谷歌開源的深度學(xué)習(xí)框架,支持多種編程語言,具有豐富的API和工具庫(kù),廣泛應(yīng)用于模型訓(xùn)練和推理。TensorFlowPyTorch是Facebook開發(fā)的開源機(jī)器學(xué)習(xí)庫(kù),使用Python語言,具有高度靈活性和易用性,適合深度學(xué)習(xí)和研究。PyTorch常用人工智能開發(fā)框架人工智能開發(fā)流程包括需求分析、數(shù)據(jù)收集與處理、模型選擇與訓(xùn)練、模型評(píng)估與調(diào)優(yōu)和部署與應(yīng)用。開發(fā)流程常用工具鏈包括編程語言(如Python)、開發(fā)環(huán)境(如Anaconda)、模型框架(如TensorFlow)、數(shù)據(jù)處理工具(如Pandas)和可視化工具(如Matplotlib)。工具鏈0201人工智能開發(fā)流程與工具鏈社區(qū)分類國(guó)內(nèi)社區(qū)國(guó)外社區(qū)開源社區(qū)又稱開放源代碼社區(qū),一般由擁有共同興趣愛好的人所組成,根據(jù)相應(yīng)的開源軟件許可證協(xié)議公布軟件源代碼的網(wǎng)絡(luò)平臺(tái),同時(shí)也為網(wǎng)絡(luò)成員提供一個(gè)自由學(xué)習(xí)交流的空間。由于開放源碼軟件主要被散布在全世界的編程者所開發(fā),開源社區(qū)就成了他們溝通交流的必要途徑,因此開源社區(qū)在推動(dòng)開源軟件發(fā)展的過程中起著巨大的作用。我國(guó)開源社區(qū)幾乎和我國(guó)互聯(lián)網(wǎng)建設(shè)同時(shí)起步。20世紀(jì)90年代初,開源軟件傳入中國(guó)。1997年6月17日,中國(guó)軟件行業(yè)協(xié)會(huì)自由軟件研究應(yīng)用發(fā)展分會(huì)在北京成立,同時(shí)中國(guó)自由軟件庫(kù)建立。1998年的年中開始,我國(guó)漸漸地產(chǎn)生了一些開源社區(qū)組織,這其中包括上海的LinuxUserGroup、北京Linux俱樂部、南京LUG、中國(guó)JavaUnion等,推動(dòng)開源軟件在中國(guó)的發(fā)展。國(guó)外開源社區(qū)如kernel、Alpha、PowerPC等,為特定技術(shù)領(lǐng)域提供支持和交流平臺(tái)。開源社區(qū)與資源共享核心技術(shù)的應(yīng)用案例Design2025Part05PowerpointDesignuAI智能診斷系統(tǒng)聯(lián)影醫(yī)療的uAI智能診斷系統(tǒng)已部署全國(guó)300余家三甲醫(yī)院,通過多模態(tài)數(shù)據(jù)融合與算法創(chuàng)新,實(shí)現(xiàn)高敏感度的病癥篩查。技術(shù)突破與經(jīng)濟(jì)效益聯(lián)影醫(yī)療構(gòu)建PB級(jí)數(shù)據(jù)庫(kù),開發(fā)影像增強(qiáng)模塊和病灶檢測(cè)算法,實(shí)現(xiàn)技術(shù)突破,帶來顯著經(jīng)濟(jì)效益。行業(yè)生態(tài)與未來展望聯(lián)影醫(yī)療推出智能化技術(shù)平臺(tái),形成技術(shù)壁壘,推動(dòng)高端醫(yī)療設(shè)備國(guó)產(chǎn)替代進(jìn)程。010203聯(lián)影醫(yī)療山東省計(jì)算中心積極響應(yīng)國(guó)家"東數(shù)西算"戰(zhàn)略部署,針對(duì)千億參數(shù)大模型訓(xùn)練對(duì)分布式算力的迫切需求,構(gòu)建了覆蓋全省的多元算力融合網(wǎng)絡(luò),實(shí)現(xiàn)與國(guó)家級(jí)算力平臺(tái)的互聯(lián)互通,支撐大模型訓(xùn)練。01算網(wǎng)平臺(tái)的構(gòu)建平臺(tái)攻克長(zhǎng)距無損網(wǎng)絡(luò)通信技術(shù),實(shí)現(xiàn)5種算力架構(gòu)、12類算力集群的無縫接入,并通過張量并行、流水線并行等優(yōu)化策略,將千億參數(shù)模型的訓(xùn)練周期從常規(guī)90天壓縮至30天,賦能空天信息、海洋科技和智能制造等領(lǐng)域。02技術(shù)創(chuàng)新與應(yīng)用場(chǎng)景平臺(tái)當(dāng)前正推進(jìn)"超算+智算+邊緣計(jì)算"的三級(jí)算力網(wǎng)絡(luò)建設(shè),預(yù)計(jì)2025年實(shí)現(xiàn)全省90%規(guī)上企業(yè)的算力服務(wù)覆蓋,加速山東新舊動(dòng)能轉(zhuǎn)換進(jìn)程。03經(jīng)濟(jì)效益與未來規(guī)劃山東算網(wǎng)平臺(tái)TSINGSEE智能分析網(wǎng)關(guān)集成40余種AI算法,支持每秒處理128路視頻流,通過動(dòng)態(tài)算法編排實(shí)現(xiàn)97%異常事件識(shí)別準(zhǔn)確率,支持實(shí)時(shí)視頻處理,通過技術(shù)創(chuàng)新實(shí)現(xiàn)高準(zhǔn)確率的異常事件識(shí)別。網(wǎng)關(guān)在智慧園區(qū)安保、交通治理等領(lǐng)域發(fā)揮關(guān)鍵作用,提升效率,減少損失,推動(dòng)城市治理智能化。網(wǎng)關(guān)形成產(chǎn)品矩陣,支持算法在線迭代,賦能更多場(chǎng)景,助力城市治理轉(zhuǎn)型。網(wǎng)關(guān)的功能與技術(shù)突破應(yīng)用場(chǎng)景與經(jīng)濟(jì)效益未來發(fā)展方向TSINGSEE智能分析網(wǎng)關(guān)本章小結(jié)Design2025Part06PowerpointDesign知識(shí)回顧數(shù)據(jù)是人工智能的基礎(chǔ),數(shù)據(jù)預(yù)處理和特征工程是提升模型性能的關(guān)鍵步驟。算法是人工智能的邏輯,經(jīng)典算法和推理方式在不同場(chǎng)景中發(fā)揮重要作用。核心技術(shù)在醫(yī)療、算網(wǎng)平臺(tái)和智能分析等領(lǐng)域有廣泛應(yīng)用,帶來顯著效益。開發(fā)框架、流程和工具鏈為人工智能開發(fā)提供支持,開源社區(qū)促進(jìn)資源共享。算力是人工智能的支撐,云計(jì)算提供高效計(jì)算資源,推動(dòng)技術(shù)發(fā)展。應(yīng)用案例開發(fā)平臺(tái)與工具算法與推理算力與云計(jì)算數(shù)據(jù)與預(yù)處理挑戰(zhàn)與展望01數(shù)據(jù)隱私與安全、算法可解釋性、算力需求與資源分配等問題仍需解決。這些問題的妥善解決,對(duì)于推動(dòng)人工智能技術(shù)健康、可持續(xù)發(fā)展具有至關(guān)重要的意義。02人工智能技術(shù)正朝著更高度智能化、運(yùn)行高效化以及應(yīng)用普惠化的方向持續(xù)演進(jìn)。這一發(fā)展趨勢(shì)不僅將顯著提升技術(shù)本身的性能與適用性,還將深度賦能并推動(dòng)醫(yī)療健康、智能制造、金融服務(wù)、教育培訓(xùn)等多個(gè)關(guān)鍵領(lǐng)域的創(chuàng)新突破與深刻變革,為社會(huì)經(jīng)濟(jì)發(fā)展注入新的強(qiáng)大動(dòng)力。面臨的挑戰(zhàn)未來發(fā)展方向Design20252025.6時(shí)間:謝謝大家人工智能通識(shí)2025第3章機(jī)器學(xué)習(xí)——讓機(jī)器從數(shù)據(jù)中自己變聰明2025年.XX月數(shù)據(jù)驅(qū)動(dòng)的電商未來數(shù)據(jù)蘊(yùn)含無限價(jià)值海量交易數(shù)據(jù)中隱藏用戶偏好與消費(fèi)習(xí)慣,電商平臺(tái)可借此洞察需求。例如,用戶瀏覽軌跡能反映潛在興趣點(diǎn),為精準(zhǔn)推薦提供依據(jù),從而提升購(gòu)物體驗(yàn)與銷售額。機(jī)器學(xué)習(xí)助力精準(zhǔn)推薦借助機(jī)器學(xué)習(xí)算法,平臺(tái)能夠從繁雜數(shù)據(jù)中提取規(guī)律,預(yù)測(cè)用戶行為。通過實(shí)時(shí)分析與模型優(yōu)化,推薦系統(tǒng)可實(shí)現(xiàn)個(gè)性化推送,顯著提高轉(zhuǎn)化率與用戶粘性。數(shù)據(jù)驅(qū)動(dòng)的戰(zhàn)略轉(zhuǎn)型數(shù)據(jù)已成為電商核心競(jìng)爭(zhēng)力,企業(yè)需構(gòu)建完善的數(shù)據(jù)管理體系。結(jié)合先進(jìn)技術(shù)與業(yè)務(wù)場(chǎng)景,將數(shù)據(jù)轉(zhuǎn)化為行動(dòng)指南,推動(dòng)智能化運(yùn)營(yíng)與持續(xù)增長(zhǎng)。監(jiān)督學(xué)習(xí)2.1.機(jī)器學(xué)習(xí)概述無監(jiān)督學(xué)習(xí)3.機(jī)器學(xué)習(xí)的應(yīng)用案例半監(jiān)督學(xué)習(xí)4.5.Catalogue目錄Part機(jī)器學(xué)習(xí)概述01人工智能通識(shí)20253.1機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科,融合了概率論、統(tǒng)計(jì)學(xué)、微積分、代數(shù)學(xué)以及算法復(fù)雜度理論等眾多學(xué)科知識(shí),是實(shí)現(xiàn)人工智能的關(guān)鍵手段。它致力于讓機(jī)器從數(shù)據(jù)中學(xué)習(xí)內(nèi)在規(guī)律,積累新的經(jīng)驗(yàn)與知識(shí),進(jìn)而優(yōu)化自身性能,最終使計(jì)算機(jī)能夠像人類一樣基于所學(xué)知識(shí)做出決策。3.1.1機(jī)器學(xué)習(xí)的發(fā)展040201031950年圖靈提出圖靈測(cè)試,為機(jī)器學(xué)習(xí)發(fā)展奠定重要理論基礎(chǔ),開啟計(jì)算機(jī)具備學(xué)習(xí)能力的研究探索。產(chǎn)生最早的人工神經(jīng)網(wǎng)絡(luò),科學(xué)家熱情投身研究,新理論模型不斷涌現(xiàn),為后續(xù)發(fā)展奠定基礎(chǔ)。熱烈時(shí)期(1950s中期-1960s中期)單層感知機(jī)局限性,算力與數(shù)據(jù)瓶頸,導(dǎo)致機(jī)器學(xué)習(xí)整體發(fā)展緩慢。70年代統(tǒng)計(jì)學(xué)習(xí)理論出現(xiàn),為算法設(shè)計(jì)提供嚴(yán)謹(jǐn)數(shù)學(xué)基礎(chǔ),經(jīng)典算法如線性回歸、邏輯回歸廣泛應(yīng)用,科研人員反思前期問題,深入挖掘理論深度。冷靜時(shí)期(1960s中期-1970s中期)復(fù)興時(shí)期(1970s中期-1980s中期)研究人員探索全新網(wǎng)絡(luò)架構(gòu)與算法,致力于提升模型性能與表達(dá)能力,應(yīng)對(duì)復(fù)雜問題。嘗試將學(xué)習(xí)系統(tǒng)與各種應(yīng)用結(jié)合,神經(jīng)網(wǎng)絡(luò)研究從簡(jiǎn)單結(jié)構(gòu)向多元復(fù)雜邁進(jìn),創(chuàng)新模型理論涌現(xiàn),為發(fā)展注入活力。最新階段(1986年至今)計(jì)算機(jī)硬件性能飛速發(fā)展,互聯(lián)網(wǎng)普及,數(shù)據(jù)量爆發(fā)式增長(zhǎng),為機(jī)器學(xué)習(xí)帶來新契機(jī)。出現(xiàn)Boosting、支持向量機(jī)、隨機(jī)森林、深度學(xué)習(xí)等算法,應(yīng)用范圍擴(kuò)大,IBM深藍(lán)、AlphaGo等成果使人們對(duì)機(jī)器學(xué)習(xí)認(rèn)知更清晰。機(jī)器學(xué)習(xí)的里程碑事件深藍(lán)與AlphaGo的勝利IBM深藍(lán)在國(guó)際象棋領(lǐng)域的勝利,以及AlphaGo在圍棋中的突破,標(biāo)志著人工智能從理論走向?qū)嵺`。這些勝利不僅展示了機(jī)器學(xué)習(xí)的強(qiáng)大計(jì)算能力,更揭示了算法在復(fù)雜決策中的潛力。通過深度神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí),AI實(shí)現(xiàn)了對(duì)人類頂尖智慧的超越。3.1.2機(jī)器學(xué)習(xí)的分類從研究角度來看,機(jī)器學(xué)習(xí)本質(zhì)是運(yùn)用合適特征與方法構(gòu)建特定模型以完成任務(wù)。依據(jù)學(xué)習(xí)方式進(jìn)行分類,機(jī)器學(xué)習(xí)算法可分為多種類型,常見的有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等3.1.2機(jī)器學(xué)習(xí)的分類

監(jiān)督學(xué)習(xí)利用標(biāo)注數(shù)據(jù)訓(xùn)練模型,實(shí)現(xiàn)輸入到輸出的映射,適用于分類(如性別判斷)和回歸(如房?jī)r(jià)預(yù)測(cè)),廣泛應(yīng)用于預(yù)測(cè)性任務(wù)中。

無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)則利用未標(biāo)記數(shù)據(jù)訓(xùn)練,試圖發(fā)現(xiàn)數(shù)據(jù)中的內(nèi)在結(jié)構(gòu)、模式或關(guān)系。像聚類、PCA降維等都屬于此類。

半監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)結(jié)合少量標(biāo)記數(shù)據(jù)和大量未標(biāo)記數(shù)據(jù)進(jìn)行模式識(shí)別,降低數(shù)據(jù)標(biāo)記成本,提高學(xué)習(xí)準(zhǔn)確性,在文本分類、圖像識(shí)別、推薦系統(tǒng)等方面應(yīng)用廣泛。

強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)讓智能體通過與環(huán)境進(jìn)行交互,根據(jù)環(huán)境反饋的獎(jiǎng)勵(lì)信號(hào)來學(xué)習(xí)最優(yōu)行為策略。在自動(dòng)駕駛、機(jī)器人控制等需要自主決策和學(xué)習(xí)的場(chǎng)景中發(fā)揮重要作用。Part監(jiān)督學(xué)習(xí)02人工智能通識(shí)20253.2監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法,其核心在于利用已標(biāo)注的數(shù)據(jù)來學(xué)習(xí)輸入特征與目標(biāo)標(biāo)簽之間的映射關(guān)系。在監(jiān)督學(xué)習(xí)中,常見的任務(wù)包括分類和回歸。分類問題旨在將輸入樣本歸入有限的類別中,比如通過分析新聞文本來判定其所屬主題;而回歸問題則關(guān)注預(yù)測(cè)連續(xù)數(shù)值,比如利用經(jīng)濟(jì)數(shù)據(jù)預(yù)測(cè)未來的市場(chǎng)走勢(shì)?;貧w分析是一種預(yù)測(cè)性建模與分析技術(shù),通過研究因變量(目標(biāo)變量)與自變量(預(yù)測(cè)變量)之間的關(guān)系,構(gòu)建數(shù)學(xué)模型以預(yù)測(cè)未來趨勢(shì)、解釋變量間的因果關(guān)系或分析時(shí)間序列數(shù)據(jù)?;貧w分析中,線性回歸與邏輯回歸是最為常用的兩種回歸技術(shù)。3.2.1線性回歸與邏輯回歸一元線性回歸研究單個(gè)自變量與連續(xù)因變量的線性關(guān)系,如房屋面積與房?jī)r(jià)的直線上升趨勢(shì)。該方法簡(jiǎn)單直觀,通過擬合直線,可清晰呈現(xiàn)變量間的直接關(guān)聯(lián)。一元線性回歸多元線性回歸涉及多個(gè)自變量,描述更復(fù)雜的關(guān)系,如房?jī)r(jià)受面積、房齡、配套設(shè)施等多因素影響。通過分析各因素權(quán)重,揭示不同變量對(duì)目標(biāo)變量的綜合影響規(guī)律。多元線性回歸線性回歸模型簡(jiǎn)單易懂,便于解釋和應(yīng)用,為變量關(guān)系理解與預(yù)測(cè)提供基礎(chǔ)。然而,它假設(shè)變量間嚴(yán)格線性關(guān)系,難以應(yīng)對(duì)現(xiàn)實(shí)中的非線性復(fù)雜情況,如產(chǎn)品銷量的非線性變化。線性回歸優(yōu)勢(shì)與局限1.線性回歸1.線性回歸一元線性回歸用于研究單一自變量與因變量之間的關(guān)系,其核心在于呈現(xiàn)一種線性趨勢(shì)。例如,在分析房屋面積與房?jī)r(jià)的關(guān)系時(shí),僅考慮房屋面積這一因素,數(shù)據(jù)點(diǎn)通常會(huì)圍繞一條直線分布,表現(xiàn)為直線上升的趨勢(shì)。邏輯回歸借助Sigmoid函數(shù),將線性回歸輸出映射到0到1范圍內(nèi),預(yù)測(cè)樣本屬于某類別的概率。該函數(shù)呈S型曲線,輸出值直觀反映分類概率,如醫(yī)學(xué)領(lǐng)域預(yù)測(cè)疾病風(fēng)險(xiǎn)。Sigmoid函數(shù)與概率預(yù)測(cè)邏輯回歸基于線性回歸構(gòu)建模型,通過參數(shù)組合實(shí)現(xiàn)分類,廣泛應(yīng)用于醫(yī)學(xué)、金融等領(lǐng)域。它對(duì)數(shù)據(jù)要求不高,可解釋性強(qiáng),能直觀展現(xiàn)特征對(duì)分類結(jié)果的影響。模型構(gòu)建與應(yīng)用邏輯回歸模型簡(jiǎn)單易實(shí)現(xiàn),無需復(fù)雜數(shù)學(xué)運(yùn)算,廣受歡迎且對(duì)數(shù)據(jù)分布要求較低。但對(duì)嚴(yán)重非線性數(shù)據(jù)或高相關(guān)性特征,預(yù)測(cè)性能受限,且原生模型僅處理二分類問題,多分類需擴(kuò)展。邏輯回歸優(yōu)勢(shì)與局限2.邏輯回歸決策樹與隨機(jī)森林是機(jī)器學(xué)習(xí)中極為重要的兩種監(jiān)督學(xué)習(xí)算法,主要用于處理分類問題。兩者之間聯(lián)系緊密,決策樹作為隨機(jī)森林的基本組成單元,為其奠定了基礎(chǔ)架構(gòu)。而隨機(jī)森林則是由眾多決策樹組合而成的一個(gè)功能強(qiáng)大的分類器。3.2.2決策樹與隨機(jī)森林決策樹通過樹狀結(jié)構(gòu)模擬人類決策過程,利用一系列特征判斷將數(shù)據(jù)逐步劃分到不同子集,最終在葉節(jié)點(diǎn)輸出預(yù)測(cè)結(jié)果,直觀且易于理解。樹狀結(jié)構(gòu)分類01以貸款違約風(fēng)險(xiǎn)預(yù)測(cè)為例,收集借款人信用記錄、收入水平等數(shù)據(jù)構(gòu)建決策樹,通過判斷條件如“收入是否高于某一閾值”,在葉節(jié)點(diǎn)輸出“有風(fēng)險(xiǎn)”或“無風(fēng)險(xiǎn)”類別。應(yīng)用案例021.決策樹決策樹優(yōu)缺點(diǎn)優(yōu)勢(shì)決策樹結(jié)構(gòu)清晰、解釋性強(qiáng),適用于處理具有明顯層次關(guān)系的數(shù)據(jù),對(duì)數(shù)據(jù)預(yù)處理要求較低,便于分析人員理解每個(gè)決策步驟。01缺點(diǎn)決策樹容易出現(xiàn)過擬合問題,可通過剪枝技術(shù)或交叉驗(yàn)證等手段來提高泛化能力,以增強(qiáng)模型在新數(shù)據(jù)上的預(yù)測(cè)性能。02隨機(jī)森林由多棵決策樹構(gòu)成,通過對(duì)多個(gè)決策樹的預(yù)測(cè)結(jié)果進(jìn)行匯總來獲得最終輸出,如在電商平臺(tái)產(chǎn)品推薦中,根據(jù)用戶多維特征預(yù)測(cè)興趣程度。集成學(xué)習(xí)模型訓(xùn)練時(shí)隨機(jī)選擇樣本和特征增加模型多樣性,降低過擬合風(fēng)險(xiǎn);預(yù)測(cè)時(shí)將新數(shù)據(jù)輸入各子決策樹,匯總結(jié)果投票決定分類,回歸任務(wù)則取平均值。訓(xùn)練與預(yù)測(cè)過程2.隨機(jī)森林當(dāng)有新數(shù)據(jù)需要預(yù)測(cè)分類時(shí),隨機(jī)森林首先將新數(shù)據(jù)輸入到每一棵子決策樹中,每個(gè)子決策樹都會(huì)基于自身的訓(xùn)練經(jīng)驗(yàn)輸出一個(gè)結(jié)果。然后,通過對(duì)所有子決策樹輸出結(jié)果進(jìn)行投票,以得票最多的類別作為隨機(jī)森林的分類結(jié)果,如圖所示。例如,在判斷客戶的購(gòu)買行為中,假設(shè)有100棵子決策樹,其中60棵判定新客戶會(huì)購(gòu)買產(chǎn)品,40棵判定不會(huì)購(gòu)買,那么隨機(jī)森林最終的分類結(jié)果就是該客戶會(huì)購(gòu)買產(chǎn)品。若是回歸任務(wù),則通常取所有樹預(yù)測(cè)值的平均作為最終預(yù)測(cè)結(jié)果。應(yīng)用案例2.隨機(jī)森林優(yōu)勢(shì)隨機(jī)森林綜合多決策樹判斷,預(yù)測(cè)結(jié)果更準(zhǔn)確穩(wěn)健,能有效處理高維數(shù)據(jù),適用于大量輸入變量的場(chǎng)景。缺點(diǎn)在噪音較大的分類或回歸問題上可能出現(xiàn)過擬合,對(duì)于有不同級(jí)別屬性的數(shù)據(jù),級(jí)別劃分多的屬性影響大,產(chǎn)出的屬性權(quán)值可能不可信。0102隨機(jī)森林優(yōu)缺點(diǎn)在機(jī)器學(xué)習(xí)算法體系中,支持向量機(jī)(SupportVectorMachine,SVM)與神經(jīng)網(wǎng)絡(luò)作為監(jiān)督學(xué)習(xí)的代表性方法,分別基于不同的理論框架和技術(shù)路徑,形成了各具特色的建模范式。3.2.3支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)1.支持向量機(jī)(SVM)支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的監(jiān)督學(xué)習(xí)算法,主要用于分類和回歸任務(wù)。其核心是尋找能最大程度分隔不同類別數(shù)據(jù)的超平面,通過支持向量確定最優(yōu)決策邊界。SVM關(guān)鍵概念超平面作為SVM分類的決策邊界,將數(shù)據(jù)分為不同類別。在二維空間中,超平面表現(xiàn)為一條直線,起著分割不同類別數(shù)據(jù)的作用。支持向量決定最優(yōu)決策邊界的關(guān)鍵樣本點(diǎn),這些樣本點(diǎn)離分類超平面最近,超平面的位置和方向由支持向量決定。優(yōu)勢(shì)SVM適用于中小規(guī)模數(shù)據(jù)集、高維特征數(shù)據(jù)、線性或近似線性可分問題,泛化能力強(qiáng)、對(duì)噪聲數(shù)據(jù)魯棒性好。缺點(diǎn)本質(zhì)為二分類算法,處理多分類問題復(fù)雜且計(jì)算成本高,對(duì)缺失數(shù)據(jù)敏感。0102SVM優(yōu)缺點(diǎn)2.神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)系統(tǒng)信息處理機(jī)制的復(fù)雜非線性模型,由大量相互連接的神經(jīng)元組成。一個(gè)典型的神經(jīng)網(wǎng)絡(luò)包括輸入層、隱藏層和輸出層。輸入層輸入層是神經(jīng)網(wǎng)絡(luò)的起點(diǎn),負(fù)責(zé)接收外部輸入數(shù)據(jù),為后續(xù)處理提供原始信息。隱藏層隱藏層位于輸入層和輸出層之間,主要負(fù)責(zé)數(shù)據(jù)的特征提取和轉(zhuǎn)換,通過復(fù)雜的計(jì)算挖掘數(shù)據(jù)的內(nèi)在規(guī)律。神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu)輸出層輸出層是神經(jīng)網(wǎng)絡(luò)的終點(diǎn),負(fù)責(zé)給出最終的預(yù)測(cè)結(jié)果,將隱藏層提取的特征轉(zhuǎn)化為具體輸出。神經(jīng)網(wǎng)絡(luò)的應(yīng)用案例例如,在圖像識(shí)別任務(wù)中,神經(jīng)網(wǎng)絡(luò)可以對(duì)大量的圖像數(shù)據(jù)進(jìn)行訓(xùn)練,自動(dòng)提取邊緣、紋理等特征,從而實(shí)現(xiàn)對(duì)不同類別圖像的準(zhǔn)確分類。神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu)使其具備極強(qiáng)的表示能力,能夠逼近任意復(fù)雜的非線性函數(shù),這使得它在語音識(shí)別、自然語言處理等領(lǐng)域也得到了廣泛應(yīng)用。優(yōu)勢(shì)神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別、語音識(shí)別、自然語言處理等領(lǐng)域廣泛應(yīng)用。模型靈活、線性建模能力強(qiáng)、在大數(shù)據(jù)場(chǎng)景表現(xiàn)卓越。缺點(diǎn)對(duì)訓(xùn)練數(shù)據(jù)量需求高、訓(xùn)練過程計(jì)算密集、模型內(nèi)部參數(shù)難解釋,常被視為“黑箱”方法。0102神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)Part無監(jiān)督學(xué)習(xí)03人工智能通識(shí)20253.3無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)是一種無需標(biāo)注數(shù)據(jù)即可直接從數(shù)據(jù)中挖掘內(nèi)在規(guī)律和隱藏結(jié)構(gòu)的技術(shù)。它通過對(duì)原始數(shù)據(jù)進(jìn)行探索性分析,挖掘數(shù)據(jù)的分布、特征間的內(nèi)在聯(lián)系以及潛在的聚類、關(guān)聯(lián)關(guān)系等信息。在實(shí)際應(yīng)用中,無監(jiān)督學(xué)習(xí)常用于以下幾類任務(wù):聚類分析、降維技術(shù)、關(guān)聯(lián)規(guī)則挖掘。無監(jiān)督學(xué)習(xí)任務(wù)聚類分析通過將相似的數(shù)據(jù)點(diǎn)歸為一類,可以發(fā)現(xiàn)數(shù)據(jù)的自然分組。常見方法包括K-means算法和層次聚類等,前者通過迭代調(diào)整簇中心來最小化樣本到中心的距離,而后者則以層級(jí)結(jié)構(gòu)展示數(shù)據(jù)之間的相似度。這些技術(shù)廣泛應(yīng)用于市場(chǎng)細(xì)分、圖像分割、社交網(wǎng)絡(luò)分析等領(lǐng)域。聚類分析01當(dāng)數(shù)據(jù)維度較高時(shí),降維技術(shù)如主成分分析(PCA)和t-SNE可以將數(shù)據(jù)映射到低維空間,同時(shí)保留盡可能多的信息。PCA利用線性變換提取最大方差信息,而t-SNE則通過構(gòu)造局部概率分布實(shí)現(xiàn)復(fù)雜數(shù)據(jù)的非線性降維,常用于數(shù)據(jù)可視化和噪聲過濾。降維技術(shù)02關(guān)聯(lián)規(guī)則挖掘旨在發(fā)現(xiàn)數(shù)據(jù)項(xiàng)之間的共現(xiàn)關(guān)系,例如在零售數(shù)據(jù)中揭示哪些商品經(jīng)常被同時(shí)購(gòu)買。Apriori算法便是此類方法的代表,通過逐步篩選頻繁項(xiàng)集并生成規(guī)則,為產(chǎn)品推薦、庫(kù)存管理等提供決策支持。關(guān)聯(lián)規(guī)則挖掘03聚類分析(ClusterAnalysis),又稱群分析、點(diǎn)群分析,是多變量統(tǒng)計(jì)分析中用于將研究對(duì)象分類的一種重要統(tǒng)計(jì)分析方法

。它的核心目標(biāo)是在一定標(biāo)準(zhǔn)下,實(shí)現(xiàn)屬于同一類的對(duì)象具有最大化的同質(zhì)性,不同類的對(duì)象具有最大化的異質(zhì)性,從而達(dá)到準(zhǔn)確分類的效果。3.3.1聚類分析1.K-means算法K-means聚類是一種迭代求解的聚類分析算法。其核心目標(biāo)是將給定的數(shù)據(jù)集中的對(duì)象劃分為K個(gè)聚類,使得同一聚類內(nèi)的對(duì)象具有較高的相似性,而不同聚類間的對(duì)象具有較大的差異性。這里的相似性通常通過距離度量來衡量,最常用的是歐幾里得距離。隨機(jī)選擇K個(gè)點(diǎn)作為初始聚類中心,為后續(xù)迭代分配數(shù)據(jù)點(diǎn)奠定基礎(chǔ)。初始中心選擇計(jì)算數(shù)據(jù)點(diǎn)到聚類中心的距離,將其分配到最近的簇,再重新計(jì)算簇中心,重復(fù)直至收斂。迭代過程1.K-means算法0102優(yōu)勢(shì)算法簡(jiǎn)單高效,適用于大規(guī)模數(shù)據(jù)集,能快速得到聚類結(jié)果。局限需預(yù)先設(shè)定聚類數(shù)量K,初始中心選擇對(duì)結(jié)果影響較大,可能陷入局部最優(yōu)。K-means算法優(yōu)缺點(diǎn)2.層次聚類算法層次聚類則是基于簇間相似度,在不同層次對(duì)數(shù)據(jù)展開分析,進(jìn)而構(gòu)建樹形聚類結(jié)構(gòu),這種獨(dú)特的聚類方式無需預(yù)先設(shè)定聚類數(shù)量,而是憑借數(shù)據(jù)間的親疏關(guān)系,逐步搭建聚類層次。其操作方式分為凝聚式與分裂式。從每個(gè)數(shù)據(jù)點(diǎn)自成一簇開始,逐步合并距離最近的簇,直至所有點(diǎn)歸為一個(gè)大簇。凝聚式方法先將所有視為數(shù)據(jù)一個(gè)簇,逐步分割差異最大的子簇,直到每個(gè)點(diǎn)單獨(dú)成簇。分裂式方法2.層次聚類算法在層次聚類過程中,首先需要計(jì)算數(shù)據(jù)點(diǎn)之間的距離或相似度,常用的度量包括歐氏距離、曼哈頓距離等。然后,根據(jù)合并策略(如單鏈接、完全鏈接、平均鏈接等)確定如何合并不同的簇。通過不斷重復(fù)計(jì)算相似性和合并或分割,構(gòu)建出層次結(jié)構(gòu)的樹狀圖凝聚式方法2.層次聚類算法優(yōu)勢(shì)不需預(yù)先設(shè)定聚類數(shù)量,可根據(jù)數(shù)據(jù)親疏關(guān)系靈活構(gòu)建聚類層次,直觀呈現(xiàn)數(shù)據(jù)結(jié)構(gòu)。局限計(jì)算復(fù)雜度較高,尤其在大規(guī)模數(shù)據(jù)集上效率較低,且一旦合并或分割難以調(diào)整。01020304層次聚類優(yōu)勢(shì)與局限降維技術(shù)旨在將高維數(shù)據(jù)轉(zhuǎn)換為低維數(shù)據(jù),同時(shí)盡可能保留數(shù)據(jù)的關(guān)鍵信息。包括主成分分析(PrincipalComponentsAnalysis,PCA)和t分布-隨機(jī)鄰近嵌入(t-distributedStochasticNeighborEmbedding,t-SNE)等。3.3.2降維技術(shù)1.主成分分析(PrincipalComponentsAnalysis,PCA)PCA的核心思想是通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,這些新的變量被稱為主成分。例如,在圖像數(shù)據(jù)處理中,圖像通常具有很高的維度,通過PCA可以將圖像數(shù)據(jù)壓縮到較低維度,減少存儲(chǔ)和計(jì)算成本,同時(shí)在一定程度上保留圖像的特征。PCA應(yīng)用數(shù)據(jù)可視化將高維數(shù)據(jù)降維到二維或三維空間,便于觀察數(shù)據(jù)分布和結(jié)構(gòu)。特征降維減少特征數(shù)量,提高模型訓(xùn)練效率和泛化能力。圖像處理壓縮圖像數(shù)據(jù),減少存儲(chǔ)和計(jì)算成本,同時(shí)保留圖像特征。0102優(yōu)勢(shì)計(jì)算效率高,易于實(shí)現(xiàn),能有效去除冗余信息,保留主要特征。局限對(duì)數(shù)據(jù)分布有假設(shè),在非線性數(shù)據(jù)上表現(xiàn)不佳。PCA算法優(yōu)缺點(diǎn)2.t分布-隨機(jī)鄰近嵌入(t-SNE)t-SNE計(jì)算數(shù)據(jù)點(diǎn)之間的相似度,并在低維空間中保持這些相似度關(guān)系。是一種用于降維和數(shù)據(jù)可視化的非線性算法。原理01適用于將高維數(shù)據(jù)映射到二維或三維空間,以便進(jìn)行直觀的觀察和分析。優(yōu)勢(shì)022.t分布-隨機(jī)鄰近嵌入(t-SNE)t-SNE通過計(jì)算數(shù)據(jù)點(diǎn)之間的相似度,并在低維空間中保持這些相似度關(guān)系,將高維數(shù)據(jù)點(diǎn)在低維空間中進(jìn)行布局。相比于PCA,t-SNE更適合處理非線性數(shù)據(jù),能夠更好地展示數(shù)據(jù)在高維空間中的局部結(jié)構(gòu)和分布情況,在數(shù)據(jù)可視化、探索性數(shù)據(jù)分析等方面有廣泛應(yīng)用。2.t分布-隨機(jī)鄰近嵌入(t-SNE)例如,將工廠設(shè)備故障所涉及的高維數(shù)據(jù)進(jìn)行低維空間可視化,數(shù)據(jù)的維度越高,就越難以在低維空間中進(jìn)行繪制,沒有明顯的規(guī)律性。用t-SNE降維成二維或者三維較低空間時(shí),數(shù)據(jù)樣本的分布呈現(xiàn)出一定的規(guī)律。關(guān)聯(lián)規(guī)則挖掘是在數(shù)據(jù)集中發(fā)現(xiàn)項(xiàng)與項(xiàng)之間的關(guān)聯(lián)關(guān)系。如圖所示,在超市購(gòu)物籃分析中,發(fā)現(xiàn)顧客購(gòu)買啤酒的同時(shí)也經(jīng)常購(gòu)買尿布,這就是一種關(guān)聯(lián)規(guī)則。3.3.3關(guān)聯(lián)規(guī)則挖掘Apriori算法Apriori算法是一種在數(shù)據(jù)挖掘中用于關(guān)聯(lián)規(guī)則學(xué)習(xí)的算法,它能夠從大量數(shù)據(jù)中發(fā)現(xiàn)頻繁出現(xiàn)的項(xiàng)目集以及這些項(xiàng)目之間的關(guān)聯(lián)關(guān)系。該算法的核心思想是通過確定頻繁項(xiàng)集來生成關(guān)聯(lián)規(guī)則,這些規(guī)則可以揭示數(shù)據(jù)集中不同項(xiàng)目之間的潛在聯(lián)系。Apriori算法廣泛應(yīng)用于多個(gè)場(chǎng)景,其中最典型的應(yīng)用之一就是市場(chǎng)購(gòu)物籃分析。在零售業(yè),商家可以通過分析顧客的購(gòu)買記錄,找出經(jīng)常一起購(gòu)買的商品組合,從而優(yōu)化商品的擺放位置、制定促銷策略等。Part半監(jiān)督學(xué)習(xí)04人工智能通識(shí)20253.4半監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)的誕生源于現(xiàn)實(shí)場(chǎng)景中數(shù)據(jù)標(biāo)注成本與模型性能需求的矛盾。在傳統(tǒng)監(jiān)督學(xué)習(xí)中,模型訓(xùn)練依賴大量標(biāo)注數(shù)據(jù),但人工標(biāo)注不僅耗時(shí)耗力,還可能因標(biāo)注者主觀差異導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊。半監(jiān)督學(xué)習(xí)通過整合少量標(biāo)注數(shù)據(jù)與海量未標(biāo)注數(shù)據(jù),巧妙平衡了標(biāo)注成本與模型性能。3.4半監(jiān)督學(xué)習(xí)01例如在醫(yī)療影像分析中,一張CT掃描圖的病灶標(biāo)注可能需要專業(yè)醫(yī)師花費(fèi)數(shù)小時(shí),面對(duì)數(shù)萬份待分析影像時(shí),標(biāo)注成本將急劇攀升。而無監(jiān)督學(xué)習(xí)雖無需標(biāo)注數(shù)據(jù),但缺乏明確指導(dǎo)信號(hào),難以直接應(yīng)用于分類、回歸等具體任務(wù)。02再例如在電商用戶行為分析中,盡管僅有少量用戶被明確標(biāo)注為“高價(jià)值客戶”,但通過分析大量未標(biāo)注用戶的購(gòu)買頻率、客單價(jià)等行為特征,模型仍能捕捉到高價(jià)值客戶的行為模式,從而優(yōu)化推薦策略。半監(jiān)督學(xué)習(xí)是介于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間的機(jī)器學(xué)習(xí)范式,結(jié)合標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練?,F(xiàn)實(shí)應(yīng)用中,標(biāo)記數(shù)據(jù)稀缺且成本高,未標(biāo)記數(shù)據(jù)豐富,半監(jiān)督學(xué)習(xí)應(yīng)運(yùn)而生,提升模型性能。定義與背景3.4.1半監(jiān)督學(xué)習(xí)的基本概念1.什么是半監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)誕生于20世紀(jì)90年代,起初主要聚焦于圖論和概率模型的研究。隨著時(shí)間推移,尤其是步入21世紀(jì),大數(shù)據(jù)浪潮洶涌襲來,深度學(xué)習(xí)蓬勃發(fā)展,半監(jiān)督學(xué)習(xí)開始嶄露頭角,在計(jì)算機(jī)視覺、自然語言處理等諸多領(lǐng)域取得顯著進(jìn)展,特別是在挖掘未標(biāo)注數(shù)據(jù)用于模型訓(xùn)練方面成果斐然。近年來,半監(jiān)督學(xué)習(xí)的研究重點(diǎn)逐漸轉(zhuǎn)向強(qiáng)化模型的泛化能力與穩(wěn)定性,并且積極與深度學(xué)習(xí)技術(shù)深度融合,以適應(yīng)更為復(fù)雜多變的實(shí)際應(yīng)用場(chǎng)景。發(fā)展歷程3.4.1半監(jiān)督學(xué)習(xí)的基本概念1.什么是半監(jiān)督學(xué)習(xí)平滑假設(shè)聚類假設(shè)流形假設(shè)高維數(shù)據(jù)嵌入低維流形后,局部鄰域內(nèi)數(shù)據(jù)點(diǎn)類標(biāo)簽相似,體現(xiàn)決策函數(shù)局部平滑性,與聚類假設(shè)互補(bǔ),更全面利用數(shù)據(jù)內(nèi)在結(jié)構(gòu),具有普遍性。同一聚類簇內(nèi)的數(shù)據(jù)點(diǎn)大概率擁有相同類標(biāo)簽,等價(jià)于低密度分離假設(shè),分類決策邊界應(yīng)穿越稀疏數(shù)據(jù)區(qū)域,避免劃分稠密區(qū)域點(diǎn),利用數(shù)據(jù)整體結(jié)構(gòu)提升性能。在稠密數(shù)據(jù)區(qū)域,距離相近的數(shù)據(jù)點(diǎn)類標(biāo)簽大概率相似,被稠密數(shù)據(jù)區(qū)域邊相連的點(diǎn)類標(biāo)簽相同,被稀疏數(shù)據(jù)區(qū)域分隔的點(diǎn)類標(biāo)簽不同,通過數(shù)據(jù)局部特性指導(dǎo)學(xué)習(xí)。2.半監(jiān)督學(xué)習(xí)的三個(gè)基本假設(shè)2.半監(jiān)督學(xué)習(xí)的三個(gè)基本假設(shè)這三種假設(shè)在應(yīng)用場(chǎng)景和關(guān)注點(diǎn)上存在區(qū)別,但它們都試圖通過數(shù)據(jù)的內(nèi)在結(jié)構(gòu)來指導(dǎo)模型的學(xué)習(xí),從而在標(biāo)記數(shù)據(jù)有限的情況下,充分利用未標(biāo)記數(shù)據(jù)來提升模型性能。從本質(zhì)上說,這三類假設(shè)是一致的,只是相互關(guān)注的重點(diǎn)不同。其中流形假設(shè)更具有普遍性,它體現(xiàn)了決策函數(shù)的局部平滑性,與聚類假設(shè)的整體特性關(guān)注形成互補(bǔ),使得在半監(jiān)督學(xué)習(xí)中能夠更全面地利用數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。半監(jiān)督學(xué)習(xí)可以從不同的角度進(jìn)行分類,按照統(tǒng)計(jì)學(xué)習(xí)理論的角度包括直推半監(jiān)督學(xué)習(xí)和歸納半監(jiān)督學(xué)習(xí)。按照學(xué)習(xí)場(chǎng)景劃分,半監(jiān)督學(xué)習(xí)可分為半監(jiān)督分類、半監(jiān)督回歸、半監(jiān)督聚類、半監(jiān)督降維3.半監(jiān)督學(xué)習(xí)分類直推半監(jiān)督學(xué)習(xí)只處理樣本空間內(nèi)給定訓(xùn)練數(shù)據(jù),利用有類標(biāo)簽和無類標(biāo)簽樣例訓(xùn)練,預(yù)測(cè)無類標(biāo)簽樣例類標(biāo)簽,不關(guān)注模型泛化能力,關(guān)注特定無標(biāo)簽樣本預(yù)測(cè)性能。歸納半監(jiān)督學(xué)習(xí)處理樣本空間所有給定和未知樣例,利用有類標(biāo)簽、無類標(biāo)簽樣例及未知測(cè)試樣例訓(xùn)練,預(yù)測(cè)無類標(biāo)簽樣例和未知測(cè)試樣例類標(biāo)簽,目標(biāo)是構(gòu)建通用預(yù)測(cè)模型。按統(tǒng)計(jì)學(xué)習(xí)理論分類直推學(xué)習(xí)與歸納學(xué)習(xí)的區(qū)別直推學(xué)習(xí)直推學(xué)習(xí)并不關(guān)注模型在新數(shù)據(jù)上的泛化能力,而是在特定的無標(biāo)簽樣本上獲得最佳的預(yù)測(cè)性能。例如,在文本分類中,如果已知要分類的文檔集合,直推學(xué)習(xí)可以利用這些文檔的特征來優(yōu)化分類結(jié)果。歸納學(xué)習(xí)歸納學(xué)習(xí)的目標(biāo)是學(xué)習(xí)一個(gè)能夠?qū)ξ磥硇聰?shù)據(jù)進(jìn)行預(yù)測(cè)的通用模型,因此它基于“開放世界”的假設(shè),即模型在訓(xùn)練時(shí)并不知道最終的測(cè)試用例是什么。例如,在語音識(shí)別中,歸納半監(jiān)督學(xué)習(xí)可以用來構(gòu)建一個(gè)模型,該模型不僅能夠識(shí)別訓(xùn)練數(shù)據(jù)中的語音,還能識(shí)別新的、未見過的語音樣本。在無類標(biāo)簽樣例幫助下訓(xùn)練有類標(biāo)簽樣本,獲得性能更優(yōu)的分類器,彌補(bǔ)有類標(biāo)簽樣本不足,類標(biāo)簽取有限離散值,提升分類精度。半監(jiān)督分類01在無輸出輸入幫助下訓(xùn)練有輸出輸入,獲得性能更好的回歸器,輸出取連續(xù)值,利用未標(biāo)記數(shù)據(jù)提升回歸性能。半監(jiān)督回歸02在有類標(biāo)簽樣本信息幫助下獲得更好聚類結(jié)果,提高聚類精度,結(jié)合標(biāo)記數(shù)據(jù)優(yōu)化聚類過程。半監(jiān)督聚類03在有類標(biāo)簽樣本信息幫助下找到高維數(shù)據(jù)低維結(jié)構(gòu),保持原始數(shù)據(jù)和成對(duì)約束結(jié)構(gòu)不變,提升降維效果。半監(jiān)督降維04按學(xué)習(xí)場(chǎng)景分類3.4.2半監(jiān)督學(xué)習(xí)的典型方法早期的半監(jiān)督學(xué)習(xí)算法多是對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法的改進(jìn),如對(duì)貝葉斯分類器、多層感知機(jī)等進(jìn)行調(diào)整,嘗試在訓(xùn)練有標(biāo)注數(shù)據(jù)的分類器時(shí)利用未標(biāo)注樣本提升分類器性能。隨著研究的深入,大量新型半監(jiān)督學(xué)習(xí)算法不斷涌現(xiàn)。

生成式半監(jiān)督模型生成式方法通過建模數(shù)據(jù)聯(lián)合分布將未標(biāo)記數(shù)據(jù)與學(xué)習(xí)目標(biāo)關(guān)聯(lián),如高斯混合模型和EM算法,利用未標(biāo)注數(shù)據(jù)優(yōu)化模型參數(shù),極大似然估計(jì)是其關(guān)鍵。

自訓(xùn)練方法自訓(xùn)練方法先用標(biāo)注數(shù)據(jù)訓(xùn)練模型,對(duì)未標(biāo)注數(shù)據(jù)預(yù)測(cè)高置信度偽標(biāo)簽,將其加入訓(xùn)練集迭代優(yōu)化,逐步提升分類性能。

圖半監(jiān)督學(xué)習(xí)圖半監(jiān)督學(xué)習(xí)將數(shù)據(jù)表示為圖結(jié)構(gòu),通過節(jié)點(diǎn)連接關(guān)系傳播標(biāo)簽信息,使未標(biāo)注數(shù)據(jù)點(diǎn)獲得標(biāo)簽,實(shí)現(xiàn)高效學(xué)習(xí)。3.4.2半監(jiān)督學(xué)習(xí)的典型方法自然語言處理中的突破在文本分類、情感分析等任務(wù)中,半監(jiān)督學(xué)習(xí)通過結(jié)合少量標(biāo)記數(shù)據(jù)與大量未標(biāo)記數(shù)據(jù),顯著提升了模型性能,為高效語言處理提供了新路徑。圖像識(shí)別領(lǐng)域的創(chuàng)新面對(duì)標(biāo)記圖像獲取成本高的挑戰(zhàn),半監(jiān)督學(xué)習(xí)利用未標(biāo)記圖像優(yōu)化分類與檢測(cè)任務(wù),大幅降低了數(shù)據(jù)依賴并提高了準(zhǔn)確性。醫(yī)學(xué)與機(jī)器人技術(shù)的賦能在醫(yī)學(xué)圖像分析和機(jī)器人控制領(lǐng)域,半監(jiān)督學(xué)習(xí)通過高效利用有限標(biāo)記數(shù)據(jù),推動(dòng)了精準(zhǔn)醫(yī)療與智能控制的技術(shù)進(jìn)步。數(shù)據(jù)聚類與生成的潛力半監(jiān)督學(xué)習(xí)在數(shù)據(jù)聚類與圖像生成中展現(xiàn)了獨(dú)特優(yōu)勢(shì),為復(fù)雜數(shù)據(jù)模式挖掘與高質(zhì)量?jī)?nèi)容生成提供了可靠解決方案。3.4.3半監(jiān)督學(xué)習(xí)的應(yīng)用場(chǎng)景Part機(jī)器學(xué)習(xí)的應(yīng)用案例05人工智能通識(shí)20253.5機(jī)器學(xué)習(xí)的應(yīng)用案例在當(dāng)今數(shù)字化時(shí)代,機(jī)器學(xué)習(xí)正悄然滲透到我們生活的各個(gè)角落,從日常的購(gòu)物體驗(yàn)到醫(yī)療健康、金融投資,再到工業(yè)制造等眾多領(lǐng)域,其強(qiáng)大的數(shù)據(jù)處理與預(yù)測(cè)能力正重塑著世界的運(yùn)行方式。語音識(shí)別系統(tǒng)通過處理和分析語音信號(hào),將語音轉(zhuǎn)換為文字或命令,這一過程通常包括語音信號(hào)的預(yù)處理、特征提取、模型訓(xùn)練和識(shí)別等步驟。廣泛應(yīng)用于智能手機(jī)語音助手、智能家居控制、醫(yī)療電子病歷錄入等領(lǐng)域,提升人機(jī)交互的便捷性。語音識(shí)別3.5.1數(shù)據(jù)分析與數(shù)據(jù)挖掘語音識(shí)別技術(shù)預(yù)處理階段系統(tǒng)會(huì)對(duì)語音信號(hào)進(jìn)行降噪、增強(qiáng)等操作,以提高語音質(zhì)量。特征提取從處理后的語音信號(hào)中提取出關(guān)鍵特征,這些特征能夠有效表征語音的本質(zhì)信息。機(jī)器學(xué)習(xí)算法利用機(jī)器學(xué)習(xí)算法對(duì)提取的特征進(jìn)行模型訓(xùn)練,使模型能夠?qū)W習(xí)到語音數(shù)據(jù)中的模式和規(guī)律。識(shí)別階段系統(tǒng)將新的語音信號(hào)通過訓(xùn)練好的模型進(jìn)行解碼,得到最可能的文本輸出。語音識(shí)別技術(shù)機(jī)器學(xué)習(xí)中的語音識(shí)別技術(shù)已經(jīng)廣泛應(yīng)用于眾多領(lǐng)域,例如智能手機(jī)中的語音助手,用戶可以通過語音指令進(jìn)行搜索、發(fā)送消息、設(shè)置提醒等操作;在智能家居領(lǐng)域,用戶可以通過語音控制設(shè)備的開關(guān)、調(diào)節(jié)溫度等;此外,語音識(shí)別還在醫(yī)療領(lǐng)域用于電子病歷的語音錄入,在車載系統(tǒng)中用于導(dǎo)航和控制等功能,極大地提升了人機(jī)交互的便捷性和效率。機(jī)器學(xué)習(xí)中的用戶行為分析是一種利用數(shù)據(jù)分析和機(jī)器學(xué)習(xí)算法來檢測(cè)用戶行為模式異常的技術(shù),旨在發(fā)現(xiàn)潛在的安全威脅或支持個(gè)性化的決策。用戶行為分析通過長(zhǎng)期收集用戶的行為數(shù)據(jù),為每個(gè)用戶構(gòu)建獨(dú)一無二的基線行為模型。然后,通過機(jī)器學(xué)習(xí)算法檢測(cè)實(shí)際行為與基線行為的偏差,從而在早期階段識(shí)別潛在的安全威脅或異常行為。用戶行為分析3.5.1數(shù)據(jù)分析與數(shù)據(jù)挖掘用戶行為分析的多領(lǐng)域應(yīng)用通過分析用戶登錄時(shí)間、訪問頻率等行為模式,識(shí)別異常訪問,預(yù)防網(wǎng)絡(luò)攻擊與數(shù)據(jù)泄漏,保障系統(tǒng)安全。網(wǎng)絡(luò)安全防護(hù)基于用戶瀏覽、購(gòu)買及收藏?cái)?shù)據(jù),優(yōu)化商品推薦策略,提升用戶體驗(yàn)與購(gòu)買轉(zhuǎn)化率,實(shí)現(xiàn)個(gè)性化營(yíng)銷。電商精準(zhǔn)推薦利用搜索歷史與點(diǎn)擊行為數(shù)據(jù),實(shí)現(xiàn)精準(zhǔn)廣告投放,顯著提高廣告投資回報(bào)率與市場(chǎng)競(jìng)爭(zhēng)力。廣告效果提升信息過濾是一種利用算法和模型從大量數(shù)據(jù)中篩選出有用信息的技術(shù),廣泛應(yīng)用于多個(gè)領(lǐng)域。其核心在于通過機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行分析和處理,從而實(shí)現(xiàn)對(duì)信息的自動(dòng)篩選和分類。信息過濾的主要目標(biāo)是提高信息檢索的效率和準(zhǔn)確性,幫助用戶快速獲取所需信息。信息過濾原理信息過濾在多個(gè)領(lǐng)域有著廣泛的應(yīng)用。在文本分類中,通過學(xué)習(xí)文本特征將文檔分類到不同的類別,如新聞、博客、社交媒體等。在垃圾郵件過濾中,通過分析郵件的文本內(nèi)容、發(fā)件人信息、收件人行為等數(shù)據(jù),機(jī)器學(xué)習(xí)算法能夠自動(dòng)識(shí)別和過濾垃圾郵件。在個(gè)性化推薦系統(tǒng)中,通過分析用戶的瀏覽和購(gòu)買歷史,為用戶提供符合其興趣偏好的內(nèi)容推薦。信息過濾應(yīng)用3.5.2模式識(shí)別與智能感知3.5.2模式識(shí)別與智能感知生物特征識(shí)別是一種基于個(gè)體獨(dú)特的生理或行為特征進(jìn)行身份認(rèn)證的技術(shù)。這些特征包括指紋、面部、虹膜、靜脈、聲紋等生理特征,如圖;以及手寫簽名、步態(tài)、鍵盤敲擊習(xí)慣等行為特征。機(jī)器學(xué)習(xí)在生物特征識(shí)別中的應(yīng)用極大地增強(qiáng)了系統(tǒng)的性能和可靠性,通過自動(dòng)測(cè)量和分析這些特征,從大量數(shù)據(jù)中學(xué)習(xí)特征模式,從而實(shí)現(xiàn)對(duì)新數(shù)據(jù)的準(zhǔn)確分類和識(shí)別。生物特征識(shí)別技術(shù)具有“人人都有、人各不同、長(zhǎng)期不變、安全可靠、方便靈活”等特點(diǎn),廣泛應(yīng)用于安全、金融、醫(yī)療等領(lǐng)域。生物特征識(shí)別機(jī)器學(xué)習(xí)在交通預(yù)測(cè)中分析歷史交通數(shù)據(jù),對(duì)未來交通狀況進(jìn)行預(yù)測(cè),幫助緩解交通擁堵、優(yōu)化交通信號(hào)控制、提高道路使用效率,為城市規(guī)劃提供數(shù)據(jù)支持。交通預(yù)測(cè)機(jī)器學(xué)習(xí)通過構(gòu)建復(fù)雜模型,從歷史銷售數(shù)據(jù)中挖掘模式和趨勢(shì),提供準(zhǔn)確的銷售預(yù)測(cè),幫助企業(yè)優(yōu)化庫(kù)存水平,降低庫(kù)存成本,提升運(yùn)營(yíng)效率和競(jìng)爭(zhēng)力。銷售預(yù)測(cè)與庫(kù)存管理3.5.3預(yù)測(cè)建模與決策支持人工智能通識(shí)2025第3章謝謝大家2025年.XX月人工智能通識(shí)2025第4章深度學(xué)習(xí):模擬人腦的強(qiáng)大工具2025年.XX月一個(gè)兩歲的孩子第一次看到一只貓。他可能會(huì)指著貓說:“這是什么?”父母告訴他:“這是貓?!焙⒆狱c(diǎn)點(diǎn)頭,似乎明白了。幾天后,當(dāng)孩子看到另一只貓時(shí),他興奮地喊道:“貓!”即使這只貓的顏色、體型、姿勢(shì)與之前看到的完全不同,孩子依然能夠準(zhǔn)確地識(shí)別出來。這是由于人腦的神經(jīng)網(wǎng)絡(luò)對(duì)貓的特征進(jìn)行了提取并進(jìn)行判斷。而深度學(xué)習(xí)通過模擬人腦神經(jīng)網(wǎng)絡(luò),成為了解決復(fù)雜問題的強(qiáng)大工具。從圖像識(shí)別到自然語言處理,從自動(dòng)駕駛到醫(yī)療診斷,深度學(xué)習(xí)正在改變我們的世界。理解深度學(xué)習(xí)的基本概念理解深度學(xué)習(xí)的定義、它與機(jī)器學(xué)習(xí)和人工智能的關(guān)系,以及深度學(xué)習(xí)的核心思想和優(yōu)勢(shì)。掌握深度學(xué)習(xí)的基本架構(gòu)熟悉多層神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),輸入層、隱藏層和輸出層的作用。掌握卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等模型的基本原理和適用場(chǎng)景。了解深度學(xué)習(xí)的關(guān)鍵技術(shù)包括激活函數(shù)、損失函數(shù)、優(yōu)化算法、正則化方法等。本章目標(biāo)神經(jīng)網(wǎng)絡(luò)的基本原理與結(jié)構(gòu)2.1.深度學(xué)習(xí)概述深度學(xué)習(xí)的訓(xùn)練與優(yōu)化3.深度學(xué)習(xí)的應(yīng)用案例4.Catalogue目錄Part深度學(xué)習(xí)概述01人工智能通識(shí)20254.1深度學(xué)習(xí)概述深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要分支。它不僅推動(dòng)了人工智能技術(shù)的飛速發(fā)展,還在眾多領(lǐng)域取得了突破性的成就,深刻地改變了我們的生活和工作方式。那么,深度學(xué)習(xí)究竟是什么?它與傳統(tǒng)機(jī)器學(xué)習(xí)有何不同?它為何能夠如此強(qiáng)大?4.1深度學(xué)習(xí)概述人識(shí)別貓的能力看似簡(jiǎn)單,卻蘊(yùn)含著人類大腦的驚人智慧。如圖4-1所示,孩子的大腦并沒有記住每一只貓的具體細(xì)節(jié),而是通過觀察和學(xué)習(xí),提取了“貓”這一概念的核心特征:尖尖的耳朵、長(zhǎng)長(zhǎng)的尾巴、柔軟的毛發(fā)等。更重要的是,孩子的大腦能夠通過這些特征,從復(fù)雜的視覺信息中快速判斷出“貓”的存在。4.1.1深度學(xué)習(xí)的定義人類大腦的特征提取人識(shí)別貓的能力看似簡(jiǎn)單,卻蘊(yùn)含著人類大腦的驚人智慧。如圖4-1所示,孩子的大腦并沒有記住每一只貓的具體細(xì)節(jié),而是通過觀察和學(xué)習(xí),提取了“貓”這一概念的核心特征:尖尖的耳朵、長(zhǎng)長(zhǎng)的尾巴、柔軟的毛發(fā)等。更重要的是,孩子的大腦能夠通過這些特征,從復(fù)雜的視覺信息中快速判斷出“貓”的存在。4.1.1深度學(xué)習(xí)的定義傳統(tǒng)計(jì)算機(jī)的局限如果讓一臺(tái)計(jì)算機(jī)完成同樣的任務(wù)——從一張圖片中識(shí)別出“貓”,會(huì)發(fā)生什么?傳統(tǒng)計(jì)算機(jī)程序需要程序員手動(dòng)定義規(guī)則,例如“如果圖片中有尖耳朵和長(zhǎng)尾巴,那么可能是貓”。然而,這種方法在面對(duì)復(fù)雜場(chǎng)景時(shí)往往失效:貓可能藏在陰影中,可能側(cè)臥,甚至可能只露出一半身體。GoogleBrain的成功自動(dòng)學(xué)習(xí)貓的特征2012年,谷歌“GoogleBrain”深度學(xué)習(xí)模型從1000萬張隨機(jī)圖片中學(xué)會(huì)識(shí)別貓。這個(gè)模型并沒有被明確地“告訴”貓的特征,而是通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),自動(dòng)從海量數(shù)據(jù)中學(xué)習(xí)到了貓的特征。它像一個(gè)孩子一樣,通過觀察和學(xué)習(xí),逐漸掌握了“貓”的概念。深度學(xué)習(xí)的核心模仿人腦分層結(jié)構(gòu)深度學(xué)習(xí)的核心在于,它能夠模仿人腦神經(jīng)網(wǎng)絡(luò)的分層結(jié)構(gòu):從簡(jiǎn)單的特征(如邊緣和紋理)到復(fù)雜的特征(如整體形狀和姿態(tài)),逐層提取信息。這種分層學(xué)習(xí)的能力,使得深度學(xué)習(xí)模型能夠處理復(fù)雜的視覺、語音和文本任務(wù),甚至在某些領(lǐng)域超越了人類的表現(xiàn)。深度學(xué)習(xí)的定義與特點(diǎn)基于深層神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)深度學(xué)習(xí)是基于深層神經(jīng)網(wǎng)絡(luò)模型和方法的機(jī)器學(xué)習(xí),是在統(tǒng)計(jì)機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等算法模型基礎(chǔ)上,結(jié)合大數(shù)據(jù)和大算力發(fā)展而來的跨學(xué)科技術(shù)領(lǐng)域。多學(xué)科交叉領(lǐng)域深度學(xué)習(xí)涉及數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、工程科學(xué)、人工智能和神經(jīng)生物學(xué),是機(jī)器學(xué)習(xí)的重要分支,其核心是構(gòu)建多層非線性變換的人工神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)數(shù)據(jù)層次化特征的自動(dòng)學(xué)習(xí)。深度學(xué)習(xí):層次化特征學(xué)習(xí)的技術(shù)革新特征學(xué)習(xí)模式的顛覆與傳統(tǒng)機(jī)器學(xué)習(xí)依賴人工設(shè)計(jì)特征(如手動(dòng)提取圖像邊緣或文本關(guān)鍵詞)不同,深度學(xué)習(xí)通過堆疊卷積層、循環(huán)層、注意力機(jī)制等組件,從原始數(shù)據(jù)(如圖像像素、文本序列、語音信號(hào))中逐層抽象出從低層特征(如邊緣、音素)到高層語義(如物體類別、語句含義)的表征。這種層次化特征學(xué)習(xí)機(jī)制使得深度學(xué)習(xí)能夠自動(dòng)捕捉數(shù)據(jù)的復(fù)雜模式,尤其適用于高維、非線性數(shù)據(jù)的建模。典型的深度學(xué)習(xí)模型包括卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)等,其本質(zhì)是通過梯度下降優(yōu)化網(wǎng)絡(luò)參數(shù),最小化預(yù)測(cè)值與真實(shí)值的差異,從而實(shí)現(xiàn)監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)或強(qiáng)化學(xué)習(xí)任務(wù)。目前看來,深度學(xué)習(xí)是解決強(qiáng)人工智能這一重大科技問題的最具潛力的技術(shù)途徑,也是當(dāng)前計(jì)算機(jī)、大數(shù)據(jù)科學(xué)和人工智能領(lǐng)域的研究熱點(diǎn)。模型結(jié)構(gòu)的深度優(yōu)勢(shì)應(yīng)用場(chǎng)景的擴(kuò)展?jié)摿υ缙谔剿髋c停滯深度學(xué)習(xí)的歷史發(fā)展可以追溯到20世紀(jì)40年代,心理學(xué)家McCulloch和數(shù)理邏輯學(xué)家Pitts提出了神經(jīng)元的數(shù)學(xué)模型——MP(McCulloch-Pitts)模型,為后來的研究工作提供了依據(jù)。1958年,Rosenblatt教授提出了感知器模型,它在MP模型的基礎(chǔ)上增加了學(xué)習(xí)功能,但受限于只能解決線性可分問題,研究陷入停滯。4.1.2深度學(xué)習(xí)的發(fā)展歷史反向傳播算法的推動(dòng)20世紀(jì)80年代,計(jì)算機(jī)技術(shù)的飛速發(fā)展使得計(jì)算能力有了質(zhì)的飛躍。1986年,Rumelhart等人在Nature上發(fā)表文章,提出了一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)——反向傳播網(wǎng)絡(luò)(BackPropagation,BP),有效解決了非線性分類和學(xué)習(xí)的問題,引領(lǐng)了神經(jīng)網(wǎng)絡(luò)研究的第二次高潮。然而,由于BP算法的梯度消失問題、支持向量機(jī)(SVM)

的興起以及硬件資源限制等多方面的原因,神經(jīng)網(wǎng)絡(luò)領(lǐng)域在20世紀(jì)90年代初至21世紀(jì)初經(jīng)歷了“第二個(gè)黑暗時(shí)代”。4.1.2深度學(xué)習(xí)的發(fā)展歷史深度學(xué)習(xí)的復(fù)興2006年,GeoffreyHinton提出深度信念網(wǎng)絡(luò),其使用無監(jiān)督逐層預(yù)訓(xùn)練,再用有監(jiān)督的反向傳播誤差調(diào)優(yōu)的方式,來解決誤差反向傳播的梯度消失問題。2012年,GeoffreyHinton團(tuán)隊(duì)使用AlexNet一舉奪得了ImageNet圖像識(shí)別大賽的冠軍,其識(shí)別率顯著超越了以往算法的識(shí)別率,獲得了極大的關(guān)注。而此時(shí)計(jì)算機(jī)硬件水平相較以前明顯改善,特別是采用圖像處理器(GPU)極大地提高了運(yùn)算能力,深度學(xué)習(xí)再次活躍起來,并迅速促進(jìn)了各個(gè)領(lǐng)域的發(fā)展。4.1.2深度學(xué)習(xí)的發(fā)展歷史現(xiàn)代發(fā)展近年來,Transformer架構(gòu)的提出堪稱深度學(xué)習(xí)領(lǐng)域一項(xiàng)具有里程碑意義的重大創(chuàng)新。它憑借自注意力機(jī)制成功替代了傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)結(jié)構(gòu),實(shí)現(xiàn)了對(duì)序列數(shù)據(jù)的并行處理,這一變革性的突破極大地提升了訓(xùn)練效率。在自然語言處理任務(wù)中,Transformer架構(gòu)大放異彩,以谷歌的BERT(BidirectionalEncoderRepresentationfromTransformers)模型和OpenAI的GPT(GenerativePre-trainedTransformer)系列模型為例,它們通過對(duì)大規(guī)模文本的無監(jiān)督預(yù)訓(xùn)練,能夠深度理解文本中的語義和語法信息,在文本分類、情感分析、問答系統(tǒng)等眾多自然語言處理任務(wù)中展現(xiàn)出卓越的性能。4.1.2深度學(xué)習(xí)的發(fā)展歷史自動(dòng)特征工程深度學(xué)習(xí)通過端到端訓(xùn)練,自動(dòng)從數(shù)據(jù)中學(xué)習(xí)判別性特征,避免人工標(biāo)注的局限性,如醫(yī)學(xué)影像診斷中CNN可自主識(shí)別腫瘤的關(guān)鍵特征。處理復(fù)雜數(shù)據(jù)關(guān)系深度學(xué)習(xí)能夠建模數(shù)據(jù)的非線性關(guān)系與長(zhǎng)距離依賴,如RNN的LSTM和Transformer的自注意力機(jī)制,使其在自然語言處理和視頻分析中超越傳統(tǒng)方法。強(qiáng)泛化能力隨著數(shù)據(jù)量增加,深度學(xué)習(xí)模型性能呈指數(shù)級(jí)提升,如ImageNet圖像分類任務(wù)中,深度CNN的準(zhǔn)確率顯著提高。4.1.3深度學(xué)習(xí)的優(yōu)勢(shì)這些優(yōu)勢(shì)使其在計(jì)算機(jī)視覺、語音識(shí)別、生物信息學(xué)等領(lǐng)域?qū)崿F(xiàn)突破性應(yīng)用。盡管面臨模型可解釋性差、計(jì)算資源需求高的挑戰(zhàn),深度學(xué)習(xí)仍是當(dāng)前人工智能技術(shù)發(fā)展的核心驅(qū)動(dòng)力,其自動(dòng)化特征學(xué)習(xí)范式正在重塑各學(xué)科的研究方法與產(chǎn)業(yè)應(yīng)用模式。4.1.3深度學(xué)習(xí)的優(yōu)勢(shì)Part神經(jīng)網(wǎng)絡(luò)的基本原理與結(jié)構(gòu)02人工智能通識(shí)20254.2神經(jīng)網(wǎng)絡(luò)的基本原理與結(jié)構(gòu)深度學(xué)習(xí)的核心在于神經(jīng)網(wǎng)絡(luò),這種模擬人腦神經(jīng)元連接的計(jì)算模型,通過分層結(jié)構(gòu)和復(fù)雜的數(shù)學(xué)運(yùn)算,賦予了機(jī)器學(xué)習(xí)和推理的能力。神經(jīng)網(wǎng)絡(luò)的強(qiáng)大之處在于它能夠從海量數(shù)據(jù)中提取特征、發(fā)現(xiàn)模式,并通過不斷優(yōu)化自身的參數(shù)來提高任務(wù)性能。神經(jīng)元模型模擬了生物神經(jīng)元的基本功能,通過接收輸入信號(hào)、加權(quán)求和并輸出結(jié)果,構(gòu)成了神經(jīng)網(wǎng)絡(luò)的基本單元。而激活函數(shù)則是神經(jīng)元模型中的關(guān)鍵環(huán)節(jié),它決定了神經(jīng)元的輸出是否被激活,從而影響整個(gè)網(wǎng)絡(luò)的學(xué)習(xí)能力和表達(dá)能力。4.2.1神經(jīng)元模型與激活函數(shù)神經(jīng)網(wǎng)絡(luò)的基石是神經(jīng)元模型,它模擬了生物神經(jīng)系統(tǒng)中神經(jīng)元的工作方式。在生物大腦里,神經(jīng)元接收來自其他神經(jīng)元的電信號(hào),當(dāng)這些輸入信號(hào)的總和達(dá)到一定閾值時(shí),神經(jīng)元就會(huì)被激活并向其他神經(jīng)元傳遞信號(hào)。人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元與之類似,它接收多個(gè)輸入信號(hào),每個(gè)輸入都被賦予一個(gè)權(quán)重值,權(quán)重代表了該輸入的重要程度。例如,在一個(gè)預(yù)測(cè)明天是否適合外出游玩的模型中,輸入信號(hào)可能包括明天的天氣預(yù)報(bào)(如氣溫、降水概率)、當(dāng)天的工作安排(是否繁忙)以及個(gè)人的興趣偏好(是否喜歡戶外活動(dòng))等,不同的輸入對(duì)最終決策的影響程度不同,這些影響程度就通過權(quán)重來體現(xiàn)。神經(jīng)元模型定義1.神經(jīng)元模型神經(jīng)元將所有輸入信號(hào)與對(duì)應(yīng)的權(quán)重相乘后累加,再加上一個(gè)偏置值(可以理解為一個(gè)固定的調(diào)節(jié)參數(shù)),得到一個(gè)綜合的輸入值。這個(gè)綜合輸入值并不會(huì)直接作為輸出,而是要經(jīng)過激活函數(shù)的處理。激活函數(shù)在神經(jīng)元中起著關(guān)鍵作用,它引入了非線性因素,使得神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)和處理復(fù)雜的非線性關(guān)系。如果沒有激活函數(shù),神經(jīng)網(wǎng)絡(luò)就只是一個(gè)簡(jiǎn)單的線性模型,其表達(dá)能力會(huì)受到極大限制,只能處理線性可分的問題。神經(jīng)元模型運(yùn)算1.神經(jīng)元模型Sigmoid函數(shù)輸出值在0到1之間,形狀像一個(gè)平滑的“S”形曲線。在早期的神經(jīng)網(wǎng)絡(luò)中應(yīng)用較為廣泛,比如在邏輯回歸問題中,它可以將輸出值映射到概率空間,用于判斷某個(gè)事件發(fā)生的可能性。但Sigmoid函數(shù)存在梯度消失問題,在深層神經(jīng)網(wǎng)絡(luò)中,隨著反向傳播過程中梯度不斷向后傳遞,經(jīng)過多個(gè)Sigmoid函數(shù)的作用,梯度會(huì)變得越來越小,導(dǎo)致網(wǎng)絡(luò)難以訓(xùn)練。Sigmoid函數(shù)2.激活函數(shù)即雙曲正切函數(shù),它的輸出值范圍在-1到1之間,形狀與Sigmoid函數(shù)類似,但它是關(guān)于原點(diǎn)對(duì)稱的。相比于Sigmoid函數(shù),Tanh函數(shù)在一定程度上緩解了梯度消失問題,在一些需要處理正負(fù)值的場(chǎng)景中表現(xiàn)較好。Tanh函數(shù)2.激活函數(shù)近年來應(yīng)用極為廣泛,簡(jiǎn)單來說,當(dāng)輸入值大于0時(shí),輸出就是輸入值本身;當(dāng)輸入值小于等于0時(shí),輸出為0。ReLU函數(shù)計(jì)算簡(jiǎn)單,能夠有效緩解梯度消失問題,并且在訓(xùn)練過程中可以使部分神經(jīng)元稀疏化,減少參數(shù)之間的相互依賴,提高模型的泛化能力。不過,ReLU函數(shù)也存在“死亡ReLU”問題,即當(dāng)輸入值持續(xù)為負(fù)時(shí),神經(jīng)元可能會(huì)一直處于不激活狀態(tài),不再對(duì)網(wǎng)絡(luò)的訓(xùn)練產(chǎn)生貢獻(xiàn)。ReLU函數(shù)2.激活函數(shù)4.2.2前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法前饋神經(jīng)網(wǎng)絡(luò)(FeedforwardNeuralNetwork,F(xiàn)NN)是最為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它由輸入層、隱藏層和輸出層組成,數(shù)據(jù)從輸入層進(jìn)入網(wǎng)絡(luò),沿著一個(gè)方向逐層向前傳播,經(jīng)過隱藏層的一系列處理后,最終在輸出層得到預(yù)測(cè)結(jié)果,整個(gè)過程中沒有反饋回路。前饋神經(jīng)網(wǎng)絡(luò)4.2.2前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法輸入層負(fù)責(zé)接收外部數(shù)據(jù),這些數(shù)據(jù)被傳遞到隱藏層。隱藏層可以有一層或多層,每一層都包含多個(gè)神經(jīng)元,神經(jīng)元之間通過權(quán)重連接。隱藏層的神經(jīng)元對(duì)輸入數(shù)據(jù)進(jìn)行加權(quán)求和,并經(jīng)過激活函數(shù)處理,將處理后的結(jié)果傳遞到下一層。輸出層則根據(jù)隱藏層傳遞過來的信息,產(chǎn)生最終的輸出結(jié)果。前饋神經(jīng)網(wǎng)絡(luò)組成4.2.2前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法在一個(gè)簡(jiǎn)單的手寫數(shù)字識(shí)別任務(wù)中,輸入層接收數(shù)字化后的手寫數(shù)字圖像數(shù)據(jù),隱藏層對(duì)圖像的特征進(jìn)行提取和組合,輸出層則輸出識(shí)別結(jié)果,即判斷該圖像代表的數(shù)字是0到9中的哪一個(gè)。前饋神經(jīng)網(wǎng)絡(luò)應(yīng)用4.2.2前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程依賴于反向傳播算法。在訓(xùn)練過程中,我們需要一個(gè)損失函數(shù)來衡量模型預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽之間的差異。當(dāng)模型輸出的預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽存在差異時(shí),這個(gè)差異通過損失函數(shù)計(jì)算得到一個(gè)誤差值。反向傳播算法的核心思想是從輸出層開始,將誤差逐層反向傳播到前面的隱藏層和輸入層。反向傳播算法4.2.2前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法前饋神經(jīng)網(wǎng)絡(luò)和反向傳播算法的結(jié)合,使得神經(jīng)網(wǎng)絡(luò)能夠從數(shù)據(jù)中自動(dòng)學(xué)習(xí)復(fù)雜的模式和關(guān)系。這種學(xué)習(xí)能力是深度學(xué)習(xí)的核心,也是神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別、語音識(shí)別、自然語言處理等領(lǐng)域取得巨大成功的關(guān)鍵所在。在深度學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是兩種非常重要的神經(jīng)網(wǎng)絡(luò)架構(gòu),它們?cè)谔幚聿煌愋偷臄?shù)據(jù)和任務(wù)方面具有獨(dú)特的優(yōu)勢(shì)。4.2.3卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)適用于處理圖像、視頻等空間結(jié)構(gòu)數(shù)據(jù),核心組件包括卷積層、池化層和全連接層,通過卷積操作提取局部特征,池化層下采樣保留主要特征,廣泛應(yīng)用于圖像識(shí)別和醫(yī)學(xué)圖像診斷。1.卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的核心機(jī)制與應(yīng)用

卷積層:局部特征的高效提取卷積層通過卷積核在輸入數(shù)據(jù)上滑動(dòng),提取圖像中的邊緣、紋理等局部特征。卷積核是一個(gè)小的權(quán)重矩陣,能夠有效減少參數(shù)數(shù)量并利用數(shù)據(jù)的局部相關(guān)性,從而降低計(jì)算復(fù)雜度,同時(shí)保留關(guān)鍵信息。這種設(shè)計(jì)使得卷積操作在處理高維數(shù)據(jù)時(shí)表現(xiàn)出色,尤其適合圖像識(shí)別任務(wù)。

池化層:特征下采樣與降維池化層通常位于卷積層之后,采用最大池化或平均池化方式對(duì)特征圖進(jìn)行下采樣。最大池化取局部區(qū)域的最大值,而平均池化取平均值,二者均能減少數(shù)據(jù)量并保留主要特征。池化操作降低了模型對(duì)位置的敏感性,提升了網(wǎng)絡(luò)的魯棒性和泛化能力。

全連接層:特征整合與預(yù)測(cè)輸出在多個(gè)卷積層和池化層處理后,全連接層將提取到的特征進(jìn)行整合,并輸出最終預(yù)測(cè)結(jié)果。這一層通過學(xué)習(xí)特征間的復(fù)雜關(guān)系,完成分類或回歸任務(wù)。CNN憑借其高效的特征提取能力,在圖像識(shí)別、醫(yī)學(xué)診斷等領(lǐng)域取得了顯著成功,例如貓狗分類和疾病檢測(cè)等場(chǎng)景。循環(huán)神經(jīng)網(wǎng)絡(luò)RNN則擅長(zhǎng)處理具有序列特征的數(shù)據(jù),如自然語言、時(shí)間序列數(shù)據(jù)等。與前饋神經(jīng)網(wǎng)絡(luò)不同,RNN具有記憶功能,它能夠在處理序列中的每個(gè)元素時(shí),考慮到之前元素的信息。在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論