《人工智能通識(shí)教程》課件 第1-4章 緒論、機(jī)器學(xué)習(xí) - ChatGPT與應(yīng)用_第1頁(yè)
《人工智能通識(shí)教程》課件 第1-4章 緒論、機(jī)器學(xué)習(xí) - ChatGPT與應(yīng)用_第2頁(yè)
《人工智能通識(shí)教程》課件 第1-4章 緒論、機(jī)器學(xué)習(xí) - ChatGPT與應(yīng)用_第3頁(yè)
《人工智能通識(shí)教程》課件 第1-4章 緒論、機(jī)器學(xué)習(xí) - ChatGPT與應(yīng)用_第4頁(yè)
《人工智能通識(shí)教程》課件 第1-4章 緒論、機(jī)器學(xué)習(xí) - ChatGPT與應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩297頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章緒論《人工智能通識(shí)教程》課件本章概述本章系統(tǒng)介紹人工智能的基礎(chǔ)與背景,涵蓋智能定義、起源及圖靈測(cè)試、發(fā)展歷程、應(yīng)用領(lǐng)域、關(guān)鍵技術(shù)與倫理問(wèn)題,幫助讀者全面把握人工智能的核心知識(shí)框架。主要講述的內(nèi)容如下:(1)智能的概念及人工智能的定義與分類,明確基本內(nèi)涵。(2)人工智能的起源與圖靈測(cè)試,解析機(jī)器智能的評(píng)估標(biāo)準(zhǔn)。(3)人工智能發(fā)展歷程,展示技術(shù)演進(jìn)與重要變革。(4)人工智能在各行業(yè)的應(yīng)用,體現(xiàn)其廣泛影響力。(5)人工智能關(guān)鍵技術(shù)分析,包括四大要素與技術(shù)架構(gòu)。(6)人工智能倫理問(wèn)題,強(qiáng)調(diào)技術(shù)進(jìn)步與道德規(guī)范的關(guān)系本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史1.1人工智能概述智能是感知、記憶、思考、學(xué)習(xí)并行動(dòng)的能力,存在于人、動(dòng)物與集體系統(tǒng)中,如海豚用具與蟻群協(xié)作,體現(xiàn)復(fù)雜系統(tǒng)的涌現(xiàn)。人工智能以計(jì)算機(jī)模擬此能力,涵蓋弱AI(語(yǔ)音助手、推薦)、強(qiáng)AI(語(yǔ)言模型、醫(yī)療決策)與理論中的超AI;技術(shù)含認(rèn)知計(jì)算、機(jī)器學(xué)習(xí)、深度學(xué)習(xí),推動(dòng)從理論到應(yīng)用演進(jìn)。1.1人工智能概述智能是人類大腦思維活動(dòng)的產(chǎn)物,是知識(shí)與智力的綜合體現(xiàn)。它涵蓋感知、記憶、思維、學(xué)習(xí)和行為能力,支持個(gè)體適應(yīng)環(huán)境、解決問(wèn)題。智能不僅存在于人類,也展現(xiàn)在動(dòng)物和機(jī)器中,體現(xiàn)為復(fù)雜系統(tǒng)中多種因素交互作用的結(jié)果,是自然界的重要奧秘之一。1.1.1關(guān)于智能1.1人工智能概述人類主宰地球因祖先具高級(jí)智能,但其起源未解,成哲學(xué)與腦科學(xué)長(zhǎng)期課題,列為自然四大奧秘之一。盡管腦科學(xué)等進(jìn)展加深對(duì)腦結(jié)構(gòu)與功能的認(rèn)識(shí),神經(jīng)系統(tǒng)機(jī)理與腦的原理仍未明,統(tǒng)一定義智能亦困難?;诋?dāng)前對(duì)人腦的認(rèn)知,結(jié)合智能的外在表現(xiàn),學(xué)者們從不同角度、不同層面、采用多種方法對(duì)智能展開(kāi)研究,提出了多種智能定義,主要包括思維理論、知識(shí)閾值理論和進(jìn)化理論等觀點(diǎn)。1.智能的定義1.1人工智能概述(1)思維理論思維理論認(rèn)為,智能的核心是思維活動(dòng),所有智能均源于大腦的思維過(guò)程。人類的一切知識(shí)均由思維創(chuàng)造,因此,通過(guò)研究思維的規(guī)律與方法,有望揭示智能的本質(zhì)。(2)知識(shí)閾值理論知識(shí)閾值理論主張:智能行為取決于知識(shí)規(guī)模與其泛化能力,系統(tǒng)因擁有可應(yīng)用知識(shí)而顯智能。其將智能定義為:能在龐大搜索空間中快速找到滿意解的能力。該理論深刻影響AI發(fā)展,促成知識(shí)工程與專家系統(tǒng)興起,并奠定以知識(shí)獲取、表示與推理為核心的技術(shù)路線。(3)進(jìn)化理論進(jìn)化理論強(qiáng)調(diào)行走、感知與維持生存繁衍的適應(yīng)力奠定智能基礎(chǔ)。智能為復(fù)雜系統(tǒng)涌現(xiàn),由整體行為與環(huán)境互動(dòng)決定,可無(wú)顯式表示與推理而生。以“控制”替代“表示”,重分層結(jié)構(gòu)。布魯克于1991提“無(wú)表達(dá)”、1992提“無(wú)推理”。綜合以上觀點(diǎn),可以給出一個(gè)較為直觀的定義:智能是知識(shí)與智力的總和。其中,知識(shí)是所有智能行為的基礎(chǔ),智力則是獲取知識(shí)并運(yùn)用知識(shí)解決問(wèn)題的能力。1.1人工智能概述智能的特征如下。(1)具有感知能力感知經(jīng)視、聽(tīng)、觸、嗅、味獲取外界信息,是智能之基。逾80%由視覺(jué)、約10%由聽(tīng)覺(jué)獲得,促使AI以機(jī)器視覺(jué)與機(jī)器聽(tīng)覺(jué)為感知核心方向。(2)具有記憶與思維能力記憶存儲(chǔ)感知與知識(shí),思維加工信息,進(jìn)行分析、比較、推理、聯(lián)想與決策;二者為智能核心,支撐獲取與運(yùn)用知識(shí)解決問(wèn)題的動(dòng)態(tài)過(guò)程。(3)具有學(xué)習(xí)能力人與環(huán)境互動(dòng)持續(xù)學(xué)習(xí),積累知識(shí)、適應(yīng)變化;可自覺(jué)或無(wú)意識(shí),可在教師指導(dǎo)或自主實(shí)踐中進(jìn)行,體現(xiàn)人類智慧的重要特征。(4)具有行為能力行為以語(yǔ)言、表情、眼神、肢體輸出信息,回應(yīng)刺激;與感知輸入相對(duì),皆受神經(jīng)系統(tǒng)調(diào)控,構(gòu)成智能系統(tǒng)信息交互與表達(dá)關(guān)鍵能力。2.智能的特征1.1人工智能概述標(biāo)準(zhǔn)化測(cè)試常見(jiàn)如數(shù)列題:1、3、6、10、15、21。相鄰差值遞增1,依次為2、3、4、5、6,故下一個(gè)數(shù)字為28。此類題評(píng)估識(shí)別關(guān)鍵特征的能力。經(jīng)由經(jīng)驗(yàn)積累與練習(xí),我們不斷發(fā)現(xiàn)、學(xué)習(xí)并遷移這些模式??梢栽囋囉孟旅孢@兩個(gè)數(shù)列來(lái)試試運(yùn)氣:a.1,2,2,3,3,3,4,4,4,4,···b.2,3,3,5,5,5,7,7,7,7,···既然上面已經(jīng)給出了智能的一個(gè)定義,那么接下來(lái)大家可能會(huì)有以下疑問(wèn):(1)如何判定某個(gè)人或物是否有智能?(2)動(dòng)物是否有智能?(3)如果動(dòng)物有智能,那么如何評(píng)估它們的智能?3.動(dòng)物智能1.1人工智能概述多數(shù)人能答首題。我們以問(wèn)答觀測(cè)反應(yīng)評(píng)估智能,但動(dòng)物如何界定?寵物展現(xiàn)記憶與導(dǎo)航:狗識(shí)舊人、能回家;貓聞開(kāi)罐聲興奮。是條件反射,抑或有意識(shí)聯(lián)結(jié)?關(guān)于動(dòng)物智能,還有一則有趣的軼事:在1900年前后,德國(guó)柏林有一匹人稱“聰明的漢斯”(CleverHans)的馬,據(jù)說(shuō)這匹馬精通數(shù)學(xué),如圖1-1所示?!奥斆鞯臐h斯”表演加法與開(kāi)平方驚艷眾人;無(wú)觀眾時(shí)表現(xiàn)失常。其并非懂?dāng)?shù)學(xué),而是敏銳捕捉觀眾情緒與細(xì)微暗示,借興奮變化逼近正確答案。圖1-1聰明的漢斯(CleverHans)1.1人工智能概述“人工智能”之“人工”源自artificial,常被解作人造且?guī)зH意。但人造物并非次等:如人造花無(wú)需陽(yáng)光與水,便能持久裝飾,外觀逼真,雖手感與香味遜于真花。人工智能(ArtificialIntelligence,AI)是一種利用計(jì)算機(jī)和相關(guān)技術(shù)來(lái)模擬、延伸和擴(kuò)展人的智能的計(jì)算機(jī)科學(xué)的分支,目標(biāo)是使用算法和數(shù)據(jù)構(gòu)建能夠表現(xiàn)出人類智能的系統(tǒng),試圖以人類的智慧為模型,開(kāi)發(fā)出能以與人類智能相似的方式思考、學(xué)習(xí)、解決問(wèn)題的計(jì)算機(jī)程序和技術(shù)。人工智能的研究目標(biāo)是通過(guò)制造智能代理來(lái)實(shí)現(xiàn)人類智慧的各種能力,如語(yǔ)言理解、問(wèn)題解決、學(xué)習(xí)、認(rèn)知和決策等。人工智能的應(yīng)用廣泛,如自動(dòng)駕駛汽車、語(yǔ)音識(shí)別、智能家居等。1.1.2人工智能的定義1.1人工智能概述從發(fā)展程度的角度上,人工智能可以分為三大類:弱人工智能、強(qiáng)人工智能、超人工智能,如圖1-2所示。1.1.3人工智能的分類圖1-2人工智能分類1.1人工智能概述1.弱人工智能(ArtificialNarrowIntelligence,ANI)弱人工智能聚焦單一任務(wù),如AlphaGo只會(huì)下圍棋,能勝世界冠軍;被問(wèn)及圍棋之外的問(wèn)題則無(wú)從作答,顯示其智能專一而非通用。弱人工智能在多個(gè)實(shí)際應(yīng)用中都得到了廣泛應(yīng)用,包括:(1)數(shù)字助手:如Apple的Siri、Amazon的Alexa和Google助手,能夠執(zhí)行語(yǔ)音命令、回答問(wèn)題,并提供個(gè)性化推薦。(2)智能推薦系統(tǒng):如Netflix和Spotify根據(jù)用戶的歷史觀看和聽(tīng)歌記錄,提供個(gè)性化的內(nèi)容推薦。(3)人臉識(shí)別技術(shù):在安全和監(jiān)控系統(tǒng)中應(yīng)用,通過(guò)機(jī)器學(xué)習(xí)算法輸入大量的臉部圖像,識(shí)別和驗(yàn)證個(gè)人身份。這類技術(shù)也被用于社交媒體平臺(tái)以標(biāo)記或識(shí)別用戶1.1人工智能概述2.強(qiáng)人工智能(ArtificialGeneralIntelligence,AGI)強(qiáng)人工智能是一種具有通用智能的系統(tǒng),能夠像人類一樣理解語(yǔ)言、解決問(wèn)題、進(jìn)行推理和做出決策。3.超人工智能(ArtificialSuperIntelligence,ASI)超人工智能是指一種超越人類智能的人工智能形式。在所有領(lǐng)域,包括科學(xué)創(chuàng)新、通識(shí)知識(shí)和社交技能上,超人工智能都顯示出超出人類的能力。本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史1.2人工智能的起源和圖靈測(cè)試AI源自20世紀(jì)50年代,1956達(dá)特茅斯會(huì)議定調(diào)。自符號(hào)主義轉(zhuǎn)向機(jī)器與深度學(xué)習(xí),突破圖像與語(yǔ)言。圖靈測(cè)試探討判定標(biāo)準(zhǔn)。AI分弱、強(qiáng)與超強(qiáng),已廣泛用于醫(yī)金與自動(dòng)駕駛,前景深遠(yuǎn)。1.2人工智能的起源和圖靈測(cè)試AI自20世紀(jì)50年代起步,由符號(hào)主義轉(zhuǎn)向機(jī)器與深度學(xué)習(xí),推動(dòng)圖像、語(yǔ)言等突破,廣泛應(yīng)用并重塑社會(huì),未來(lái)將持續(xù)引領(lǐng)變革。(1)1956達(dá)特茅斯會(huì)議奠基AI,早期符號(hào)主義以規(guī)則和邏輯推理模擬思維,強(qiáng)調(diào)可解釋性。(2)符號(hào)主義難應(yīng)對(duì)不確定和復(fù)雜感知,設(shè)備在動(dòng)態(tài)環(huán)境下脆弱,反應(yīng)僵化受限。(3)60年代末機(jī)器學(xué)習(xí)興起,依賴數(shù)據(jù)自適應(yīng)訓(xùn)練,融合統(tǒng)計(jì)方法與算法優(yōu)化。(4)21世紀(jì)深度學(xué)習(xí)崛起,多層網(wǎng)絡(luò)提取復(fù)雜特征,圖像語(yǔ)音與語(yǔ)言顯著突破。(5)算力與數(shù)據(jù)激增推動(dòng)普及,AI融入各業(yè),持續(xù)驅(qū)動(dòng)創(chuàng)新,同時(shí)帶來(lái)機(jī)遇與挑戰(zhàn)1.2.1人工智能的起源1.2人工智能的起源和圖靈測(cè)試艾倫·圖靈(AlanTuring,1912—1954)是一位杰出的英國(guó)數(shù)學(xué)家,也是計(jì)算機(jī)科學(xué)史上的重要奠基人(圖1-3)。學(xué)習(xí)過(guò)人工智能、計(jì)算機(jī)科學(xué)和密碼學(xué)的學(xué)生對(duì)他的貢獻(xiàn)應(yīng)有所了解。圖靈在人工智能領(lǐng)域的核心貢獻(xiàn)是他所提出的著名“圖靈測(cè)試”。該測(cè)試旨在解決一個(gè)頗具爭(zhēng)議的問(wèn)題:“計(jì)算機(jī)是否具備智能?”。通過(guò)這一測(cè)試,他探討了計(jì)算機(jī)是否能夠模擬人類的思維過(guò)程。1.2.2圖靈測(cè)試圖1-3圖靈1.2人工智能的起源和圖靈測(cè)試埃里希·弗羅姆(ErichFromm)寫(xiě)道:男女平等,但不一定表現(xiàn)都一樣。例如,不同性別的人對(duì)于顏色和花朵的了解可能不同,花在購(gòu)物上的時(shí)間也不同。區(qū)分男女與智能問(wèn)題又有什么關(guān)系呢?圖靈提出了兩個(gè)“模擬游戲”(imitationgames)。第一個(gè)模擬游戲如圖1-4所示。圖靈認(rèn)為,可能存在不同類型的思考方式,了解并容忍這些差異是非常重要的。圖1-5給出了圖靈測(cè)試(Turingtest)的第二個(gè)版本,即第二個(gè)模擬游戲。第二個(gè)模擬游戲更貼合人工智能的研究場(chǎng)景。簾幕后為人或機(jī),機(jī)扮男性且偶爾撒謊,人始終誠(chéng)實(shí)。詢問(wèn)者僅憑問(wèn)答判定對(duì)象身份;若計(jì)算機(jī)成功欺騙,則通過(guò)圖靈測(cè)試,被視為具備智能。圖1-4第一個(gè)模擬游戲圖1-5第二個(gè)模擬游戲本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史1.3人工智能的發(fā)展史人工智能的發(fā)展歷史可以分為以下幾個(gè)階段。1.第一次繁榮期:1956-1976年圖1-6亞里士多德自古人類以機(jī)器替代腦力以增強(qiáng)征服自然之力。兩千多年前AI萌芽已現(xiàn)。亞里士多德在《工具論》中提出形式邏輯定律,三段論成演繹推理基石。亞里士多德(前384—前322,如圖1-6所示),柏拉圖弟子、亞歷山大大帝導(dǎo)師。其系統(tǒng)性著作深遠(yuǎn)影響,涵蓋物理、形而上學(xué)、詩(shī)歌戲劇、音樂(lè)、生物、經(jīng)濟(jì)、動(dòng)物、邏輯、政治、治理與倫理,與柏拉圖、蘇格拉底并稱西方哲學(xué)奠基者。20世紀(jì)50年代,計(jì)算機(jī)科學(xué)家與數(shù)學(xué)家深入研究人工智能,提出“智能是什么”“如何實(shí)現(xiàn)AI”等關(guān)鍵理論問(wèn)題。70年代AI發(fā)展顯著,語(yǔ)言翻譯、圖形學(xué)、知識(shí)表示突破;基于規(guī)則的專家系統(tǒng)涌現(xiàn),在特定領(lǐng)域達(dá)近專家水平,奠定未來(lái)基礎(chǔ)。2.第一次低谷期:1976-1982年由于機(jī)器翻譯等項(xiàng)目的失敗以及一些學(xué)術(shù)報(bào)告的負(fù)面影響,人工智能的經(jīng)費(fèi)普遍減少。在這一階段,人工智能研究遭受了嚴(yán)重打擊,質(zhì)疑與批評(píng)不斷增加。這種情況的主要原因包括運(yùn)算能力不足、計(jì)算復(fù)雜度較高以及實(shí)現(xiàn)常識(shí)與推理的難度較大等。1973年《萊特希爾報(bào)告》批評(píng)符號(hào)主義AI“未達(dá)承諾影響”,宣告首個(gè)“寒冬”到來(lái)。同年BBC以“通用機(jī)器人是海市蜃樓嗎?”辯論引發(fā)社會(huì)擔(dān)憂,行業(yè)面臨挑戰(zhàn)與反思契機(jī)。1.3人工智能的發(fā)展史3.第二次繁榮期:1982-1987年80年代算力提升促AI發(fā)展,神經(jīng)網(wǎng)絡(luò)展現(xiàn)更強(qiáng)學(xué)習(xí),推動(dòng)機(jī)器人控制與圖像識(shí)別應(yīng)用擴(kuò)展。領(lǐng)域受關(guān)注度飆升,硬件進(jìn)步加速研發(fā),計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、機(jī)器翻譯等取得顯著進(jìn)展。4.第二次低谷期:1987-1997年1987年LISP機(jī)市場(chǎng)崩潰,技術(shù)受挫;抽象推理失寵,符號(hào)模型受批評(píng)。盡管80年代神經(jīng)網(wǎng)絡(luò)有進(jìn)展,但應(yīng)用有限,AI再陷低谷。1965年德雷福斯以蘭德報(bào)告《煉金術(shù)與人工智能》批判AI;1988年應(yīng)邀講授AI與海德格爾現(xiàn)象學(xué),促使研究者轉(zhuǎn)向新路徑。5.第三次繁榮期:1997年到現(xiàn)在90年代起,互聯(lián)網(wǎng)普及與硬件提升促AI進(jìn)展,語(yǔ)音識(shí)別、圖像分析、自然語(yǔ)言處理突破;算法發(fā)展推動(dòng)深度學(xué)習(xí)成核心方向。AI不再限專業(yè)領(lǐng)域,大學(xué)與企業(yè)積極加入促應(yīng)用擴(kuò)散。入21世紀(jì),算力與大數(shù)據(jù)興起,AI重?zé)ɑ盍Σ⒍嘤蛲黄?。本章目?.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史1.4人工智能的應(yīng)用領(lǐng)域人工智能可以被應(yīng)用于各種領(lǐng)域,如自動(dòng)駕駛汽車、語(yǔ)音助手、智能機(jī)器人、醫(yī)療診斷、金融分析等。人工智能的發(fā)展能夠改變?nèi)藗兊纳詈凸ぷ鞣绞?,帶?lái)了巨大的社會(huì)影響。1.智能安防人臉識(shí)別、物體檢測(cè)、行為分析協(xié)同應(yīng)用。即時(shí)識(shí)別人員、監(jiān)測(cè)異常物體、預(yù)警風(fēng)險(xiǎn),強(qiáng)化訪問(wèn)控制與監(jiān)控,全面提升社會(huì)治安與建筑安全。2.智能金融智能投顧提供投資建議;風(fēng)險(xiǎn)評(píng)估判定信用;智能化信貸審批提速降人力;智能客服實(shí)時(shí)解答,提高效率與滿意度,推進(jìn)金融服務(wù)智能化。3.智能家居物聯(lián)網(wǎng)聯(lián)動(dòng)設(shè)備,遠(yuǎn)程控安防、溫度、照明。智能門鎖手機(jī)管理,攝像頭實(shí)時(shí)視頻,提升家庭安全與便捷,帶來(lái)更舒適高效的生活體驗(yàn)。1.4人工智能的應(yīng)用領(lǐng)域4.智能醫(yī)療和健康管理AI助力影像診斷早篩,提高精度;可穿戴監(jiān)測(cè)生理數(shù)據(jù),支持個(gè)性化方案與持續(xù)管理,優(yōu)化治療效果并提升患者健康管理水平。5.智慧教育在線平臺(tái)與智能家教個(gè)性化內(nèi)容,按進(jìn)度自適應(yīng)教學(xué);教育機(jī)器人互動(dòng)助學(xué),提升興趣與評(píng)估能力,促進(jìn)因材施教與學(xué)習(xí)效果提升。6.智能制造AI賦能智能工廠與機(jī)器人,聯(lián)通生產(chǎn)、物流、消費(fèi),動(dòng)態(tài)優(yōu)化流程,提效降本,快速響應(yīng)需求,推動(dòng)工業(yè)4.0走向全面智能化。7.智能零售無(wú)人店以傳感器與自動(dòng)支付實(shí)現(xiàn)無(wú)人值守;AI優(yōu)化庫(kù)存與供應(yīng)鏈;客流統(tǒng)計(jì)分析行為,助力精準(zhǔn)營(yíng)銷與運(yùn)營(yíng)決策,重塑購(gòu)物體驗(yàn)。8.智能交通與自動(dòng)駕駛智能交通整合通信與控制,實(shí)時(shí)優(yōu)化信號(hào)提升通行效率;自動(dòng)駕駛與生態(tài)導(dǎo)航降擁堵與事故,降低能耗,提高安全,支撐城市可持續(xù)。本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史1.5人工智能相關(guān)技術(shù)人工智能技術(shù)以數(shù)據(jù)、算力、算法和場(chǎng)景為核心要素,支撐其快速發(fā)展。關(guān)鍵技術(shù)主要包括:(1)機(jī)器學(xué)習(xí):通過(guò)數(shù)據(jù)訓(xùn)練模型,應(yīng)用于金融、醫(yī)療等領(lǐng)域。(2)深度學(xué)習(xí):基于神經(jīng)網(wǎng)絡(luò),擅長(zhǎng)圖像、語(yǔ)音識(shí)別。(3)計(jì)算機(jī)視覺(jué):處理圖像與視頻,推動(dòng)自動(dòng)駕駛等應(yīng)用。(4)自然語(yǔ)言處理:實(shí)現(xiàn)人機(jī)交互,如翻譯與輿情分析。(5)語(yǔ)音識(shí)別:將語(yǔ)音轉(zhuǎn)為文本,用于智能家居與車載系統(tǒng)。(6)生成式AI:創(chuàng)造新內(nèi)容,如文本、圖像生成。這些技術(shù)共同推動(dòng)AI的廣泛應(yīng)用與創(chuàng)新。1.5人工智能相關(guān)技術(shù)人工智能四要素包括:數(shù)據(jù)、算力、算法、場(chǎng)景。隨著AI大模型規(guī)模的不斷擴(kuò)大,對(duì)計(jì)算資源的需求也在增加。高性能的硬件設(shè)備、海量場(chǎng)景數(shù)據(jù)、強(qiáng)大的算力基礎(chǔ)和升級(jí)迭代的算法模型成為支持AI大模型發(fā)展的關(guān)鍵。數(shù)據(jù)(Data)是AI訓(xùn)練與優(yōu)化的基礎(chǔ)。結(jié)構(gòu)化、非結(jié)構(gòu)化與實(shí)時(shí)數(shù)據(jù)同源匯入;大規(guī)模高質(zhì)量數(shù)據(jù)構(gòu)筑護(hù)城河,支撐關(guān)鍵算力與應(yīng)用成效。算力(ComputingPower)為AI提供計(jì)算支撐。深度學(xué)習(xí)需高并行矩陣運(yùn)算,GPU與專用AI芯片加速訓(xùn)練與推理,顯著提升效率與速度。算法(Algorithm)是智能決策與預(yù)測(cè)之本。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等從數(shù)據(jù)中學(xué)習(xí),驅(qū)動(dòng)語(yǔ)音、圖像、NLP突破,支撐更高級(jí)AI能力。數(shù)據(jù)、算力、算法作為輸入,只有在實(shí)際的場(chǎng)景(Scene)中進(jìn)行輸出,才能體現(xiàn)實(shí)際價(jià)值。1.5.1人工智能四要素1.5人工智能相關(guān)技術(shù)

人工智能的技術(shù)架構(gòu)按照產(chǎn)業(yè)生態(tài)通??梢詣澐譃榛A(chǔ)層、技術(shù)層、應(yīng)用層三大板塊,如圖1-6所示。1.5.2人工智能技術(shù)架構(gòu)圖1-6人工智能技術(shù)架構(gòu)1.5人工智能相關(guān)技術(shù)

基礎(chǔ)層提供大規(guī)模數(shù)據(jù)存儲(chǔ)處理與高性能算力、通信基礎(chǔ)設(shè)施;技術(shù)層以AI算法處理分析數(shù)據(jù)、提取信息知識(shí);應(yīng)用層將模型落地場(chǎng)景,實(shí)現(xiàn)智能決策與優(yōu)化。

三層框架相互交織、功能重疊互動(dòng);實(shí)踐中需按需求定制與整合,形成完整可落地的人工智能解決方案。1.5人工智能相關(guān)技術(shù)機(jī)器學(xué)習(xí)(MachineLearning,ML)是一門多領(lǐng)域交叉學(xué)科,綜合了概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究如何通過(guò)計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,從而獲取新的知識(shí)或技能并不斷改善自身的性能。作為人工智能的核心,機(jī)器學(xué)習(xí)是賦予計(jì)算機(jī)智能的根本途徑。在機(jī)器學(xué)習(xí)領(lǐng)域,數(shù)據(jù)、算法和模型是三個(gè)至關(guān)重要的要素。1.機(jī)器學(xué)習(xí)1.5人工智能相關(guān)技術(shù)(1)數(shù)據(jù)機(jī)器學(xué)習(xí)的核心目標(biāo)是讓計(jì)算機(jī)在沒(méi)有明確指令的情況下,基于輸入數(shù)據(jù)進(jìn)行預(yù)測(cè)輸出。數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)(如表格數(shù)據(jù))和非結(jié)構(gòu)化數(shù)據(jù)(如圖像、文本、音頻等)。在機(jī)器學(xué)習(xí)過(guò)程中,數(shù)據(jù)用于訓(xùn)練模型、評(píng)估模型性能,以及支持預(yù)測(cè)和決策。與數(shù)據(jù)密切相關(guān)的重要概念:數(shù)據(jù)集(dataset):用來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型的一組數(shù)據(jù)。開(kāi)發(fā)者通常根據(jù)具體任務(wù)選擇或設(shè)計(jì)數(shù)據(jù)集,常見(jiàn)的數(shù)據(jù)集類型包括數(shù)值型、統(tǒng)計(jì)型、文本型和圖像型數(shù)據(jù)集。不同數(shù)據(jù)集在數(shù)據(jù)類型、規(guī)模和復(fù)雜度上存在顯著差異。樣本(sample):模型訓(xùn)練和學(xué)習(xí)過(guò)程中使用的基本數(shù)據(jù)單位,用以描述某個(gè)具體對(duì)象。數(shù)據(jù)集中的每條數(shù)據(jù)即為一個(gè)樣本。特征(feature):每個(gè)樣本包含的一組屬性信息,用以描述該樣本的各種特性。例如,一個(gè)人的樣本可能包含姓名、性別、年齡、身高、體重等。在機(jī)器學(xué)習(xí)中,特征值和特征向量用于表示和操作數(shù)據(jù),是訓(xùn)練模型的基礎(chǔ)。標(biāo)簽(label):也稱為標(biāo)記,表示樣本對(duì)應(yīng)的目標(biāo)值或期望輸出。為數(shù)據(jù)添加標(biāo)簽的過(guò)程稱為數(shù)據(jù)標(biāo)注,它為監(jiān)督學(xué)習(xí)提供了學(xué)習(xí)目標(biāo)和方向。機(jī)器學(xué)習(xí)的第一步是準(zhǔn)備和處理輸入數(shù)據(jù),這也奠定了后續(xù)工作的基礎(chǔ)。1.5人工智能相關(guān)技術(shù)(2)算法機(jī)器學(xué)習(xí)是賦予機(jī)器“學(xué)習(xí)能力”的技術(shù),而算法則是實(shí)現(xiàn)這種學(xué)習(xí)的具體方法。不同算法對(duì)應(yīng)不同的數(shù)學(xué)公式,將輸入數(shù)據(jù)帶入算法中,即可得到相應(yīng)的輸出結(jié)果。算法是推動(dòng)人工智能發(fā)展的關(guān)鍵。算法工程師的主要職責(zé)包括:使用數(shù)據(jù)分析技術(shù)和建模工具理解和挖掘數(shù)據(jù)特性。設(shè)計(jì)和開(kāi)發(fā)創(chuàng)新算法,解決具體問(wèn)題。編寫(xiě)代碼實(shí)現(xiàn)算法功能。優(yōu)化算法性能,提升其預(yù)測(cè)準(zhǔn)確率和運(yùn)算效率。(3)模型模型是算法與數(shù)據(jù)結(jié)合后的產(chǎn)物。將輸入數(shù)據(jù)傳入模型后,模型會(huì)基于所用算法進(jìn)行處理,生成預(yù)測(cè)結(jié)果。對(duì)于監(jiān)督學(xué)習(xí),輸入數(shù)據(jù)配有期望輸出的標(biāo)簽,模型通過(guò)比較預(yù)測(cè)值與標(biāo)簽不斷調(diào)整參數(shù),優(yōu)化算法。1.5人工智能相關(guān)技術(shù)總之,數(shù)據(jù)提供基礎(chǔ),算法賦予方法,模型實(shí)現(xiàn)預(yù)測(cè),三者相輔相成,共同推動(dòng)機(jī)器學(xué)習(xí)技術(shù)的發(fā)展。機(jī)器學(xué)習(xí)的主要算法包括有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。機(jī)器學(xué)習(xí)的分類如圖1-7所示。圖1-7機(jī)器學(xué)習(xí)的分類1.5人工智能相關(guān)技術(shù)(1)監(jiān)督學(xué)習(xí)訓(xùn)練監(jiān)督學(xué)習(xí)(supervisedlearning)模型時(shí),需要為模型提供帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)。模型在學(xué)習(xí)時(shí)同時(shí)獲得輸入與理想輸出(標(biāo)簽)。標(biāo)簽起“監(jiān)督”作用,模型比較預(yù)測(cè)與標(biāo)簽差異,反復(fù)調(diào)整參數(shù),逐步提升預(yù)測(cè)準(zhǔn)確度與泛化表現(xiàn)。監(jiān)督學(xué)習(xí)依賴標(biāo)注數(shù)據(jù)訓(xùn)練,如圖像標(biāo)注動(dòng)物類別。數(shù)據(jù)充足且高質(zhì)時(shí),可精準(zhǔn)分類或預(yù)測(cè),如以癥狀為輸入、疾病為標(biāo)簽的診斷。監(jiān)督學(xué)習(xí)主要應(yīng)用于以下兩類任務(wù):分類(classification)任務(wù):預(yù)測(cè)輸入數(shù)據(jù)所屬的類別,輸出結(jié)果為離散的類別標(biāo)簽。例如,判斷明天的天氣是晴天、陰天、雨天還是雪天。

若僅有兩個(gè)類別,該任務(wù)稱為二分類問(wèn)題,比如判定圖片中動(dòng)物是貓還是狗?;貧w(regression)任務(wù):預(yù)測(cè)輸出為連續(xù)數(shù)值的任務(wù)。例如,預(yù)測(cè)明天的氣溫變化。1.5人工智能相關(guān)技術(shù)(2)無(wú)監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)不同,無(wú)監(jiān)督學(xué)習(xí)不依賴于帶標(biāo)簽的數(shù)據(jù),而是基于輸入數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和特征,嘗試將相似的數(shù)據(jù)點(diǎn)歸為一類。這個(gè)過(guò)程通常被稱為聚類(clustering)。無(wú)監(jiān)督學(xué)習(xí)無(wú)需嚴(yán)格標(biāo)注,靈活且門檻低,適用更廣。電商可基于購(gòu)物與搜索歷史聚類用戶,劃分群體并推薦相似商品,典型用于推薦系統(tǒng)。除聚類外,無(wú)監(jiān)督學(xué)習(xí)還適用于以下兩類任務(wù):異常檢測(cè)(AnomalyDetection):識(shí)別數(shù)據(jù)中的異常點(diǎn)或異常行為,從本質(zhì)上也是一種分類方法,用于發(fā)現(xiàn)與大部分?jǐn)?shù)據(jù)顯著不同的樣本。密度分析(DensityEstimation):也稱為概率密度估計(jì),通過(guò)對(duì)訓(xùn)練樣本的分布進(jìn)行估計(jì),推斷樣本空間的概率密度。這是生成模型等技術(shù)的基礎(chǔ)之一。1.5人工智能相關(guān)技術(shù)(3)半監(jiān)督學(xué)習(xí)監(jiān)督與無(wú)監(jiān)督各有限:監(jiān)督效果佳但高質(zhì)標(biāo)注昂貴且耗時(shí),規(guī)模越大越明顯;無(wú)監(jiān)督不依賴標(biāo)注但適用面受限、難解諸多任務(wù)?;诖?,半監(jiān)督融合二者優(yōu)勢(shì),提高學(xué)習(xí)效率與應(yīng)用成效。半監(jiān)督學(xué)習(xí)的工作原理如圖1-8所示。圖1-8半監(jiān)督學(xué)習(xí)的工作原理1.5人工智能相關(guān)技術(shù)(4)強(qiáng)化學(xué)習(xí)概括而言,強(qiáng)化學(xué)習(xí)是一種基于反復(fù)試驗(yàn)的學(xué)習(xí)方法,包含以下核心概念:代理人(agent):指試圖學(xué)習(xí)和決策的主體(可類比游戲中的玩家角色)。環(huán)境(environment):代理人所處的外部環(huán)境(類似游戲中的虛擬世界)。狀態(tài)(state):代理人從環(huán)境中感知到的自身信息,如游戲中角色的經(jīng)驗(yàn)值、體力值等。行動(dòng)(actions):代理人基于當(dāng)前狀態(tài)在環(huán)境中執(zhí)行的各種操作,例如游戲角色的行走、跳躍或使用道具。獎(jiǎng)勵(lì)(reward):對(duì)代理人行動(dòng)結(jié)果的反饋,正向獎(jiǎng)勵(lì)表示成功(如角色升級(jí)),負(fù)向獎(jiǎng)勵(lì)表示失敗。策略(strategy):代理人根據(jù)當(dāng)前狀態(tài)制定的行動(dòng)方案,目標(biāo)是在未來(lái)一段時(shí)間內(nèi)最大化累計(jì)正向獎(jiǎng)勵(lì),最小化負(fù)向獎(jiǎng)勵(lì)。價(jià)值函數(shù)(valuefunction):用于評(píng)估某一狀態(tài)或動(dòng)作對(duì)代理人未來(lái)收益的函數(shù),衡量其“價(jià)值”。1.5人工智能相關(guān)技術(shù)在強(qiáng)化學(xué)習(xí)中,代理人作為智能體,根據(jù)環(huán)境反饋不斷調(diào)整策略,通過(guò)不斷試錯(cuò)以優(yōu)化決策,從而實(shí)現(xiàn)最佳行為選擇。強(qiáng)化學(xué)習(xí)的工作原理如圖1-9所示。強(qiáng)化學(xué)習(xí)適用于完成決策任務(wù)。圖1-9強(qiáng)化學(xué)習(xí)的工作原理1.5人工智能相關(guān)技術(shù)深度學(xué)習(xí)(DeepLearning,DL)是機(jī)器學(xué)習(xí)的一種分支,主要通過(guò)構(gòu)建模擬人腦的神經(jīng)網(wǎng)絡(luò),來(lái)實(shí)現(xiàn)對(duì)圖像、聲音、文本等數(shù)據(jù)的識(shí)別、理解和生成。核心在于使用多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠通過(guò)大量數(shù)據(jù)自動(dòng)學(xué)習(xí)特征和模式,從而在復(fù)雜任務(wù)中表現(xiàn)優(yōu)異。相較于傳統(tǒng)機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)具有更強(qiáng)的表達(dá)能力和學(xué)習(xí)能力,適合處理大規(guī)模和高維度的數(shù)據(jù)。2.深度學(xué)習(xí)1.5人工智能相關(guān)技術(shù)(1)發(fā)展歷史20世紀(jì)50—60年代提出神經(jīng)網(wǎng)絡(luò)與感知機(jī)概念;受算力與數(shù)據(jù)限制,發(fā)展曾停滯。2006年辛頓等提出深度信念網(wǎng)絡(luò)與無(wú)監(jiān)督預(yù)訓(xùn)練,緩解深層訓(xùn)練難題,推動(dòng)深度學(xué)習(xí)復(fù)興。(2)主要算法深度學(xué)習(xí)包括多種算法,各有不同的特點(diǎn)和應(yīng)用領(lǐng)域:卷積神經(jīng)網(wǎng)絡(luò)(CNN):主要用于圖像識(shí)別和計(jì)算機(jī)視覺(jué)。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN):用于序列數(shù)據(jù)處理及自然語(yǔ)言處理。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM):一種特定的RNN,可有效解決梯度消失問(wèn)題,適用于序列預(yù)測(cè)。生成對(duì)抗網(wǎng)絡(luò)(GAN):用于生成真實(shí)的圖像、音頻和文本。自編碼器(AE):用于無(wú)監(jiān)督學(xué)習(xí),可進(jìn)行數(shù)據(jù)降維及特征提取。深度強(qiáng)化學(xué)習(xí)(DRL):結(jié)合深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí),學(xué)習(xí)高層次策略。1.5人工智能相關(guān)技術(shù)(3)建模過(guò)程深度學(xué)習(xí)的建模過(guò)程一般包括以下步驟:數(shù)據(jù)收集與預(yù)處理:整理和清洗數(shù)據(jù),進(jìn)行特征選擇與標(biāo)準(zhǔn)化。模型選擇與設(shè)計(jì):根據(jù)問(wèn)題和數(shù)據(jù)特征選擇合適的深度學(xué)習(xí)模型,并設(shè)計(jì)其結(jié)構(gòu)。模型訓(xùn)練:使用訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,優(yōu)化模型參數(shù),選擇合適的優(yōu)化算法和損失函數(shù)。模型評(píng)估與調(diào)優(yōu):使用測(cè)試數(shù)據(jù)評(píng)估模型性能,并進(jìn)行必要的調(diào)整,以提升泛化能力和魯棒性。模型應(yīng)用與部署:將訓(xùn)練好的模型應(yīng)用于實(shí)際問(wèn)題,部署到相應(yīng)系統(tǒng),實(shí)現(xiàn)自動(dòng)化處理和決策。需要注意的是,不同任務(wù)可能會(huì)使這些步驟有所變化,深度學(xué)習(xí)的建模過(guò)程通常是一個(gè)迭代優(yōu)化的過(guò)程。1.5人工智能相關(guān)技術(shù)(4)應(yīng)用場(chǎng)景深度學(xué)習(xí)的應(yīng)用廣泛,主要場(chǎng)景包括:計(jì)算機(jī)視覺(jué):圖像分類、目標(biāo)檢測(cè)、圖像分割、人臉識(shí)別等。自然語(yǔ)言處理:文本分類、情感分析、機(jī)器翻譯、對(duì)話系統(tǒng)等。推薦系統(tǒng):商品推薦、廣告推薦、搜索排序等。醫(yī)療健康:疾病診斷、醫(yī)療影像分析等。金融風(fēng)控:風(fēng)險(xiǎn)評(píng)估、欺詐檢測(cè)等。自動(dòng)駕駛:圖像識(shí)別、車道檢測(cè)、交通標(biāo)志識(shí)別等。深度學(xué)習(xí)以其強(qiáng)大的能力在各種領(lǐng)域中發(fā)揮著重要作用,不斷推動(dòng)人工智能技術(shù)的發(fā)展。1.5人工智能相關(guān)技術(shù)計(jì)算機(jī)視覺(jué)(ComputerVision,CV)是人工智能領(lǐng)域的一項(xiàng)重要研究方向,致力于讓計(jì)算機(jī)能夠理解和解釋圖像或視頻中的信息。通過(guò)研究如何從視覺(jué)數(shù)據(jù)中獲取信息,并對(duì)其進(jìn)行處理與分析,計(jì)算機(jī)視覺(jué)使機(jī)器能夠自動(dòng)完成檢測(cè)、識(shí)別、跟蹤等任務(wù)。應(yīng)用涵蓋從人臉識(shí)別、對(duì)象檢測(cè)到自動(dòng)駕駛等眾多領(lǐng)域。圖像處理與分析:先預(yù)處理與濾波降噪提質(zhì);再提取邊緣、紋理、顏色、形狀等特征,支撐后續(xù)分析。特征提取效果直接影響分類準(zhǔn)確性。深度學(xué)習(xí)推動(dòng):CNN在分類、檢測(cè)、分割、識(shí)別上表現(xiàn)卓越,多層網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)大規(guī)模數(shù)據(jù)模式,顯著提升準(zhǔn)確性與魯棒性,優(yōu)于傳統(tǒng)方法,適應(yīng)復(fù)雜場(chǎng)景與環(huán)境變化。其他方向與應(yīng)用:涵蓋運(yùn)動(dòng)分析、三維重建、圖像合成;廣泛用于醫(yī)療影像、智能監(jiān)控、AR/VR等,持續(xù)驅(qū)動(dòng)創(chuàng)新并強(qiáng)化未來(lái)技術(shù)影響力。3.計(jì)算機(jī)視覺(jué)1.5人工智能相關(guān)技術(shù)自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)是人工智能(AI)領(lǐng)域的重要分支,致力于研究如何理解和處理人類語(yǔ)言。核心目標(biāo)是構(gòu)建能夠準(zhǔn)確理解并回應(yīng)人類輸入的智能系統(tǒng),從而實(shí)現(xiàn)更加自然、高效的人機(jī)交互。NLP技術(shù)融合了語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)和人工智能等多學(xué)科的研究成果,近年來(lái)取得了顯著的發(fā)展與突破。4.自然語(yǔ)言處理1.5人工智能相關(guān)技術(shù)語(yǔ)音識(shí)別技術(shù)是一種將人類語(yǔ)音轉(zhuǎn)換為文本的先進(jìn)技術(shù),廣泛應(yīng)用于現(xiàn)代人機(jī)交互中。(1)工作原理語(yǔ)音識(shí)別的工作原理通常包括幾個(gè)關(guān)鍵步驟。首先是音頻信號(hào)的采集和預(yù)處理,包括降噪、信號(hào)放大和采樣等。接著,通過(guò)特征提取算法(如梅爾頻率倒譜系數(shù)MFCC)提取出語(yǔ)音特征,這些特征能夠有效描述語(yǔ)音的音色和音高等信息。隨后,這些特征會(huì)被輸入到機(jī)器學(xué)習(xí)模型(例如深度神經(jīng)網(wǎng)絡(luò))中進(jìn)行訓(xùn)練與識(shí)別,以預(yù)測(cè)其對(duì)應(yīng)的文本輸出。(2)應(yīng)用領(lǐng)域語(yǔ)音識(shí)別技術(shù)在多個(gè)領(lǐng)域都有廣泛應(yīng)用,如:智能家居:用戶可以通過(guò)語(yǔ)音指令控制家庭中的智能設(shè)備,例如調(diào)節(jié)燈光、溫度和安全系統(tǒng)等。車載娛樂(lè):司機(jī)可以通過(guò)語(yǔ)音命令控制導(dǎo)航、音樂(lè)播放和電話接聽(tīng),大大提高了駕駛安全性。手機(jī)助手:智能手機(jī)中的語(yǔ)音助手(例如Apple的Siri、GoogleAssistant)允許用戶通過(guò)語(yǔ)音進(jìn)行查詢、設(shè)置提醒、發(fā)送信息等操作。5.語(yǔ)音識(shí)別1.5人工智能相關(guān)技術(shù)(3)未來(lái)發(fā)展AI與ML進(jìn)步提升語(yǔ)音識(shí)別準(zhǔn)確與響應(yīng);5G增強(qiáng)實(shí)時(shí)性與接入效率。未來(lái)將廣泛應(yīng)用醫(yī)療、教育、客服等場(chǎng)景,帶來(lái)便捷與樂(lè)趣??傊?,語(yǔ)音識(shí)別技術(shù)的持續(xù)發(fā)展和應(yīng)用將改變我們與設(shè)備交互的方式,使之更加智能化和人性化。1.5人工智能相關(guān)技術(shù)生成式人工智能(ArtificialIntelligenceGeneratedContent,AIGC)是一種前沿的人工智能技術(shù),旨在通過(guò)自動(dòng)生成內(nèi)容來(lái)滿足多種需求。(1)工作原理AIGC主要依賴于深度學(xué)習(xí)算法,尤其是生成對(duì)抗網(wǎng)絡(luò)(GAN)和變分自編碼器(VAE)。這些算法通過(guò)對(duì)大量數(shù)據(jù)進(jìn)行訓(xùn)練,理解其中的分布特征,從而生成新的內(nèi)容。例如,在文本生成中,模型可以學(xué)習(xí)語(yǔ)言的結(jié)構(gòu)和語(yǔ)法規(guī)則,生成連貫且符合語(yǔ)境的句子。在圖像生成方面,GAN可以創(chuàng)造出高逼真的圖像,從而在藝術(shù)、設(shè)計(jì)和廣告等領(lǐng)域找到應(yīng)用。6.生成式人工智能1.5人工智能相關(guān)技術(shù)(2)應(yīng)用領(lǐng)域AIGC的應(yīng)用領(lǐng)域相當(dāng)廣泛,包括但不限于:文本生成:自動(dòng)生成新聞報(bào)道、社交媒體內(nèi)容、博客文章和小說(shuō),極大地提高了內(nèi)容創(chuàng)作的效率。圖像生成:可以生成藝術(shù)作品、產(chǎn)品設(shè)計(jì)或廣告圖像等,降低了設(shè)計(jì)成本并激發(fā)了創(chuàng)意。音頻和視頻生成:在音樂(lè)創(chuàng)作、音效設(shè)計(jì)以及視頻制作領(lǐng)域,AIGC能夠快速生成高質(zhì)量的音頻和視頻內(nèi)容。AIGC在人工智能中的定位及其與其他要素的關(guān)系如圖1-10所示。圖1-10AIGC在人工智能中的定位及其與其他要素的關(guān)系本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測(cè)試1.6人工智能倫理1.5人工智能相關(guān)技術(shù)1.4人工智能的應(yīng)用領(lǐng)域1.3人工智能的發(fā)展歷史1.6人工智能倫理人工智能倫理學(xué)作為專門研究人工智能系統(tǒng)應(yīng)用倫理的學(xué)科,關(guān)注人類在設(shè)計(jì)、制造、使用人工智能系統(tǒng)過(guò)程中涉及的道德問(wèn)題,涵蓋機(jī)器倫理中的機(jī)器行為及超級(jí)人工智能引發(fā)的奇點(diǎn)問(wèn)題。具體而言,人工智能倫理涵蓋以下幾個(gè)關(guān)鍵方面:(1)隱私保護(hù)與數(shù)據(jù)安全AI依賴海量數(shù)據(jù),收集存儲(chǔ)易致隱私泄露與濫用。需保障個(gè)人信息與用戶隱私,推動(dòng)更安全的數(shù)據(jù)管理與保護(hù)技術(shù)。(2)算法公平與透明偏見(jiàn)致歧視,損害弱勢(shì)群體;如人臉識(shí)別跨族群準(zhǔn)確率差異。應(yīng)提升算法公平、可解釋與透明,維護(hù)社會(huì)公正。(3)責(zé)任歸屬與法律挑戰(zhàn)醫(yī)療、司法、自動(dòng)駕駛等失誤致責(zé)難界定。需明確開(kāi)發(fā)者、使用者與系統(tǒng)責(zé)任,完善法律框架與治理機(jī)制。1.6人工智能倫理(4)就業(yè)影響與社會(huì)公正自動(dòng)化重塑就業(yè)結(jié)構(gòu),或加劇分層與失業(yè)。需以政策調(diào)節(jié)與保障,推動(dòng)AI成果的包容共享與社會(huì)公平。(5)安全風(fēng)險(xiǎn)與惡意使用技術(shù)或被用于網(wǎng)攻、信息操控、武器化,增新威脅。應(yīng)構(gòu)建多方協(xié)作,強(qiáng)化風(fēng)評(píng)與防范,遏制惡意利用。2016年IEEE發(fā)布《AI設(shè)計(jì)倫理準(zhǔn)則》白皮書(shū),倡建通行倫理標(biāo)準(zhǔn)。2017年ISO組建AI委員會(huì),制定算法偏見(jiàn)、隱私、數(shù)據(jù)與網(wǎng)絡(luò)、機(jī)器人倫理等標(biāo)準(zhǔn)。2018年牛津、劍橋、OpenAI發(fā)布《AI的惡意使用》報(bào)告,評(píng)估安全威脅并給出對(duì)策;微軟、谷歌、IBM等亦發(fā)布倫理原則。2021年11月,聯(lián)合國(guó)教科文組織通過(guò)《人工智能倫理建議書(shū)》,確立人權(quán)與尊嚴(yán)、環(huán)境可持續(xù)、多樣與包容、和平公正四大價(jià)值,明確十項(xiàng)原則與十一行動(dòng)領(lǐng)域,成為全球權(quán)威指導(dǎo)并為國(guó)際標(biāo)準(zhǔn)與法律提供重要參考。第二章機(jī)器學(xué)習(xí)《人工智能通識(shí)教程》配套課件《人工智能通識(shí)》教研組本章概述本章介紹機(jī)器學(xué)習(xí)的基本概念、發(fā)展歷程及多樣化應(yīng)用,涵蓋學(xué)習(xí)分類、系統(tǒng)結(jié)構(gòu)、主要算法及實(shí)際應(yīng)用,幫助讀者全面理解機(jī)器學(xué)習(xí)的理論與實(shí)踐價(jià)值。主要講述的內(nèi)容如下:(1)機(jī)器學(xué)習(xí)的發(fā)展概述與定義,介紹研究?jī)?nèi)容和基礎(chǔ)知識(shí)。(2)機(jī)器學(xué)習(xí)的分類,包含監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等方法。(3)機(jī)器學(xué)習(xí)系統(tǒng)結(jié)構(gòu),闡明環(huán)境、知識(shí)庫(kù)與執(zhí)行部分的組成。(4)主要機(jī)器學(xué)習(xí)算法,涵蓋回歸、決策樹(shù)、樸素貝葉斯、聚類、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)及集成方法。(5)機(jī)器學(xué)習(xí)的實(shí)際應(yīng)用,展示其在數(shù)據(jù)分析、模式識(shí)別、生物信息學(xué)、物聯(lián)網(wǎng)、聊天機(jī)器人和無(wú)人駕駛等領(lǐng)域的廣泛應(yīng)用。本章目錄2.1機(jī)器學(xué)習(xí)概述12.2基于學(xué)習(xí)方式的分類2.5機(jī)器學(xué)習(xí)的應(yīng)用2.4機(jī)器學(xué)習(xí)的算法2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)本章目錄2.1機(jī)器學(xué)習(xí)概述12.2基于學(xué)習(xí)方式的分類2.5機(jī)器學(xué)習(xí)的應(yīng)用2.4機(jī)器學(xué)習(xí)的算法2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)2.1機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)(MachineLearning,ML)是人工智能的一個(gè)重要分支,旨在使計(jì)算機(jī)系統(tǒng)通過(guò)數(shù)據(jù)學(xué)習(xí)和改進(jìn)其性能,而無(wú)需明確編程。機(jī)器學(xué)習(xí)算法通過(guò)識(shí)別數(shù)據(jù)中的模式和規(guī)律,能夠進(jìn)行預(yù)測(cè)、分類和決策等任務(wù)。一些手機(jī)提供了智能語(yǔ)音助手,一些電子郵箱使用了垃圾郵件過(guò)濾器(軟件),等等。機(jī)器學(xué)習(xí)作為人工智能的一個(gè)分支,如圖2-1所示,機(jī)器學(xué)習(xí)所涉及的應(yīng)用范圍包括語(yǔ)言處理、圖像識(shí)別和智能規(guī)劃等。圖2-1機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支2.1機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)最早可以迫溯到英國(guó)數(shù)學(xué)家貝葉斯在1763年發(fā)表的貝葉斯定理,這是關(guān)于隨機(jī)事件A和B的條件概率(或邊緣概率)的一則數(shù)學(xué)定理。貝葉斯定理是概率論中的一個(gè)重要定理,它描述了如何根據(jù)新的證據(jù)更新事件的概率。公式如下:2.1.1機(jī)器學(xué)習(xí)的發(fā)展2.1機(jī)器學(xué)習(xí)概述應(yīng)用場(chǎng)景:醫(yī)學(xué)診斷:根據(jù)測(cè)試結(jié)果更新疾病的可能性。機(jī)器學(xué)習(xí):在分類算法中,通過(guò)先前的數(shù)據(jù)更新模型。決策分析:在不確定的環(huán)境中根據(jù)新信息調(diào)整決策。貝葉斯定理提供了一種系統(tǒng)的方法來(lái)整合新證據(jù)與先驗(yàn)知識(shí),從而得出更準(zhǔn)確的概率評(píng)估。2.1機(jī)器學(xué)習(xí)概述從20世紀(jì)50年代研究機(jī)器學(xué)習(xí)以來(lái),不同時(shí)期的研究途徑和目標(biāo)并不相同,大體上可以劃分為4個(gè)階段。第1階段(20世紀(jì)50年代中半至60年代中半):熱烈時(shí)期。本階段研究“有無(wú)知識(shí)的學(xué)習(xí)”,聚焦執(zhí)行能力。通過(guò)改變環(huán)境與性能參數(shù)檢驗(yàn)反饋,系統(tǒng)在程序作用下自組織調(diào)整,最終擇優(yōu)環(huán)境生存。代表性成果為塞繆爾的下棋程序。第2階段(20世紀(jì)60年代中半至70年代中半):冷靜時(shí)期。本階段聚焦植入領(lǐng)域知識(shí),模擬人類學(xué)習(xí),以圖與邏輯結(jié)構(gòu)表征系統(tǒng)。因?qū)W習(xí)長(zhǎng)期性,轉(zhuǎn)向整合專家知識(shí)以獲深層認(rèn)知,并取得成效;代表為海耶斯與羅斯的結(jié)構(gòu)學(xué)習(xí)方法。第3階段(20世紀(jì)70年代中半至80年代中半):復(fù)興時(shí)期。本階段由單概念擴(kuò)展至多概念學(xué)習(xí),策略與應(yīng)用并進(jìn);專家系統(tǒng)的知識(shí)獲取需求推動(dòng)ML發(fā)展,示例歸納與自動(dòng)知識(shí)獲取成主流。1980研討會(huì)奠基,1984專著與期刊創(chuàng)刊。代表作有莫斯托、萊納特、蘭利之作。第4階段(自20世紀(jì)80年代中半):新的邊緣學(xué)科階段。2.1機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的這個(gè)新階段具有如下特點(diǎn):(1)機(jī)器學(xué)習(xí)成為新的邊緣學(xué)科,它綜合應(yīng)用了心理學(xué)、生物學(xué)、神經(jīng)生理學(xué)、數(shù)學(xué)、自動(dòng)化和計(jì)算機(jī)科學(xué)等,形成了機(jī)器學(xué)習(xí)理論基礎(chǔ)。(2)融合各種學(xué)習(xí)方法,且形式多樣的集成學(xué)習(xí)系統(tǒng)研究正在興起,機(jī)器學(xué)習(xí)融合的各種學(xué)習(xí)方法如圖2-2所示。(3)機(jī)器學(xué)習(xí)與AI基礎(chǔ)問(wèn)題的統(tǒng)一性觀點(diǎn)形成:將學(xué)習(xí)與求解結(jié)合、以便于學(xué)習(xí)的知識(shí)表達(dá),催生通用智能系統(tǒng)的組塊學(xué)習(xí)。類比學(xué)習(xí)與求解結(jié)合的案例法成經(jīng)驗(yàn)學(xué)習(xí)重要方向。(4)學(xué)習(xí)方法應(yīng)用擴(kuò)展并商品化:歸納學(xué)習(xí)的知識(shí)獲取工具廣泛用于診斷專家系統(tǒng);連接學(xué)習(xí)在聲圖文識(shí)別占優(yōu);分析學(xué)習(xí)用于設(shè)計(jì)型專家系統(tǒng);遺傳算法與強(qiáng)化學(xué)習(xí)在工程控制具前景;與符號(hào)系統(tǒng)耦合的神經(jīng)網(wǎng)絡(luò)用于智能管理與機(jī)器人規(guī)劃。(5)學(xué)術(shù)活動(dòng)空前活躍:除年度機(jī)器學(xué)習(xí)研討會(huì)外,尚有計(jì)算機(jī)學(xué)習(xí)理論會(huì)議、遺傳算法會(huì)議等國(guó)際會(huì)議持續(xù)推進(jìn)研究。2.1機(jī)器學(xué)習(xí)概述圖2-2機(jī)器學(xué)習(xí)融合的各種學(xué)習(xí)方法2.1機(jī)器學(xué)習(xí)概述學(xué)習(xí)是人類具有的一種重要的智能行為,而機(jī)器學(xué)習(xí)多學(xué)科交叉,使用計(jì)算機(jī)作為工具,致力于真實(shí)實(shí)時(shí)的模擬人類學(xué)習(xí)方式,并將現(xiàn)有內(nèi)容進(jìn)行知識(shí)結(jié)構(gòu)劃分來(lái)有效提高學(xué)習(xí)效率。蘭利(1996年)的定義是:“機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),該領(lǐng)域的主要研究對(duì)象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能?!睖贰っ浊袪枺?997年)對(duì)信息論中的一些概念有詳細(xì)的解釋,其中定義機(jī)器學(xué)習(xí)時(shí)提到:“機(jī)器學(xué)習(xí)是對(duì)能通過(guò)經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究?!卑柵炼。?004年)對(duì)機(jī)器學(xué)習(xí)的定義是:“機(jī)器學(xué)習(xí)使用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。”2.1.2機(jī)器學(xué)習(xí)的定義2.1機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)是人工智能中研究怎樣使用計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類學(xué)習(xí)活動(dòng)的科學(xué),其理論和方法已被廣泛應(yīng)用于解決工程應(yīng)用和科學(xué)領(lǐng)域的復(fù)雜問(wèn)題。機(jī)器學(xué)習(xí)的研究主要分為兩個(gè)方向:第一個(gè)是傳統(tǒng)機(jī)器學(xué)習(xí)的研究,第二個(gè)是大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)的研究。2.1.3機(jī)器學(xué)習(xí)的研究?jī)?nèi)容2.1機(jī)器學(xué)習(xí)概述1.傳統(tǒng)機(jī)器學(xué)習(xí)的研究?jī)?nèi)容傳統(tǒng)機(jī)器學(xué)習(xí)關(guān)注學(xué)習(xí)機(jī)制,涵蓋決策樹(shù)、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)與貝葉斯學(xué)習(xí),強(qiáng)調(diào)可解釋性與泛化能力。(1)決策樹(shù)通過(guò)信息增益等準(zhǔn)則分裂特征,結(jié)構(gòu)清晰、可解釋,剪枝抑制過(guò)擬合,適合中小規(guī)模與表格數(shù)據(jù)。(2)ID3引入信息論,偏向多值屬性;C4.5改進(jìn)為信息增益率并支持連續(xù)屬性,但需遍歷閾值,內(nèi)存占用大。(3)1984年提出剪枝思想顯著提升泛化;Chi-Square依據(jù)屬性與類別關(guān)聯(lián)統(tǒng)計(jì)量;AS-SISTANT允許類別取值交集。(4)隨機(jī)森林集成多棵樹(shù),袋外估計(jì)評(píng)估誤差,抗過(guò)擬合、魯棒性強(qiáng),對(duì)高維與缺失數(shù)據(jù)友好,缺點(diǎn)是可解釋性弱。(5)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANN)具非線性表達(dá)與自適應(yīng)能力,擅長(zhǎng)模式與語(yǔ)音識(shí)別、非結(jié)構(gòu)化數(shù)據(jù),但訓(xùn)練需大量數(shù)據(jù)與算力。2.1機(jī)器學(xué)習(xí)概述2.大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)的研究?jī)?nèi)容大數(shù)據(jù)促使機(jī)器學(xué)習(xí)以分布式并行提升效能,提取可理解知識(shí);降噪與分治降成本提效率,支撐多模態(tài)智能分析與產(chǎn)業(yè)升級(jí)。(1)分布式與并行計(jì)算支撐大規(guī)模訓(xùn)練,橫向擴(kuò)展算力,縮短訓(xùn)練時(shí)長(zhǎng),滿足海量數(shù)據(jù)實(shí)時(shí)與批處理需求。(2)分治策略與降噪機(jī)制緩解冗余與異常干擾,降低存儲(chǔ)與通信成本,穩(wěn)定模型性能,提升總體學(xué)習(xí)效率。(3)數(shù)據(jù)轉(zhuǎn)向與處理能力提升,強(qiáng)化采集、清洗、標(biāo)注、治理與存儲(chǔ),支撐端云協(xié)同與數(shù)據(jù)生命周期管理。(4)新型數(shù)據(jù)涌現(xiàn):文本與情感、圖像與視頻、圖與網(wǎng)絡(luò),推動(dòng)跨模態(tài)表示學(xué)習(xí)與檢索,拓展應(yīng)用邊界。(5)面向智能數(shù)據(jù)分析,融合挖掘與學(xué)習(xí),實(shí)現(xiàn)自動(dòng)化規(guī)劃與人機(jī)協(xié)同,賦能產(chǎn)業(yè)升級(jí)與新興業(yè)態(tài)發(fā)展。本章目錄2.1機(jī)器學(xué)習(xí)概述12.2基于學(xué)習(xí)方式的分類2.5機(jī)器學(xué)習(xí)的應(yīng)用2.4機(jī)器學(xué)習(xí)的算法2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)2.2基于學(xué)習(xí)方式的分類機(jī)器學(xué)習(xí)的核心是“使用算法解析數(shù)據(jù),從中學(xué)習(xí),然后對(duì)世界上的某件事情做出決定或預(yù)測(cè)”。機(jī)器學(xué)習(xí)有3種主要類型,即監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),機(jī)器學(xué)習(xí)的3種主要類型如圖2-3所示。圖2-3機(jī)器學(xué)習(xí)的3種主要類型2.2基于學(xué)習(xí)方式的分類監(jiān)督學(xué)習(xí),也稱有導(dǎo)師學(xué)習(xí),是指輸入數(shù)據(jù)中有導(dǎo)師信號(hào),以概率函數(shù)、代數(shù)函數(shù)或人工神經(jīng)網(wǎng)絡(luò)為基函數(shù)模型,采用迭代計(jì)算方法,學(xué)習(xí)結(jié)果為函數(shù)。監(jiān)督學(xué)習(xí)以標(biāo)注數(shù)據(jù)訓(xùn)練函數(shù),預(yù)測(cè)新樣本結(jié)果;含分類與回歸,兩者依賴特征-目標(biāo)映射與誤差最小化。(1)分類將樣本映射到離散類別,如垃圾郵件過(guò)濾,基于歷史標(biāo)注學(xué)習(xí)判別邊界,提升準(zhǔn)確率并控制誤報(bào)率。(2)回歸預(yù)測(cè)連續(xù)數(shù)值,如天氣預(yù)報(bào),利用歷史多變量特征擬合函數(shù),關(guān)注偏差-方差權(quán)衡與區(qū)間不確定性。(3)訓(xùn)練需輸入與輸出成對(duì)標(biāo)注,采用損失函數(shù)與正則化減過(guò)擬合,交叉驗(yàn)證與早停提升泛化與穩(wěn)定性。2.2.1監(jiān)督學(xué)習(xí)2.2基于學(xué)習(xí)方式的分類無(wú)監(jiān)督學(xué)習(xí)又稱無(wú)導(dǎo)師學(xué)習(xí)、歸納性學(xué)習(xí),是指輸入數(shù)據(jù)中無(wú)導(dǎo)師信號(hào),采用聚類方法,學(xué)習(xí)結(jié)果為類別。典型的無(wú)監(jiān)督學(xué)習(xí)有發(fā)現(xiàn)學(xué)習(xí)、聚類、競(jìng)爭(zhēng)學(xué)習(xí)等。無(wú)監(jiān)督學(xué)習(xí)通過(guò)循環(huán)和遞減運(yùn)算來(lái)減小誤差,達(dá)到分類的目的。在無(wú)監(jiān)督學(xué)習(xí)中,數(shù)據(jù)是無(wú)標(biāo)簽的。由于大多數(shù)真實(shí)世界的數(shù)據(jù)都沒(méi)有標(biāo)簽,因此這樣的算法就特別有用。無(wú)監(jiān)督學(xué)習(xí)分為聚類和降維。聚類用于根據(jù)屬性和行為對(duì)象進(jìn)行分組。這與分類不同,因?yàn)檫@些組不是用戶提供的。聚類的一個(gè)例子是將一個(gè)組劃分成不同的子組(如基于年齡和婚姻狀況),然后應(yīng)用到有針對(duì)性的營(yíng)銷方案中。降維通過(guò)找到共同點(diǎn)來(lái)減少數(shù)據(jù)集的變量。大多數(shù)的大數(shù)據(jù)可視化使用降維來(lái)識(shí)別趨勢(shì)和規(guī)則。2.2.2無(wú)監(jiān)督學(xué)習(xí)2.2基于學(xué)習(xí)方式的分類強(qiáng)化學(xué)習(xí)(ReinforcementLearning,簡(jiǎn)稱RL,也稱增強(qiáng)學(xué)習(xí))是一種以環(huán)境反饋——即獎(jiǎng)勵(lì)或懲罰信號(hào)——為指導(dǎo),結(jié)合統(tǒng)計(jì)學(xué)與動(dòng)態(tài)規(guī)劃方法,通過(guò)試錯(cuò)機(jī)制實(shí)現(xiàn)學(xué)習(xí)的關(guān)鍵技術(shù)。強(qiáng)化學(xué)習(xí)通過(guò)智能體與環(huán)境交互試錯(cuò),學(xué)習(xí)最優(yōu)策略以最大化累積獎(jiǎng)勵(lì);不依賴標(biāo)簽,重績(jī)效。應(yīng)用涵蓋棋類、自動(dòng)駕駛、推薦與機(jī)器人控制。強(qiáng)化學(xué)習(xí)的核心組成如下:(1)環(huán)境(Environment):環(huán)境是智能體外部世界,定義狀態(tài)、動(dòng)作與獎(jiǎng)勵(lì)。根據(jù)動(dòng)作返回新?tīng)顟B(tài)與獎(jiǎng)勵(lì),形成交互閉環(huán);可為現(xiàn)實(shí)場(chǎng)景或仿真平臺(tái)。(2)智能體(Agent):執(zhí)行決策與學(xué)習(xí)的主體,目標(biāo)最大化長(zhǎng)期回報(bào)?;跔顟B(tài)按策略選動(dòng)作,并依獎(jiǎng)勵(lì)信號(hào)持續(xù)更新策略以優(yōu)化表現(xiàn)。(3)狀態(tài)(State):刻畫(huà)環(huán)境某時(shí)刻信息,供智能體決策。形式可為數(shù)值向量或多模態(tài)數(shù)據(jù),如棋局布局、視頻幀與多傳感器讀數(shù)。(4)動(dòng)作(Action):智能體在給定狀態(tài)的決策輸出,直接作用環(huán)境演化。可為離散選擇或連續(xù)控制,如移動(dòng)方向、速度與轉(zhuǎn)向角。(5)獎(jiǎng)勵(lì)(Reward):環(huán)境對(duì)行為的反饋度量?jī)?yōu)劣。正獎(jiǎng)勵(lì)強(qiáng)化期望行為,負(fù)獎(jiǎng)勵(lì)懲罰錯(cuò)誤;獎(jiǎng)勵(lì)設(shè)計(jì)決定學(xué)習(xí)動(dòng)力與策略優(yōu)化方向。(6)策略(Policy):定義狀態(tài)到動(dòng)作的映射或概率分布,可確定性或隨機(jī)性。策略為算法核心,主導(dǎo)決策效率與整體性能。2.2.3強(qiáng)化學(xué)習(xí)2.2基于學(xué)習(xí)方式的分類1.基于學(xué)習(xí)策略的分類基于學(xué)習(xí)策略,機(jī)器學(xué)習(xí)分為模擬人腦的和直接采用數(shù)學(xué)方法的。(1)模擬人腦的機(jī)器學(xué)習(xí)符號(hào)學(xué)習(xí)基于認(rèn)知心理學(xué),以符號(hào)為輸入、推理搜索圖或狀態(tài)空間,目標(biāo)為概念與規(guī)則,含記憶、示例、演繹、類比、解釋等。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)以腦科學(xué)為基礎(chǔ),數(shù)值輸入與迭代優(yōu)化權(quán)值和拓?fù)?。?)直接采用數(shù)學(xué)方法的機(jī)器學(xué)習(xí)以統(tǒng)計(jì)機(jī)器學(xué)習(xí)為主,基于數(shù)據(jù)與目標(biāo)選擇模型與超參數(shù),輸入樣本并按策略訓(xùn)練,利用合適算法優(yōu)化,最終用訓(xùn)練后模型進(jìn)行分析與預(yù)測(cè)。統(tǒng)計(jì)機(jī)器學(xué)習(xí)有3個(gè)要素:①

模型:在未進(jìn)行訓(xùn)練前,其可能的參數(shù)有多個(gè)甚至無(wú)窮多個(gè),故可能的模型也有多個(gè)甚至無(wú)窮多個(gè),這些模型構(gòu)成的集合就是假設(shè)空間。②

策略:即從假設(shè)空間中挑選出參數(shù)最優(yōu)的模型的準(zhǔn)則。模型的分類或預(yù)測(cè)結(jié)果與實(shí)際情況的誤差(損失函數(shù))越小,模型就越好。那么策略就是誤差最小。③

算法:即從假設(shè)空間中挑選模型的方法(等同于求解最佳的模型參數(shù))。機(jī)器學(xué)習(xí)的參數(shù)求解通常都會(huì)轉(zhuǎn)化為最優(yōu)化問(wèn)題,故學(xué)習(xí)算法通常是最優(yōu)化算法,如最速梯度下降法、牛頓法以及擬牛頓法等。2.2.4機(jī)器學(xué)習(xí)的其他分類2.2基于學(xué)習(xí)方式的分類2.基于學(xué)習(xí)方法的分類基于學(xué)習(xí)方法,機(jī)器學(xué)習(xí)有歸納、演繹、類比和分析等類別。(1)歸納學(xué)習(xí)。符號(hào)歸納學(xué)習(xí):典型的有示例學(xué)習(xí)、決策樹(shù)學(xué)習(xí)。函數(shù)歸納學(xué)習(xí)(發(fā)現(xiàn)學(xué)習(xí)):典型的有神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、示例學(xué)習(xí)、發(fā)現(xiàn)學(xué)習(xí)、統(tǒng)計(jì)學(xué)習(xí)。(2)演繹學(xué)習(xí)。(3)類比學(xué)習(xí):典型的有案例(范例)學(xué)習(xí)。(4)分析學(xué)習(xí):典型的有解釋學(xué)習(xí)、宏操作學(xué)習(xí)。3.基于數(shù)據(jù)形式的分類基于數(shù)據(jù)形式,機(jī)器學(xué)習(xí)分為結(jié)構(gòu)化方法和非結(jié)構(gòu)化方法。(1)結(jié)構(gòu)化學(xué)習(xí):以結(jié)構(gòu)化數(shù)據(jù)為輸入,以數(shù)值計(jì)算或符號(hào)推演為方法。典型的有神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、統(tǒng)計(jì)學(xué)習(xí)、決策樹(shù)學(xué)習(xí)、規(guī)則學(xué)習(xí)。(2)非結(jié)構(gòu)化學(xué)習(xí):以非結(jié)構(gòu)化數(shù)據(jù)為輸入,典型的有類比學(xué)習(xí)、案例學(xué)習(xí)、解釋學(xué)習(xí)、文本挖掘、圖像挖掘、Web挖掘等2.2基于學(xué)習(xí)方式的分類4.基于學(xué)習(xí)目標(biāo)的分類基于學(xué)習(xí)目標(biāo),機(jī)器學(xué)習(xí)分為概念、規(guī)則、函數(shù)、類別、貝葉斯網(wǎng)絡(luò)等方法。(1)概念學(xué)習(xí):學(xué)習(xí)目標(biāo)和結(jié)果為概念,或者說(shuō)是獲得概念的學(xué)習(xí)。典型的有示例學(xué)習(xí)。(2)規(guī)則學(xué)習(xí):學(xué)習(xí)目標(biāo)和結(jié)果為規(guī)則,或者說(shuō)是獲得規(guī)則的學(xué)習(xí)。典型的有決策樹(shù)學(xué)習(xí)。(3)函數(shù)學(xué)習(xí):學(xué)習(xí)的目標(biāo)和結(jié)果為函數(shù),或者說(shuō)是獲得函數(shù)的學(xué)習(xí)。典型的有神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。(4)類別學(xué)習(xí):學(xué)習(xí)目標(biāo)和結(jié)果為對(duì)象類,或者說(shuō)是獲得類別的學(xué)習(xí)。典型的有聚類分析。(5)貝葉斯網(wǎng)絡(luò)學(xué)習(xí):學(xué)習(xí)目標(biāo)和結(jié)果是貝葉斯網(wǎng)絡(luò),或者說(shuō)是獲得貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)。其又可分為結(jié)構(gòu)學(xué)習(xí)和多數(shù)學(xué)習(xí)。本章目錄2.1機(jī)器學(xué)習(xí)概述12.2基于學(xué)習(xí)方式的分類2.5機(jī)器學(xué)習(xí)的應(yīng)用2.4機(jī)器學(xué)習(xí)的算法2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)機(jī)器學(xué)習(xí)的基本流程包括數(shù)據(jù)預(yù)處理、模型學(xué)習(xí)、模型評(píng)估及新樣本預(yù)測(cè)。環(huán)境提供高質(zhì)量信息以減輕學(xué)習(xí)負(fù)擔(dān);學(xué)習(xí)部分更新知識(shí)庫(kù),重表示與可推理可擴(kuò)展;執(zhí)行部分重復(fù)雜性、反饋與透明性;整體實(shí)現(xiàn)對(duì)現(xiàn)有知識(shí)的擴(kuò)展改進(jìn)。機(jī)器學(xué)習(xí)與人腦思考過(guò)程的對(duì)比如圖2-4所示。圖2-4機(jī)器學(xué)習(xí)與人腦思考過(guò)程的對(duì)比2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)信息質(zhì)量決定學(xué)習(xí)系統(tǒng)設(shè)計(jì)難度。若環(huán)境數(shù)據(jù)質(zhì)量高且與知識(shí)庫(kù)原則差異小,學(xué)習(xí)部分易于處理、對(duì)齊與吸收,快速更新知識(shí)庫(kù),提高執(zhí)行效率與穩(wěn)定性,降低訓(xùn)練與維護(hù)成本。面向雜亂無(wú)序數(shù)據(jù),系統(tǒng)需充分采集后篩除冗余細(xì)節(jié),歸納總結(jié)并抽象一般原則,再寫(xiě)入知識(shí)庫(kù)。此過(guò)程任務(wù)繁重,設(shè)計(jì)復(fù)雜度高,需可靠特征工程與穩(wěn)健算法支撐。2.3.1環(huán)境2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)知識(shí)庫(kù)是影響學(xué)習(xí)系統(tǒng)設(shè)計(jì)的第二個(gè)關(guān)鍵因素。在選擇合適的表示方式時(shí),設(shè)計(jì)者需要兼顧以下四個(gè)方面:(1)表達(dá)能力強(qiáng):選用的表示方式應(yīng)能夠充分表達(dá)復(fù)雜的知識(shí)和關(guān)系,使系統(tǒng)能夠捕捉到細(xì)微差別,滿足具體任務(wù)的需求。(2)易于推理:表示方式應(yīng)支持高效的推理過(guò)程,讓系統(tǒng)能夠快速得出結(jié)論或推導(dǎo)出新的知識(shí),以應(yīng)對(duì)環(huán)境的變化和任務(wù)的要求。(3)容易修改知識(shí)庫(kù):知識(shí)表示應(yīng)便于更新和修改,以適應(yīng)新的信息或變化的需求。這一特性使得系統(tǒng)能夠不斷演化,融入新知識(shí),保持其相關(guān)性和有效性。(4)知識(shí)表示易于擴(kuò)展:隨著應(yīng)用的擴(kuò)展,知識(shí)表示方法應(yīng)該能夠無(wú)縫整合新的知識(shí)模塊,支持系統(tǒng)的靈活擴(kuò)展,以適應(yīng)日益復(fù)雜的場(chǎng)景和需求。2.3.2知識(shí)庫(kù)2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)執(zhí)行部分是整個(gè)學(xué)習(xí)系統(tǒng)的核心,因?yàn)樗牟僮髦苯芋w現(xiàn)了學(xué)習(xí)部分所力求改進(jìn)的效果。執(zhí)行部分負(fù)責(zé)將學(xué)習(xí)到的知識(shí)應(yīng)用于實(shí)際任務(wù),從而實(shí)現(xiàn)目標(biāo)和解決問(wèn)題。在設(shè)計(jì)學(xué)習(xí)系統(tǒng)時(shí),需要關(guān)注與執(zhí)行部分相關(guān)的三個(gè)關(guān)鍵問(wèn)題:復(fù)雜性、反饋和透明性。(1)復(fù)雜性:執(zhí)行部分需在策略復(fù)雜度與可操作性間權(quán)衡。過(guò)復(fù)雜影響實(shí)時(shí)性與效率;設(shè)計(jì)應(yīng)支持復(fù)雜操作又保持簡(jiǎn)潔,便于實(shí)施與維護(hù)。(2)反饋:建立強(qiáng)反饋機(jī)制,評(píng)估執(zhí)行效果,及時(shí)準(zhǔn)確回傳數(shù)據(jù),助策略調(diào)整與知識(shí)庫(kù)優(yōu)化,提升學(xué)習(xí)能力與對(duì)新情境適應(yīng)性。(3)透明性:提升執(zhí)行過(guò)程可解釋與可理解性,尤其在敏感任務(wù)中。透明化增強(qiáng)信任,便于用戶理解決策依據(jù)并參與系統(tǒng)優(yōu)化2.3.3執(zhí)行部分2.4機(jī)器學(xué)習(xí)的算法學(xué)習(xí)是一項(xiàng)復(fù)雜的智能活動(dòng),其中學(xué)習(xí)過(guò)程與推理過(guò)程密切相關(guān)。學(xué)習(xí)中使用的推理越多,系統(tǒng)的能力就越強(qiáng)。要全面理解大多數(shù)機(jī)器學(xué)習(xí)算法,基本掌握一些關(guān)鍵的數(shù)學(xué)概念是非常重要的,這些概念包括:(1)線性代數(shù)線性代數(shù)是機(jī)器學(xué)習(xí)的重要基礎(chǔ),涉及的概念包括:矩陣運(yùn)算:用于描述和操作數(shù)據(jù)集的基本形式。特征值與特征向量:在降維和數(shù)據(jù)分析中起著關(guān)鍵作用。向量空間:為理解數(shù)據(jù)之間的關(guān)系提供結(jié)構(gòu)。范數(shù):用于測(cè)量向量的長(zhǎng)度或大小,是優(yōu)化算法中的一個(gè)重要工具。2.4機(jī)器學(xué)習(xí)的算法(2)微積分微積分提供了處理變化和優(yōu)化的工具,主要概念包括:偏導(dǎo)數(shù):用于描述多變量函數(shù)的變化率,特別是在優(yōu)化目標(biāo)函數(shù)時(shí)。向量值函數(shù):將多個(gè)輸入映射到多個(gè)輸出,廣泛應(yīng)用于深度學(xué)習(xí)和多變量?jī)?yōu)化中。方向梯度:描述函數(shù)在某個(gè)方向上的變化率,對(duì)梯度下降算法等優(yōu)化方法至關(guān)重要。(3)概率論與統(tǒng)計(jì)學(xué)這兩者為處理不確定性和數(shù)據(jù)分析提供了理論基礎(chǔ),包括:貝葉斯定理:用于更新概率信息和進(jìn)行推斷,廣泛應(yīng)用于分類和預(yù)測(cè)模型中。組合學(xué):用于處理離散結(jié)構(gòu)和確定可能的組合,幫助理解算法的復(fù)雜性。抽樣方法:用于從總數(shù)據(jù)集中提取樣本,支持推斷與模型評(píng)估。掌握這些數(shù)學(xué)概念將為更深入的機(jī)器學(xué)習(xí)研究和應(yīng)用奠定堅(jiān)實(shí)的基礎(chǔ)。2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)信息質(zhì)量決定學(xué)習(xí)系統(tǒng)設(shè)計(jì)難度。若環(huán)境數(shù)據(jù)質(zhì)量高且與知識(shí)庫(kù)原則差異小,學(xué)習(xí)部分易于處理、對(duì)齊與吸收,快速更新知識(shí)庫(kù),提高執(zhí)行效率與穩(wěn)定性,降低訓(xùn)練與維護(hù)成本。面向雜亂無(wú)序數(shù)據(jù),系統(tǒng)需充分采集后篩除冗余細(xì)節(jié),歸納總結(jié)并抽象一般原則,再寫(xiě)入知識(shí)庫(kù)。此過(guò)程任務(wù)繁重,設(shè)計(jì)復(fù)雜度高,需可靠特征工程與穩(wěn)健算法支撐。2.3.1環(huán)境2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)知識(shí)庫(kù)是影響學(xué)習(xí)系統(tǒng)設(shè)計(jì)的第二個(gè)關(guān)鍵因素。在選擇合適的表示方式時(shí),設(shè)計(jì)者需要兼顧以下四個(gè)方面:(1)表達(dá)能力強(qiáng):選用的表示方式應(yīng)能夠充分表達(dá)復(fù)雜的知識(shí)和關(guān)系,使系統(tǒng)能夠捕捉到細(xì)微差別,滿足具體任務(wù)的需求。(2)易于推理:表示方式應(yīng)支持高效的推理過(guò)程,讓系統(tǒng)能夠快速得出結(jié)論或推導(dǎo)出新的知識(shí),以應(yīng)對(duì)環(huán)境的變化和任務(wù)的要求。(3)容易修改知識(shí)庫(kù):知識(shí)表示應(yīng)便于更新和修改,以適應(yīng)新的信息或變化的需求。這一特性使得系統(tǒng)能夠不斷演化,融入新知識(shí),保持其相關(guān)性和有效性。(4)知識(shí)表示易于擴(kuò)展:隨著應(yīng)用的擴(kuò)展,知識(shí)表示方法應(yīng)該能夠無(wú)縫整合新的知識(shí)模塊,支持系統(tǒng)的靈活擴(kuò)展,以適應(yīng)日益復(fù)雜的場(chǎng)景和需求。2.3.2知識(shí)庫(kù)2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)執(zhí)行部分是整個(gè)學(xué)習(xí)系統(tǒng)的核心,因?yàn)樗牟僮髦苯芋w現(xiàn)了學(xué)習(xí)部分所力求改進(jìn)的效果。執(zhí)行部分負(fù)責(zé)將學(xué)習(xí)到的知識(shí)應(yīng)用于實(shí)際任務(wù),從而實(shí)現(xiàn)目標(biāo)和解決問(wèn)題。在設(shè)計(jì)學(xué)習(xí)系統(tǒng)時(shí),需要關(guān)注與執(zhí)行部分相關(guān)的三個(gè)關(guān)鍵問(wèn)題:復(fù)雜性、反饋和透明性。(1)復(fù)雜性:執(zhí)行部分需在策略復(fù)雜度與可操作性間權(quán)衡。過(guò)復(fù)雜影響實(shí)時(shí)性與效率;設(shè)計(jì)應(yīng)支持復(fù)雜操作又保持簡(jiǎn)潔,便于實(shí)施與維護(hù)。(2)反饋:建立強(qiáng)反饋機(jī)制,評(píng)估執(zhí)行效果,及時(shí)準(zhǔn)確回傳數(shù)據(jù),助策略調(diào)整與知識(shí)庫(kù)優(yōu)化,提升學(xué)習(xí)能力與對(duì)新情境適應(yīng)性。(3)透明性:提升執(zhí)行過(guò)程可解釋與可理解性,尤其在敏感任務(wù)中。透明化增強(qiáng)信任,便于用戶理解決策依據(jù)并參與系統(tǒng)優(yōu)化。2.3.3執(zhí)行部分本章目錄2.1機(jī)器學(xué)習(xí)概述12.2基于學(xué)習(xí)方式的分類2.5機(jī)器學(xué)習(xí)的應(yīng)用2.4機(jī)器學(xué)習(xí)的算法2.3機(jī)器學(xué)習(xí)的基本結(jié)構(gòu)2.4機(jī)器學(xué)習(xí)的算法2.4.1專注于學(xué)習(xí)能力一個(gè)算法應(yīng)該具有以下5個(gè)重要特征:(1)有窮性:算法必須能夠在有限的步驟后終止。這意味著算法的執(zhí)行是可控的,不會(huì)進(jìn)入無(wú)盡循環(huán),能夠保證在一定時(shí)間內(nèi)完成計(jì)算任務(wù)。(2)確切性:算法的每一個(gè)步驟都必須清晰且準(zhǔn)確地定義,以避免產(chǎn)生歧義。這種明確性確保了在執(zhí)行過(guò)程中沒(méi)有不確定性,使得每一步都容易理解和實(shí)現(xiàn)。(3)輸入項(xiàng):算法可以接受零個(gè)或多個(gè)輸入,這些輸入用于描述運(yùn)算對(duì)象的初始狀態(tài)。即使沒(méi)有輸入,算法本身也應(yīng)提供所需的初始條件,以便進(jìn)行后續(xù)計(jì)算。(4)輸出項(xiàng):算法應(yīng)至少產(chǎn)生一個(gè)輸出,以反映對(duì)輸入數(shù)據(jù)處理后的結(jié)果。沒(méi)有輸出的算法通常沒(méi)有實(shí)際意義,因此輸出是評(píng)估算法有效性的重要方面。(5)可行性:算法中的每個(gè)計(jì)算步驟都應(yīng)能夠分解為基本的可執(zhí)行操作。這意味著所有步驟可以在有限時(shí)間內(nèi)完成,確保算法的有效性和實(shí)際應(yīng)用的可行性。2.4機(jī)器學(xué)習(xí)的算法算法的要素主要如下:(1)數(shù)據(jù)對(duì)象的運(yùn)算和操作:計(jì)算機(jī)可以執(zhí)行的基本操作是通過(guò)指令形式描述的。這些指令組成了計(jì)算機(jī)系統(tǒng)的指令集,定義了系統(tǒng)能夠執(zhí)行的所有操作?;镜倪\(yùn)算和操作通常可以分為以下四類:①算術(shù)運(yùn)算:包括加法、減法、乘法和除法等基本數(shù)學(xué)運(yùn)算,用于數(shù)值計(jì)算和數(shù)據(jù)處理。②邏輯運(yùn)算:包括與(AND)、或(OR)和非(NOT)運(yùn)算,這些運(yùn)算用于處理布爾邏輯,常用于條件判斷和控制流。③關(guān)系運(yùn)算:包括大于、小于、等于和不等于等比較運(yùn)算,用于評(píng)估數(shù)據(jù)之間的關(guān)系,通常用于條件語(yǔ)句和決策過(guò)程。④數(shù)據(jù)傳輸:包括輸入、輸出和賦值運(yùn)算,負(fù)責(zé)在計(jì)算機(jī)和外部環(huán)境之間傳遞數(shù)據(jù),以及在不同數(shù)據(jù)存儲(chǔ)之間轉(zhuǎn)移和分配數(shù)據(jù)。(2)算法的控制結(jié)構(gòu):算法功能受操作選擇與執(zhí)行順序共同影響??刂平Y(jié)構(gòu)統(tǒng)籌順序、分支與循環(huán),保障邏輯流達(dá)成目標(biāo)。合理設(shè)計(jì)可提升效率與可讀性,使復(fù)雜問(wèn)題求解更系統(tǒng)規(guī)范。2.4機(jī)器學(xué)習(xí)的算法2.算法的評(píng)定同一問(wèn)題可以用不同的算法來(lái)解決,而算法的質(zhì)量將直接影響程序的效率。因此,算法分析的主要目標(biāo)在于選擇合適的算法并對(duì)其進(jìn)行改進(jìn)。算法評(píng)價(jià)主要考慮時(shí)間復(fù)雜度和空間復(fù)雜度:(1)時(shí)間復(fù)雜度:度量計(jì)算工作量與效率,隨規(guī)模增大而上升,運(yùn)行時(shí)間顯著受輸入大小影響,常用漸近表示。(2)空間復(fù)雜度:度量?jī)?nèi)存占用,分析類似時(shí)間復(fù)雜度,采用漸近表示;相對(duì)更易評(píng)估內(nèi)存使用。(3)正確性:最關(guān)鍵標(biāo)準(zhǔn),要求對(duì)全部輸入產(chǎn)生預(yù)期輸出,經(jīng)數(shù)學(xué)證明或測(cè)試驗(yàn)證,決定可靠性。(4)可讀性:衡量易讀與理解。高可讀性具清晰結(jié)構(gòu)與注釋,便于他人理解,降低維護(hù)成本。(5)健壯性:即容錯(cuò)性。能妥善處理異?;虿缓侠磔斎?,避免崩潰與錯(cuò)誤結(jié)果,提升穩(wěn)定性與體驗(yàn)。2.4機(jī)器學(xué)習(xí)的算法回歸分析是一種用于建模和分析數(shù)據(jù)的預(yù)測(cè)性技術(shù)工具,旨在研究因變量(目標(biāo)變量)與自變量(預(yù)測(cè)變量)之間的關(guān)系。它通常應(yīng)用于預(yù)測(cè)分析、時(shí)間序列模型以及變量之間因果關(guān)系的發(fā)現(xiàn)?;貧w分析的曲線擬合過(guò)程如圖2-5所示。2.4.2回歸算法圖2-5回歸分析的曲線擬合過(guò)程2.4機(jī)器學(xué)習(xí)的算法例如,司機(jī)的魯莽駕駛與道路交通事故數(shù)量之間的關(guān)系可以通過(guò)回歸分析來(lái)研究,這是一種重要的數(shù)據(jù)建模和分析工具?;貧w分析主要包括七種常用技術(shù):線性回歸、邏輯回歸、多項(xiàng)式回歸、逐步回歸、嶺回歸、套索回歸和彈性網(wǎng)絡(luò)回歸。回歸分析的好處有很多,主要包括:(1)它能夠揭示自變量與因變量之間是否存在顯著關(guān)系,同時(shí)量化這種關(guān)系的強(qiáng)度。(2)它可以有效地表明多個(gè)自變量對(duì)單一因變量的影響程度,幫助理解各變量之間的相互作用。2.4機(jī)器學(xué)習(xí)的算法最著名的基于實(shí)例的算法是k-最近鄰(K-NearestNeighbor,KNN)算法,它是機(jī)器學(xué)習(xí)中最基礎(chǔ)和簡(jiǎn)單的算法之一,既能用于分類,也能用于回歸。KNN的工作原理如下:(1)數(shù)據(jù)存儲(chǔ):在訓(xùn)練階段,KNN算法會(huì)將所有的訓(xùn)練數(shù)據(jù)存儲(chǔ)在內(nèi)存中。這個(gè)過(guò)程本質(zhì)上是“記憶”,并不進(jìn)行復(fù)雜的學(xué)習(xí)。(2)距離度量:當(dāng)接收到一個(gè)新的數(shù)據(jù)點(diǎn)時(shí),KNN算法會(huì)計(jì)算該數(shù)據(jù)點(diǎn)與所有訓(xùn)練數(shù)據(jù)點(diǎn)之間的距離。常用的距離度量方法包括歐幾里得距離、曼哈頓距離和閔可夫斯基距離。選擇不同的距離度量會(huì)影響分類結(jié)果。(3)查找最近鄰:算法會(huì)根據(jù)計(jì)算出的距離,選擇距離新數(shù)據(jù)點(diǎn)最近的k個(gè)訓(xùn)練樣本?!発”的選擇通常是一個(gè)超參數(shù),可以通過(guò)交叉驗(yàn)證等方法進(jìn)行調(diào)優(yōu)。(4)分類或回歸:在分類任務(wù)中,KNN算法會(huì)對(duì)這k個(gè)鄰居進(jìn)行投票,選擇出現(xiàn)頻率最高的類別作為新數(shù)據(jù)點(diǎn)的預(yù)測(cè)類別;在回歸任務(wù)中,則會(huì)求取這k個(gè)鄰居的平均值作為預(yù)測(cè)結(jié)果。KNN算法的一個(gè)顯著優(yōu)點(diǎn)是其簡(jiǎn)單性和易于解釋性,適合于處理小型到中型數(shù)據(jù)集。對(duì)于不均勻分布的特征向量,KNN也能有效地進(jìn)行分類。它能夠自適應(yīng)數(shù)據(jù)的變化,處理具有復(fù)雜邊界的多類分類問(wèn)題。2.4.3基于實(shí)例的算法2.4機(jī)器學(xué)習(xí)的算法決策樹(shù)以樹(shù)狀組織“弱”學(xué)習(xí)器,將輸入空間劃分為區(qū)域,葉節(jié)點(diǎn)對(duì)應(yīng)類別。自根遞歸分割樣本至純,沿根至葉路徑即分類規(guī)則。結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練與預(yù)測(cè)高效。1.工作原理決策樹(shù)的工作原理可以概括為以下幾個(gè)步驟:(1)模型構(gòu)建:自根遞歸分裂特征節(jié)點(diǎn),按分支劃分樣本,直至子集同類成葉。(2)特征選擇:用信息增益、增益比、基尼評(píng)估區(qū)分力,選最佳特征分裂。(3)遞歸分裂:每層擇優(yōu)分裂并生成子節(jié)點(diǎn),至達(dá)深度/樣本/增益等停止條件。(4)預(yù)測(cè)過(guò)程:自根按特征路徑下行,至葉節(jié)點(diǎn),輸出對(duì)應(yīng)類標(biāo)簽或回歸值。2.4.4決策樹(shù)算法2.4機(jī)器學(xué)習(xí)的算法2.應(yīng)用場(chǎng)景決策樹(shù)被廣泛應(yīng)用于各個(gè)領(lǐng)域,包括:(1)金融領(lǐng)域:信用評(píng)分、風(fēng)險(xiǎn)評(píng)估等。(2)醫(yī)療領(lǐng)域:疾病診斷、治療方案推薦等。(3)市場(chǎng)營(yíng)銷:客戶細(xì)分、產(chǎn)品推薦等。(4)計(jì)算機(jī)視覺(jué):圖像識(shí)別與處理等。決策樹(shù)算法通過(guò)其簡(jiǎn)單有效的結(jié)構(gòu)和直觀的可解釋性,使得在多種實(shí)際應(yīng)用中展現(xiàn)了良好的表現(xiàn)。通過(guò)結(jié)合集成方法(如隨機(jī)森林和提升決策樹(shù))能顯著提高其性能,克服單一決策樹(shù)的不足。決策樹(shù)算法如圖2-6所示。圖2-6決策樹(shù)算法2.4機(jī)器學(xué)習(xí)的算法單一特征難以識(shí)別動(dòng)物,組合多特征可提升預(yù)測(cè)。隨機(jī)森林以隨機(jī)特征構(gòu)建多樹(shù)并集成,抗噪與過(guò)擬合更強(qiáng)。匯總各樹(shù)預(yù)測(cè)評(píng)估訓(xùn)練與測(cè)試誤差,衡量擬合與精度,優(yōu)勢(shì)顯著。(1)高精度分類器:隨機(jī)森林算法通過(guò)集成多個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果,通常能夠生成高精度的分類器,有效提高了分類的準(zhǔn)確性。(2)處理大量變量:該算法能夠處理大量的變量和復(fù)雜的數(shù)據(jù)集,能夠很好地應(yīng)對(duì)高維數(shù)據(jù),適用于多種實(shí)際應(yīng)用中的特征選擇。(3)平衡分類誤差:隨機(jī)森林具有自然的防過(guò)擬合能力,并且能夠在不同類別的分類資料集之間平衡誤差,從而減少模型對(duì)噪聲數(shù)據(jù)的敏感性,提升對(duì)未知數(shù)據(jù)的泛化能力。(4)內(nèi)置特征重要性評(píng)估:隨機(jī)森林可以通過(guò)計(jì)算特征的影響力,自動(dòng)評(píng)估每個(gè)特征的重要性,為后續(xù)的特征選擇或降維提供依據(jù)。隨機(jī)森林算法通過(guò)集成多個(gè)決策樹(shù)的力量,不僅提高了模型的穩(wěn)定性和準(zhǔn)確性,還有效解決了個(gè)別樹(shù)模型容易過(guò)擬合的問(wèn)題,成為了一種廣泛應(yīng)用于分類和回歸問(wèn)題的強(qiáng)大工具。2.4機(jī)器學(xué)習(xí)的算法2.4.5樸素貝葉斯算法樸素貝葉斯算法是一種基于貝葉斯定理的簡(jiǎn)單而高效的分類算法,常用于文本分析、垃圾郵件過(guò)濾和情感分析等領(lǐng)域。它由一系列算法組成,這些算法共享一個(gè)共同的原則:在分類時(shí),被分類的每個(gè)特征都與其他特征的值獨(dú)立。2.4機(jī)器學(xué)習(xí)的算法1.工作原理樸素貝葉斯算法主要基于貝葉斯定理,其公式如下:2.4機(jī)器學(xué)習(xí)的算法使用樸素貝葉斯算法時(shí),模型主要經(jīng)歷以下幾個(gè)步驟:(1)特征概率計(jì)算:首先計(jì)算每個(gè)特征在每個(gè)類別下的條件概率。這通常是通過(guò)統(tǒng)計(jì)數(shù)據(jù)集中的特征頻率或使用拉普拉斯平滑等方法來(lái)完成。(2)先驗(yàn)概率估計(jì):然后,需要計(jì)算每個(gè)類別的先驗(yàn)概率,這可以通過(guò)類別的頻率來(lái)獲取。(3)分類:在進(jìn)行分類時(shí),根據(jù)貝葉斯定理來(lái)計(jì)算待分類樣本的后驗(yàn)概率,選擇具有最高后驗(yàn)概率的類別作為預(yù)測(cè)結(jié)果。2.4機(jī)器學(xué)習(xí)的算法2.應(yīng)用實(shí)例樸素貝葉斯算法在很多實(shí)際應(yīng)用中都非常流行,例如:(1)垃圾郵件過(guò)濾:許多垃圾郵件過(guò)濾器使用樸素貝葉斯算法來(lái)分析和分類電子郵件。使用用戶輸入的類標(biāo)記數(shù)據(jù)(如“垃圾郵件”或“正常郵件”)進(jìn)行訓(xùn)練后,算法能夠?qū)π锣]件進(jìn)行適當(dāng)分類。(2)文本情感分析:在社交媒體和用戶評(píng)論中,樸素貝葉斯被廣泛用于情感分析,以判斷文本的情感傾向(如正面、負(fù)面或中立)。(3)推薦系統(tǒng):在個(gè)性化推薦中,樸素貝葉斯也可以用于分析用戶行為數(shù)據(jù),輔助建立用戶偏好模型。2.4機(jī)器學(xué)習(xí)的算法聚類算法是一類用于發(fā)現(xiàn)數(shù)據(jù)集中的元素之間的共性并將其進(jìn)行分組的無(wú)監(jiān)督學(xué)習(xí)技術(shù)。通過(guò)對(duì)數(shù)據(jù)的聚類分析,我們可以識(shí)別出自然形成的類別或群體,從而幫助理解數(shù)據(jù)結(jié)構(gòu)。聚類算法廣泛應(yīng)用于市場(chǎng)細(xì)分、社交網(wǎng)絡(luò)分析、圖像處理等多種領(lǐng)域。其中最常用的聚類算法之一是均值聚類算法。這是一種基于劃分的聚類方法,其工作過(guò)程可以描述如下:1.工作原理(1)選擇簇?cái)?shù):首先,分析人員需要預(yù)先指定簇的數(shù)量。這個(gè)參數(shù)對(duì)于最終的聚類結(jié)果有重要影響,因此通常需要通過(guò)實(shí)驗(yàn)或交叉驗(yàn)證來(lái)選擇一個(gè)合適的值。(2)初始化:隨機(jī)選擇個(gè)數(shù)據(jù)點(diǎn)作為初始簇中心(或質(zhì)心)。(3)分配步驟:對(duì)于每個(gè)數(shù)據(jù)點(diǎn),計(jì)算它與每個(gè)簇中心的距離,通常采用歐幾里得距離。將每個(gè)數(shù)據(jù)點(diǎn)分配給距離其最近的簇中心,從而完成初始分組。(4)更新步驟:根據(jù)當(dāng)前成員的數(shù)據(jù)點(diǎn)位置,重新計(jì)算每個(gè)簇的中心位置。具體來(lái)說(shuō),對(duì)于每個(gè)簇,從其成員點(diǎn)的平均值計(jì)算新的簇中心。(5)迭代:重復(fù)進(jìn)行分配步驟和更新步驟,直到簇中心位置不再發(fā)生顯著變化或者達(dá)到設(shè)定的迭代次數(shù)。這時(shí),聚類過(guò)程被視作收斂。2.4.6聚類算法

2.4機(jī)器學(xué)習(xí)的算法2.應(yīng)用場(chǎng)景k均值聚類算法具有廣泛的應(yīng)用,主要包括:市場(chǎng)細(xì)分:通過(guò)對(duì)客戶數(shù)據(jù)進(jìn)行聚類,企業(yè)可以識(shí)別出不同顧客群體,制定個(gè)性化的市場(chǎng)營(yíng)銷策略。圖像壓縮:在圖像處理中,均值可以用來(lái)識(shí)別顏色群體,從而壓縮圖像數(shù)據(jù)。社會(huì)網(wǎng)絡(luò)分析:在社交網(wǎng)絡(luò)中,通過(guò)聚類用戶行為,可以識(shí)別出特定類型的用戶群體,進(jìn)行深入的網(wǎng)絡(luò)分析。異構(gòu)數(shù)據(jù)分析:在生物信息學(xué)中,均值用于分析基因表達(dá)數(shù)據(jù),尋找相似的基因組或樣本。聚類算法,特別是均值聚類算法,提供了一種有效的方式來(lái)理解和組織復(fù)雜的數(shù)據(jù)集。2.4機(jī)器學(xué)習(xí)的算法支持向量機(jī)(SupportVectorMachine,SVM)是一種在統(tǒng)計(jì)學(xué)習(xí)理論中的強(qiáng)大算法,廣泛用于分類和回歸分析。它與傳統(tǒng)學(xué)習(xí)方法的思維方式有很大不同,主要體現(xiàn)在通過(guò)映射輸入空間到高維特征空間來(lái)簡(jiǎn)化問(wèn)題,使得原本非線性可分的問(wèn)題在高維空間中變得線性可分。2.4.7支持向量機(jī)算法2.4機(jī)器學(xué)習(xí)的算法1.工作原理支持向量機(jī)的基本思想可以概括為以下幾個(gè)步驟:(1)空間變換:通過(guò)一種非線性變換,將輸入數(shù)據(jù)從原始空間映射到一個(gè)高維特征空間。這種變換的目的是尋找一個(gè)更有效的分隔超平面。常用的映射方法包括多項(xiàng)式核、徑向基函數(shù)(RBF)核等。(2)尋找最優(yōu)超平面:在高維空間中,支持向量機(jī)通過(guò)找到一個(gè)最優(yōu)的分隔超平面來(lái)進(jìn)行分類。這個(gè)超平面最大化了不同類別樣本點(diǎn)的間隔(margin)。具體而言,支持向量機(jī)的目標(biāo)是解決以下優(yōu)化問(wèn)題:最大化邊界(margin):找到一個(gè)超平面,使得到最近的正負(fù)樣本的距離最大。確定支持向量:位于邊界附近的樣本點(diǎn)(支持向量)是確定分類決策的關(guān)鍵。超平面的方程通??梢员硎緸椋海?)分類決策:一旦劃分了樣本空間,支持向量機(jī)就可以通過(guò)超平面進(jìn)行分類。當(dāng)新的樣本數(shù)據(jù)出現(xiàn)時(shí),支持向量機(jī)判斷該樣本屬于哪個(gè)類別,依據(jù)于其到超平面的距離。(4)處理軟間隔:數(shù)據(jù)含噪或不可線性可分時(shí),SVM引入軟間隔,允許少量樣本越界。通過(guò)軟間隔優(yōu)化,提高訓(xùn)練誤差容忍度,增強(qiáng)模型泛化。2.4機(jī)器學(xué)習(xí)的算法2.應(yīng)用實(shí)例支持向量機(jī)被廣泛應(yīng)用于多個(gè)領(lǐng)域,主要包括:垃圾郵件識(shí)別:通過(guò)分析特征(如郵件內(nèi)容、發(fā)件人等),支持向量機(jī)可以高效地將郵件分類為垃圾郵件或正常郵件。人臉識(shí)別:在計(jì)算機(jī)視覺(jué)領(lǐng)域,支持向量機(jī)可以用于對(duì)人臉數(shù)據(jù)進(jìn)行分類,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論