《人工智能通識教程》課件全套 李正軍 第1-8章 緒論、機器學習 -具身智能與機器人系統(tǒng)_第1頁
《人工智能通識教程》課件全套 李正軍 第1-8章 緒論、機器學習 -具身智能與機器人系統(tǒng)_第2頁
《人工智能通識教程》課件全套 李正軍 第1-8章 緒論、機器學習 -具身智能與機器人系統(tǒng)_第3頁
《人工智能通識教程》課件全套 李正軍 第1-8章 緒論、機器學習 -具身智能與機器人系統(tǒng)_第4頁
《人工智能通識教程》課件全套 李正軍 第1-8章 緒論、機器學習 -具身智能與機器人系統(tǒng)_第5頁
已閱讀5頁,還剩659頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章緒論《人工智能通識教程》課件本章概述本章系統(tǒng)介紹人工智能的基礎與背景,涵蓋智能定義、起源及圖靈測試、發(fā)展歷程、應用領域、關鍵技術與倫理問題,幫助讀者全面把握人工智能的核心知識框架。主要講述的內容如下:(1)智能的概念及人工智能的定義與分類,明確基本內涵。(2)人工智能的起源與圖靈測試,解析機器智能的評估標準。(3)人工智能發(fā)展歷程,展示技術演進與重要變革。(4)人工智能在各行業(yè)的應用,體現(xiàn)其廣泛影響力。(5)人工智能關鍵技術分析,包括四大要素與技術架構。(6)人工智能倫理問題,強調技術進步與道德規(guī)范的關系本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史1.1人工智能概述智能是感知、記憶、思考、學習并行動的能力,存在于人、動物與集體系統(tǒng)中,如海豚用具與蟻群協(xié)作,體現(xiàn)復雜系統(tǒng)的涌現(xiàn)。人工智能以計算機模擬此能力,涵蓋弱AI(語音助手、推薦)、強AI(語言模型、醫(yī)療決策)與理論中的超AI;技術含認知計算、機器學習、深度學習,推動從理論到應用演進。1.1人工智能概述智能是人類大腦思維活動的產物,是知識與智力的綜合體現(xiàn)。它涵蓋感知、記憶、思維、學習和行為能力,支持個體適應環(huán)境、解決問題。智能不僅存在于人類,也展現(xiàn)在動物和機器中,體現(xiàn)為復雜系統(tǒng)中多種因素交互作用的結果,是自然界的重要奧秘之一。1.1.1關于智能1.1人工智能概述人類主宰地球因祖先具高級智能,但其起源未解,成哲學與腦科學長期課題,列為自然四大奧秘之一。盡管腦科學等進展加深對腦結構與功能的認識,神經(jīng)系統(tǒng)機理與腦的原理仍未明,統(tǒng)一定義智能亦困難?;诋斍皩θ四X的認知,結合智能的外在表現(xiàn),學者們從不同角度、不同層面、采用多種方法對智能展開研究,提出了多種智能定義,主要包括思維理論、知識閾值理論和進化理論等觀點。1.智能的定義1.1人工智能概述(1)思維理論思維理論認為,智能的核心是思維活動,所有智能均源于大腦的思維過程。人類的一切知識均由思維創(chuàng)造,因此,通過研究思維的規(guī)律與方法,有望揭示智能的本質。(2)知識閾值理論知識閾值理論主張:智能行為取決于知識規(guī)模與其泛化能力,系統(tǒng)因擁有可應用知識而顯智能。其將智能定義為:能在龐大搜索空間中快速找到滿意解的能力。該理論深刻影響AI發(fā)展,促成知識工程與專家系統(tǒng)興起,并奠定以知識獲取、表示與推理為核心的技術路線。(3)進化理論進化理論強調行走、感知與維持生存繁衍的適應力奠定智能基礎。智能為復雜系統(tǒng)涌現(xiàn),由整體行為與環(huán)境互動決定,可無顯式表示與推理而生。以“控制”替代“表示”,重分層結構。布魯克于1991提“無表達”、1992提“無推理”。綜合以上觀點,可以給出一個較為直觀的定義:智能是知識與智力的總和。其中,知識是所有智能行為的基礎,智力則是獲取知識并運用知識解決問題的能力。1.1人工智能概述智能的特征如下。(1)具有感知能力感知經(jīng)視、聽、觸、嗅、味獲取外界信息,是智能之基。逾80%由視覺、約10%由聽覺獲得,促使AI以機器視覺與機器聽覺為感知核心方向。(2)具有記憶與思維能力記憶存儲感知與知識,思維加工信息,進行分析、比較、推理、聯(lián)想與決策;二者為智能核心,支撐獲取與運用知識解決問題的動態(tài)過程。(3)具有學習能力人與環(huán)境互動持續(xù)學習,積累知識、適應變化;可自覺或無意識,可在教師指導或自主實踐中進行,體現(xiàn)人類智慧的重要特征。(4)具有行為能力行為以語言、表情、眼神、肢體輸出信息,回應刺激;與感知輸入相對,皆受神經(jīng)系統(tǒng)調控,構成智能系統(tǒng)信息交互與表達關鍵能力。2.智能的特征1.1人工智能概述標準化測試常見如數(shù)列題:1、3、6、10、15、21。相鄰差值遞增1,依次為2、3、4、5、6,故下一個數(shù)字為28。此類題評估識別關鍵特征的能力。經(jīng)由經(jīng)驗積累與練習,我們不斷發(fā)現(xiàn)、學習并遷移這些模式??梢栽囋囉孟旅孢@兩個數(shù)列來試試運氣:a.1,2,2,3,3,3,4,4,4,4,···b.2,3,3,5,5,5,7,7,7,7,···既然上面已經(jīng)給出了智能的一個定義,那么接下來大家可能會有以下疑問:(1)如何判定某個人或物是否有智能?(2)動物是否有智能?(3)如果動物有智能,那么如何評估它們的智能?3.動物智能1.1人工智能概述多數(shù)人能答首題。我們以問答觀測反應評估智能,但動物如何界定?寵物展現(xiàn)記憶與導航:狗識舊人、能回家;貓聞開罐聲興奮。是條件反射,抑或有意識聯(lián)結?關于動物智能,還有一則有趣的軼事:在1900年前后,德國柏林有一匹人稱“聰明的漢斯”(CleverHans)的馬,據(jù)說這匹馬精通數(shù)學,如圖1-1所示?!奥斆鞯臐h斯”表演加法與開平方驚艷眾人;無觀眾時表現(xiàn)失常。其并非懂數(shù)學,而是敏銳捕捉觀眾情緒與細微暗示,借興奮變化逼近正確答案。圖1-1聰明的漢斯(CleverHans)1.1人工智能概述“人工智能”之“人工”源自artificial,常被解作人造且?guī)зH意。但人造物并非次等:如人造花無需陽光與水,便能持久裝飾,外觀逼真,雖手感與香味遜于真花。人工智能(ArtificialIntelligence,AI)是一種利用計算機和相關技術來模擬、延伸和擴展人的智能的計算機科學的分支,目標是使用算法和數(shù)據(jù)構建能夠表現(xiàn)出人類智能的系統(tǒng),試圖以人類的智慧為模型,開發(fā)出能以與人類智能相似的方式思考、學習、解決問題的計算機程序和技術。人工智能的研究目標是通過制造智能代理來實現(xiàn)人類智慧的各種能力,如語言理解、問題解決、學習、認知和決策等。人工智能的應用廣泛,如自動駕駛汽車、語音識別、智能家居等。1.1.2人工智能的定義1.1人工智能概述從發(fā)展程度的角度上,人工智能可以分為三大類:弱人工智能、強人工智能、超人工智能,如圖1-2所示。1.1.3人工智能的分類圖1-2人工智能分類1.1人工智能概述1.弱人工智能(ArtificialNarrowIntelligence,ANI)弱人工智能聚焦單一任務,如AlphaGo只會下圍棋,能勝世界冠軍;被問及圍棋之外的問題則無從作答,顯示其智能專一而非通用。弱人工智能在多個實際應用中都得到了廣泛應用,包括:(1)數(shù)字助手:如Apple的Siri、Amazon的Alexa和Google助手,能夠執(zhí)行語音命令、回答問題,并提供個性化推薦。(2)智能推薦系統(tǒng):如Netflix和Spotify根據(jù)用戶的歷史觀看和聽歌記錄,提供個性化的內容推薦。(3)人臉識別技術:在安全和監(jiān)控系統(tǒng)中應用,通過機器學習算法輸入大量的臉部圖像,識別和驗證個人身份。這類技術也被用于社交媒體平臺以標記或識別用戶1.1人工智能概述2.強人工智能(ArtificialGeneralIntelligence,AGI)強人工智能是一種具有通用智能的系統(tǒng),能夠像人類一樣理解語言、解決問題、進行推理和做出決策。3.超人工智能(ArtificialSuperIntelligence,ASI)超人工智能是指一種超越人類智能的人工智能形式。在所有領域,包括科學創(chuàng)新、通識知識和社交技能上,超人工智能都顯示出超出人類的能力。本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史1.2人工智能的起源和圖靈測試AI源自20世紀50年代,1956達特茅斯會議定調。自符號主義轉向機器與深度學習,突破圖像與語言。圖靈測試探討判定標準。AI分弱、強與超強,已廣泛用于醫(yī)金與自動駕駛,前景深遠。1.2人工智能的起源和圖靈測試AI自20世紀50年代起步,由符號主義轉向機器與深度學習,推動圖像、語言等突破,廣泛應用并重塑社會,未來將持續(xù)引領變革。(1)1956達特茅斯會議奠基AI,早期符號主義以規(guī)則和邏輯推理模擬思維,強調可解釋性。(2)符號主義難應對不確定和復雜感知,設備在動態(tài)環(huán)境下脆弱,反應僵化受限。(3)60年代末機器學習興起,依賴數(shù)據(jù)自適應訓練,融合統(tǒng)計方法與算法優(yōu)化。(4)21世紀深度學習崛起,多層網(wǎng)絡提取復雜特征,圖像語音與語言顯著突破。(5)算力與數(shù)據(jù)激增推動普及,AI融入各業(yè),持續(xù)驅動創(chuàng)新,同時帶來機遇與挑戰(zhàn)1.2.1人工智能的起源1.2人工智能的起源和圖靈測試艾倫·圖靈(AlanTuring,1912—1954)是一位杰出的英國數(shù)學家,也是計算機科學史上的重要奠基人(圖1-3)。學習過人工智能、計算機科學和密碼學的學生對他的貢獻應有所了解。圖靈在人工智能領域的核心貢獻是他所提出的著名“圖靈測試”。該測試旨在解決一個頗具爭議的問題:“計算機是否具備智能?”。通過這一測試,他探討了計算機是否能夠模擬人類的思維過程。1.2.2圖靈測試圖1-3圖靈1.2人工智能的起源和圖靈測試埃里希·弗羅姆(ErichFromm)寫道:男女平等,但不一定表現(xiàn)都一樣。例如,不同性別的人對于顏色和花朵的了解可能不同,花在購物上的時間也不同。區(qū)分男女與智能問題又有什么關系呢?圖靈提出了兩個“模擬游戲”(imitationgames)。第一個模擬游戲如圖1-4所示。圖靈認為,可能存在不同類型的思考方式,了解并容忍這些差異是非常重要的。圖1-5給出了圖靈測試(Turingtest)的第二個版本,即第二個模擬游戲。第二個模擬游戲更貼合人工智能的研究場景。簾幕后為人或機,機扮男性且偶爾撒謊,人始終誠實。詢問者僅憑問答判定對象身份;若計算機成功欺騙,則通過圖靈測試,被視為具備智能。圖1-4第一個模擬游戲圖1-5第二個模擬游戲本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史1.3人工智能的發(fā)展史人工智能的發(fā)展歷史可以分為以下幾個階段。1.第一次繁榮期:1956-1976年圖1-6亞里士多德自古人類以機器替代腦力以增強征服自然之力。兩千多年前AI萌芽已現(xiàn)。亞里士多德在《工具論》中提出形式邏輯定律,三段論成演繹推理基石。亞里士多德(前384—前322,如圖1-6所示),柏拉圖弟子、亞歷山大大帝導師。其系統(tǒng)性著作深遠影響,涵蓋物理、形而上學、詩歌戲劇、音樂、生物、經(jīng)濟、動物、邏輯、政治、治理與倫理,與柏拉圖、蘇格拉底并稱西方哲學奠基者。20世紀50年代,計算機科學家與數(shù)學家深入研究人工智能,提出“智能是什么”“如何實現(xiàn)AI”等關鍵理論問題。70年代AI發(fā)展顯著,語言翻譯、圖形學、知識表示突破;基于規(guī)則的專家系統(tǒng)涌現(xiàn),在特定領域達近專家水平,奠定未來基礎。2.第一次低谷期:1976-1982年由于機器翻譯等項目的失敗以及一些學術報告的負面影響,人工智能的經(jīng)費普遍減少。在這一階段,人工智能研究遭受了嚴重打擊,質疑與批評不斷增加。這種情況的主要原因包括運算能力不足、計算復雜度較高以及實現(xiàn)常識與推理的難度較大等。1973年《萊特希爾報告》批評符號主義AI“未達承諾影響”,宣告首個“寒冬”到來。同年BBC以“通用機器人是海市蜃樓嗎?”辯論引發(fā)社會擔憂,行業(yè)面臨挑戰(zhàn)與反思契機。1.3人工智能的發(fā)展史3.第二次繁榮期:1982-1987年80年代算力提升促AI發(fā)展,神經(jīng)網(wǎng)絡展現(xiàn)更強學習,推動機器人控制與圖像識別應用擴展。領域受關注度飆升,硬件進步加速研發(fā),計算機視覺、語音識別、機器翻譯等取得顯著進展。4.第二次低谷期:1987-1997年1987年LISP機市場崩潰,技術受挫;抽象推理失寵,符號模型受批評。盡管80年代神經(jīng)網(wǎng)絡有進展,但應用有限,AI再陷低谷。1965年德雷福斯以蘭德報告《煉金術與人工智能》批判AI;1988年應邀講授AI與海德格爾現(xiàn)象學,促使研究者轉向新路徑。5.第三次繁榮期:1997年到現(xiàn)在90年代起,互聯(lián)網(wǎng)普及與硬件提升促AI進展,語音識別、圖像分析、自然語言處理突破;算法發(fā)展推動深度學習成核心方向。AI不再限專業(yè)領域,大學與企業(yè)積極加入促應用擴散。入21世紀,算力與大數(shù)據(jù)興起,AI重煥活力并多域突破。本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史1.4人工智能的應用領域人工智能可以被應用于各種領域,如自動駕駛汽車、語音助手、智能機器人、醫(yī)療診斷、金融分析等。人工智能的發(fā)展能夠改變人們的生活和工作方式,帶來了巨大的社會影響。1.智能安防人臉識別、物體檢測、行為分析協(xié)同應用。即時識別人員、監(jiān)測異常物體、預警風險,強化訪問控制與監(jiān)控,全面提升社會治安與建筑安全。2.智能金融智能投顧提供投資建議;風險評估判定信用;智能化信貸審批提速降人力;智能客服實時解答,提高效率與滿意度,推進金融服務智能化。3.智能家居物聯(lián)網(wǎng)聯(lián)動設備,遠程控安防、溫度、照明。智能門鎖手機管理,攝像頭實時視頻,提升家庭安全與便捷,帶來更舒適高效的生活體驗。1.4人工智能的應用領域4.智能醫(yī)療和健康管理AI助力影像診斷早篩,提高精度;可穿戴監(jiān)測生理數(shù)據(jù),支持個性化方案與持續(xù)管理,優(yōu)化治療效果并提升患者健康管理水平。5.智慧教育在線平臺與智能家教個性化內容,按進度自適應教學;教育機器人互動助學,提升興趣與評估能力,促進因材施教與學習效果提升。6.智能制造AI賦能智能工廠與機器人,聯(lián)通生產、物流、消費,動態(tài)優(yōu)化流程,提效降本,快速響應需求,推動工業(yè)4.0走向全面智能化。7.智能零售無人店以傳感器與自動支付實現(xiàn)無人值守;AI優(yōu)化庫存與供應鏈;客流統(tǒng)計分析行為,助力精準營銷與運營決策,重塑購物體驗。8.智能交通與自動駕駛智能交通整合通信與控制,實時優(yōu)化信號提升通行效率;自動駕駛與生態(tài)導航降擁堵與事故,降低能耗,提高安全,支撐城市可持續(xù)。本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史1.5人工智能相關技術人工智能技術以數(shù)據(jù)、算力、算法和場景為核心要素,支撐其快速發(fā)展。關鍵技術主要包括:(1)機器學習:通過數(shù)據(jù)訓練模型,應用于金融、醫(yī)療等領域。(2)深度學習:基于神經(jīng)網(wǎng)絡,擅長圖像、語音識別。(3)計算機視覺:處理圖像與視頻,推動自動駕駛等應用。(4)自然語言處理:實現(xiàn)人機交互,如翻譯與輿情分析。(5)語音識別:將語音轉為文本,用于智能家居與車載系統(tǒng)。(6)生成式AI:創(chuàng)造新內容,如文本、圖像生成。這些技術共同推動AI的廣泛應用與創(chuàng)新。1.5人工智能相關技術人工智能四要素包括:數(shù)據(jù)、算力、算法、場景。隨著AI大模型規(guī)模的不斷擴大,對計算資源的需求也在增加。高性能的硬件設備、海量場景數(shù)據(jù)、強大的算力基礎和升級迭代的算法模型成為支持AI大模型發(fā)展的關鍵。數(shù)據(jù)(Data)是AI訓練與優(yōu)化的基礎。結構化、非結構化與實時數(shù)據(jù)同源匯入;大規(guī)模高質量數(shù)據(jù)構筑護城河,支撐關鍵算力與應用成效。算力(ComputingPower)為AI提供計算支撐。深度學習需高并行矩陣運算,GPU與專用AI芯片加速訓練與推理,顯著提升效率與速度。算法(Algorithm)是智能決策與預測之本。機器學習、深度學習、強化學習等從數(shù)據(jù)中學習,驅動語音、圖像、NLP突破,支撐更高級AI能力。數(shù)據(jù)、算力、算法作為輸入,只有在實際的場景(Scene)中進行輸出,才能體現(xiàn)實際價值。1.5.1人工智能四要素1.5人工智能相關技術

人工智能的技術架構按照產業(yè)生態(tài)通??梢詣澐譃榛A層、技術層、應用層三大板塊,如圖1-6所示。1.5.2人工智能技術架構圖1-6人工智能技術架構1.5人工智能相關技術

基礎層提供大規(guī)模數(shù)據(jù)存儲處理與高性能算力、通信基礎設施;技術層以AI算法處理分析數(shù)據(jù)、提取信息知識;應用層將模型落地場景,實現(xiàn)智能決策與優(yōu)化。

三層框架相互交織、功能重疊互動;實踐中需按需求定制與整合,形成完整可落地的人工智能解決方案。1.5人工智能相關技術機器學習(MachineLearning,ML)是一門多領域交叉學科,綜合了概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多門學科。專門研究如何通過計算機模擬或實現(xiàn)人類的學習行為,從而獲取新的知識或技能并不斷改善自身的性能。作為人工智能的核心,機器學習是賦予計算機智能的根本途徑。在機器學習領域,數(shù)據(jù)、算法和模型是三個至關重要的要素。1.機器學習1.5人工智能相關技術(1)數(shù)據(jù)機器學習的核心目標是讓計算機在沒有明確指令的情況下,基于輸入數(shù)據(jù)進行預測輸出。數(shù)據(jù)可分為結構化數(shù)據(jù)(如表格數(shù)據(jù))和非結構化數(shù)據(jù)(如圖像、文本、音頻等)。在機器學習過程中,數(shù)據(jù)用于訓練模型、評估模型性能,以及支持預測和決策。與數(shù)據(jù)密切相關的重要概念:數(shù)據(jù)集(dataset):用來訓練機器學習模型的一組數(shù)據(jù)。開發(fā)者通常根據(jù)具體任務選擇或設計數(shù)據(jù)集,常見的數(shù)據(jù)集類型包括數(shù)值型、統(tǒng)計型、文本型和圖像型數(shù)據(jù)集。不同數(shù)據(jù)集在數(shù)據(jù)類型、規(guī)模和復雜度上存在顯著差異。樣本(sample):模型訓練和學習過程中使用的基本數(shù)據(jù)單位,用以描述某個具體對象。數(shù)據(jù)集中的每條數(shù)據(jù)即為一個樣本。特征(feature):每個樣本包含的一組屬性信息,用以描述該樣本的各種特性。例如,一個人的樣本可能包含姓名、性別、年齡、身高、體重等。在機器學習中,特征值和特征向量用于表示和操作數(shù)據(jù),是訓練模型的基礎。標簽(label):也稱為標記,表示樣本對應的目標值或期望輸出。為數(shù)據(jù)添加標簽的過程稱為數(shù)據(jù)標注,它為監(jiān)督學習提供了學習目標和方向。機器學習的第一步是準備和處理輸入數(shù)據(jù),這也奠定了后續(xù)工作的基礎。1.5人工智能相關技術(2)算法機器學習是賦予機器“學習能力”的技術,而算法則是實現(xiàn)這種學習的具體方法。不同算法對應不同的數(shù)學公式,將輸入數(shù)據(jù)帶入算法中,即可得到相應的輸出結果。算法是推動人工智能發(fā)展的關鍵。算法工程師的主要職責包括:使用數(shù)據(jù)分析技術和建模工具理解和挖掘數(shù)據(jù)特性。設計和開發(fā)創(chuàng)新算法,解決具體問題。編寫代碼實現(xiàn)算法功能。優(yōu)化算法性能,提升其預測準確率和運算效率。(3)模型模型是算法與數(shù)據(jù)結合后的產物。將輸入數(shù)據(jù)傳入模型后,模型會基于所用算法進行處理,生成預測結果。對于監(jiān)督學習,輸入數(shù)據(jù)配有期望輸出的標簽,模型通過比較預測值與標簽不斷調整參數(shù),優(yōu)化算法。1.5人工智能相關技術總之,數(shù)據(jù)提供基礎,算法賦予方法,模型實現(xiàn)預測,三者相輔相成,共同推動機器學習技術的發(fā)展。機器學習的主要算法包括有監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習和強化學習等。機器學習的分類如圖1-7所示。圖1-7機器學習的分類1.5人工智能相關技術(1)監(jiān)督學習訓練監(jiān)督學習(supervisedlearning)模型時,需要為模型提供帶有標簽的訓練數(shù)據(jù)。模型在學習時同時獲得輸入與理想輸出(標簽)。標簽起“監(jiān)督”作用,模型比較預測與標簽差異,反復調整參數(shù),逐步提升預測準確度與泛化表現(xiàn)。監(jiān)督學習依賴標注數(shù)據(jù)訓練,如圖像標注動物類別。數(shù)據(jù)充足且高質時,可精準分類或預測,如以癥狀為輸入、疾病為標簽的診斷。監(jiān)督學習主要應用于以下兩類任務:分類(classification)任務:預測輸入數(shù)據(jù)所屬的類別,輸出結果為離散的類別標簽。例如,判斷明天的天氣是晴天、陰天、雨天還是雪天。

若僅有兩個類別,該任務稱為二分類問題,比如判定圖片中動物是貓還是狗?;貧w(regression)任務:預測輸出為連續(xù)數(shù)值的任務。例如,預測明天的氣溫變化。1.5人工智能相關技術(2)無監(jiān)督學習與監(jiān)督學習不同,無監(jiān)督學習不依賴于帶標簽的數(shù)據(jù),而是基于輸入數(shù)據(jù)的內在結構和特征,嘗試將相似的數(shù)據(jù)點歸為一類。這個過程通常被稱為聚類(clustering)。無監(jiān)督學習無需嚴格標注,靈活且門檻低,適用更廣。電商可基于購物與搜索歷史聚類用戶,劃分群體并推薦相似商品,典型用于推薦系統(tǒng)。除聚類外,無監(jiān)督學習還適用于以下兩類任務:異常檢測(AnomalyDetection):識別數(shù)據(jù)中的異常點或異常行為,從本質上也是一種分類方法,用于發(fā)現(xiàn)與大部分數(shù)據(jù)顯著不同的樣本。密度分析(DensityEstimation):也稱為概率密度估計,通過對訓練樣本的分布進行估計,推斷樣本空間的概率密度。這是生成模型等技術的基礎之一。1.5人工智能相關技術(3)半監(jiān)督學習監(jiān)督與無監(jiān)督各有限:監(jiān)督效果佳但高質標注昂貴且耗時,規(guī)模越大越明顯;無監(jiān)督不依賴標注但適用面受限、難解諸多任務?;诖?,半監(jiān)督融合二者優(yōu)勢,提高學習效率與應用成效。半監(jiān)督學習的工作原理如圖1-8所示。圖1-8半監(jiān)督學習的工作原理1.5人工智能相關技術(4)強化學習概括而言,強化學習是一種基于反復試驗的學習方法,包含以下核心概念:代理人(agent):指試圖學習和決策的主體(可類比游戲中的玩家角色)。環(huán)境(environment):代理人所處的外部環(huán)境(類似游戲中的虛擬世界)。狀態(tài)(state):代理人從環(huán)境中感知到的自身信息,如游戲中角色的經(jīng)驗值、體力值等。行動(actions):代理人基于當前狀態(tài)在環(huán)境中執(zhí)行的各種操作,例如游戲角色的行走、跳躍或使用道具。獎勵(reward):對代理人行動結果的反饋,正向獎勵表示成功(如角色升級),負向獎勵表示失敗。策略(strategy):代理人根據(jù)當前狀態(tài)制定的行動方案,目標是在未來一段時間內最大化累計正向獎勵,最小化負向獎勵。價值函數(shù)(valuefunction):用于評估某一狀態(tài)或動作對代理人未來收益的函數(shù),衡量其“價值”。1.5人工智能相關技術在強化學習中,代理人作為智能體,根據(jù)環(huán)境反饋不斷調整策略,通過不斷試錯以優(yōu)化決策,從而實現(xiàn)最佳行為選擇。強化學習的工作原理如圖1-9所示。強化學習適用于完成決策任務。圖1-9強化學習的工作原理1.5人工智能相關技術深度學習(DeepLearning,DL)是機器學習的一種分支,主要通過構建模擬人腦的神經(jīng)網(wǎng)絡,來實現(xiàn)對圖像、聲音、文本等數(shù)據(jù)的識別、理解和生成。核心在于使用多層神經(jīng)網(wǎng)絡結構,能夠通過大量數(shù)據(jù)自動學習特征和模式,從而在復雜任務中表現(xiàn)優(yōu)異。相較于傳統(tǒng)機器學習算法,深度學習具有更強的表達能力和學習能力,適合處理大規(guī)模和高維度的數(shù)據(jù)。2.深度學習1.5人工智能相關技術(1)發(fā)展歷史20世紀50—60年代提出神經(jīng)網(wǎng)絡與感知機概念;受算力與數(shù)據(jù)限制,發(fā)展曾停滯。2006年辛頓等提出深度信念網(wǎng)絡與無監(jiān)督預訓練,緩解深層訓練難題,推動深度學習復興。(2)主要算法深度學習包括多種算法,各有不同的特點和應用領域:卷積神經(jīng)網(wǎng)絡(CNN):主要用于圖像識別和計算機視覺。循環(huán)神經(jīng)網(wǎng)絡(RNN):用于序列數(shù)據(jù)處理及自然語言處理。長短時記憶網(wǎng)絡(LSTM):一種特定的RNN,可有效解決梯度消失問題,適用于序列預測。生成對抗網(wǎng)絡(GAN):用于生成真實的圖像、音頻和文本。自編碼器(AE):用于無監(jiān)督學習,可進行數(shù)據(jù)降維及特征提取。深度強化學習(DRL):結合深度學習與強化學習,學習高層次策略。1.5人工智能相關技術(3)建模過程深度學習的建模過程一般包括以下步驟:數(shù)據(jù)收集與預處理:整理和清洗數(shù)據(jù),進行特征選擇與標準化。模型選擇與設計:根據(jù)問題和數(shù)據(jù)特征選擇合適的深度學習模型,并設計其結構。模型訓練:使用訓練數(shù)據(jù)對模型進行訓練,優(yōu)化模型參數(shù),選擇合適的優(yōu)化算法和損失函數(shù)。模型評估與調優(yōu):使用測試數(shù)據(jù)評估模型性能,并進行必要的調整,以提升泛化能力和魯棒性。模型應用與部署:將訓練好的模型應用于實際問題,部署到相應系統(tǒng),實現(xiàn)自動化處理和決策。需要注意的是,不同任務可能會使這些步驟有所變化,深度學習的建模過程通常是一個迭代優(yōu)化的過程。1.5人工智能相關技術(4)應用場景深度學習的應用廣泛,主要場景包括:計算機視覺:圖像分類、目標檢測、圖像分割、人臉識別等。自然語言處理:文本分類、情感分析、機器翻譯、對話系統(tǒng)等。推薦系統(tǒng):商品推薦、廣告推薦、搜索排序等。醫(yī)療健康:疾病診斷、醫(yī)療影像分析等。金融風控:風險評估、欺詐檢測等。自動駕駛:圖像識別、車道檢測、交通標志識別等。深度學習以其強大的能力在各種領域中發(fā)揮著重要作用,不斷推動人工智能技術的發(fā)展。1.5人工智能相關技術計算機視覺(ComputerVision,CV)是人工智能領域的一項重要研究方向,致力于讓計算機能夠理解和解釋圖像或視頻中的信息。通過研究如何從視覺數(shù)據(jù)中獲取信息,并對其進行處理與分析,計算機視覺使機器能夠自動完成檢測、識別、跟蹤等任務。應用涵蓋從人臉識別、對象檢測到自動駕駛等眾多領域。圖像處理與分析:先預處理與濾波降噪提質;再提取邊緣、紋理、顏色、形狀等特征,支撐后續(xù)分析。特征提取效果直接影響分類準確性。深度學習推動:CNN在分類、檢測、分割、識別上表現(xiàn)卓越,多層網(wǎng)絡自動學習大規(guī)模數(shù)據(jù)模式,顯著提升準確性與魯棒性,優(yōu)于傳統(tǒng)方法,適應復雜場景與環(huán)境變化。其他方向與應用:涵蓋運動分析、三維重建、圖像合成;廣泛用于醫(yī)療影像、智能監(jiān)控、AR/VR等,持續(xù)驅動創(chuàng)新并強化未來技術影響力。3.計算機視覺1.5人工智能相關技術自然語言處理(NaturalLanguageProcessing,NLP)是人工智能(AI)領域的重要分支,致力于研究如何理解和處理人類語言。核心目標是構建能夠準確理解并回應人類輸入的智能系統(tǒng),從而實現(xiàn)更加自然、高效的人機交互。NLP技術融合了語言學、計算機科學和人工智能等多學科的研究成果,近年來取得了顯著的發(fā)展與突破。4.自然語言處理1.5人工智能相關技術語音識別技術是一種將人類語音轉換為文本的先進技術,廣泛應用于現(xiàn)代人機交互中。(1)工作原理語音識別的工作原理通常包括幾個關鍵步驟。首先是音頻信號的采集和預處理,包括降噪、信號放大和采樣等。接著,通過特征提取算法(如梅爾頻率倒譜系數(shù)MFCC)提取出語音特征,這些特征能夠有效描述語音的音色和音高等信息。隨后,這些特征會被輸入到機器學習模型(例如深度神經(jīng)網(wǎng)絡)中進行訓練與識別,以預測其對應的文本輸出。(2)應用領域語音識別技術在多個領域都有廣泛應用,如:智能家居:用戶可以通過語音指令控制家庭中的智能設備,例如調節(jié)燈光、溫度和安全系統(tǒng)等。車載娛樂:司機可以通過語音命令控制導航、音樂播放和電話接聽,大大提高了駕駛安全性。手機助手:智能手機中的語音助手(例如Apple的Siri、GoogleAssistant)允許用戶通過語音進行查詢、設置提醒、發(fā)送信息等操作。5.語音識別1.5人工智能相關技術(3)未來發(fā)展AI與ML進步提升語音識別準確與響應;5G增強實時性與接入效率。未來將廣泛應用醫(yī)療、教育、客服等場景,帶來便捷與樂趣??傊?,語音識別技術的持續(xù)發(fā)展和應用將改變我們與設備交互的方式,使之更加智能化和人性化。1.5人工智能相關技術生成式人工智能(ArtificialIntelligenceGeneratedContent,AIGC)是一種前沿的人工智能技術,旨在通過自動生成內容來滿足多種需求。(1)工作原理AIGC主要依賴于深度學習算法,尤其是生成對抗網(wǎng)絡(GAN)和變分自編碼器(VAE)。這些算法通過對大量數(shù)據(jù)進行訓練,理解其中的分布特征,從而生成新的內容。例如,在文本生成中,模型可以學習語言的結構和語法規(guī)則,生成連貫且符合語境的句子。在圖像生成方面,GAN可以創(chuàng)造出高逼真的圖像,從而在藝術、設計和廣告等領域找到應用。6.生成式人工智能1.5人工智能相關技術(2)應用領域AIGC的應用領域相當廣泛,包括但不限于:文本生成:自動生成新聞報道、社交媒體內容、博客文章和小說,極大地提高了內容創(chuàng)作的效率。圖像生成:可以生成藝術作品、產品設計或廣告圖像等,降低了設計成本并激發(fā)了創(chuàng)意。音頻和視頻生成:在音樂創(chuàng)作、音效設計以及視頻制作領域,AIGC能夠快速生成高質量的音頻和視頻內容。AIGC在人工智能中的定位及其與其他要素的關系如圖1-10所示。圖1-10AIGC在人工智能中的定位及其與其他要素的關系本章目錄1.1人工智能概述11.2人工智能的起源和圖靈測試1.6人工智能倫理1.5人工智能相關技術1.4人工智能的應用領域1.3人工智能的發(fā)展歷史1.6人工智能倫理人工智能倫理學作為專門研究人工智能系統(tǒng)應用倫理的學科,關注人類在設計、制造、使用人工智能系統(tǒng)過程中涉及的道德問題,涵蓋機器倫理中的機器行為及超級人工智能引發(fā)的奇點問題。具體而言,人工智能倫理涵蓋以下幾個關鍵方面:(1)隱私保護與數(shù)據(jù)安全AI依賴海量數(shù)據(jù),收集存儲易致隱私泄露與濫用。需保障個人信息與用戶隱私,推動更安全的數(shù)據(jù)管理與保護技術。(2)算法公平與透明偏見致歧視,損害弱勢群體;如人臉識別跨族群準確率差異。應提升算法公平、可解釋與透明,維護社會公正。(3)責任歸屬與法律挑戰(zhàn)醫(yī)療、司法、自動駕駛等失誤致責難界定。需明確開發(fā)者、使用者與系統(tǒng)責任,完善法律框架與治理機制。1.6人工智能倫理(4)就業(yè)影響與社會公正自動化重塑就業(yè)結構,或加劇分層與失業(yè)。需以政策調節(jié)與保障,推動AI成果的包容共享與社會公平。(5)安全風險與惡意使用技術或被用于網(wǎng)攻、信息操控、武器化,增新威脅。應構建多方協(xié)作,強化風評與防范,遏制惡意利用。2016年IEEE發(fā)布《AI設計倫理準則》白皮書,倡建通行倫理標準。2017年ISO組建AI委員會,制定算法偏見、隱私、數(shù)據(jù)與網(wǎng)絡、機器人倫理等標準。2018年牛津、劍橋、OpenAI發(fā)布《AI的惡意使用》報告,評估安全威脅并給出對策;微軟、谷歌、IBM等亦發(fā)布倫理原則。2021年11月,聯(lián)合國教科文組織通過《人工智能倫理建議書》,確立人權與尊嚴、環(huán)境可持續(xù)、多樣與包容、和平公正四大價值,明確十項原則與十一行動領域,成為全球權威指導并為國際標準與法律提供重要參考。第二章機器學習《人工智能通識教程》配套課件《人工智能通識》教研組本章概述本章介紹機器學習的基本概念、發(fā)展歷程及多樣化應用,涵蓋學習分類、系統(tǒng)結構、主要算法及實際應用,幫助讀者全面理解機器學習的理論與實踐價值。主要講述的內容如下:(1)機器學習的發(fā)展概述與定義,介紹研究內容和基礎知識。(2)機器學習的分類,包含監(jiān)督學習、無監(jiān)督學習和強化學習等方法。(3)機器學習系統(tǒng)結構,闡明環(huán)境、知識庫與執(zhí)行部分的組成。(4)主要機器學習算法,涵蓋回歸、決策樹、樸素貝葉斯、聚類、支持向量機、神經(jīng)網(wǎng)絡及集成方法。(5)機器學習的實際應用,展示其在數(shù)據(jù)分析、模式識別、生物信息學、物聯(lián)網(wǎng)、聊天機器人和無人駕駛等領域的廣泛應用。本章目錄2.1機器學習概述12.2基于學習方式的分類2.5機器學習的應用2.4機器學習的算法2.3機器學習的基本結構本章目錄2.1機器學習概述12.2基于學習方式的分類2.5機器學習的應用2.4機器學習的算法2.3機器學習的基本結構2.1機器學習概述機器學習(MachineLearning,ML)是人工智能的一個重要分支,旨在使計算機系統(tǒng)通過數(shù)據(jù)學習和改進其性能,而無需明確編程。機器學習算法通過識別數(shù)據(jù)中的模式和規(guī)律,能夠進行預測、分類和決策等任務。一些手機提供了智能語音助手,一些電子郵箱使用了垃圾郵件過濾器(軟件),等等。機器學習作為人工智能的一個分支,如圖2-1所示,機器學習所涉及的應用范圍包括語言處理、圖像識別和智能規(guī)劃等。圖2-1機器學習是人工智能的一個分支2.1機器學習概述機器學習最早可以迫溯到英國數(shù)學家貝葉斯在1763年發(fā)表的貝葉斯定理,這是關于隨機事件A和B的條件概率(或邊緣概率)的一則數(shù)學定理。貝葉斯定理是概率論中的一個重要定理,它描述了如何根據(jù)新的證據(jù)更新事件的概率。公式如下:2.1.1機器學習的發(fā)展2.1機器學習概述應用場景:醫(yī)學診斷:根據(jù)測試結果更新疾病的可能性。機器學習:在分類算法中,通過先前的數(shù)據(jù)更新模型。決策分析:在不確定的環(huán)境中根據(jù)新信息調整決策。貝葉斯定理提供了一種系統(tǒng)的方法來整合新證據(jù)與先驗知識,從而得出更準確的概率評估。2.1機器學習概述從20世紀50年代研究機器學習以來,不同時期的研究途徑和目標并不相同,大體上可以劃分為4個階段。第1階段(20世紀50年代中半至60年代中半):熱烈時期。本階段研究“有無知識的學習”,聚焦執(zhí)行能力。通過改變環(huán)境與性能參數(shù)檢驗反饋,系統(tǒng)在程序作用下自組織調整,最終擇優(yōu)環(huán)境生存。代表性成果為塞繆爾的下棋程序。第2階段(20世紀60年代中半至70年代中半):冷靜時期。本階段聚焦植入領域知識,模擬人類學習,以圖與邏輯結構表征系統(tǒng)。因學習長期性,轉向整合專家知識以獲深層認知,并取得成效;代表為海耶斯與羅斯的結構學習方法。第3階段(20世紀70年代中半至80年代中半):復興時期。本階段由單概念擴展至多概念學習,策略與應用并進;專家系統(tǒng)的知識獲取需求推動ML發(fā)展,示例歸納與自動知識獲取成主流。1980研討會奠基,1984專著與期刊創(chuàng)刊。代表作有莫斯托、萊納特、蘭利之作。第4階段(自20世紀80年代中半):新的邊緣學科階段。2.1機器學習概述機器學習的這個新階段具有如下特點:(1)機器學習成為新的邊緣學科,它綜合應用了心理學、生物學、神經(jīng)生理學、數(shù)學、自動化和計算機科學等,形成了機器學習理論基礎。(2)融合各種學習方法,且形式多樣的集成學習系統(tǒng)研究正在興起,機器學習融合的各種學習方法如圖2-2所示。(3)機器學習與AI基礎問題的統(tǒng)一性觀點形成:將學習與求解結合、以便于學習的知識表達,催生通用智能系統(tǒng)的組塊學習。類比學習與求解結合的案例法成經(jīng)驗學習重要方向。(4)學習方法應用擴展并商品化:歸納學習的知識獲取工具廣泛用于診斷專家系統(tǒng);連接學習在聲圖文識別占優(yōu);分析學習用于設計型專家系統(tǒng);遺傳算法與強化學習在工程控制具前景;與符號系統(tǒng)耦合的神經(jīng)網(wǎng)絡用于智能管理與機器人規(guī)劃。(5)學術活動空前活躍:除年度機器學習研討會外,尚有計算機學習理論會議、遺傳算法會議等國際會議持續(xù)推進研究。2.1機器學習概述圖2-2機器學習融合的各種學習方法2.1機器學習概述學習是人類具有的一種重要的智能行為,而機器學習多學科交叉,使用計算機作為工具,致力于真實實時的模擬人類學習方式,并將現(xiàn)有內容進行知識結構劃分來有效提高學習效率。蘭利(1996年)的定義是:“機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經(jīng)驗學習中改善具體算法的性能。”湯姆·米切爾(1997年)對信息論中的一些概念有詳細的解釋,其中定義機器學習時提到:“機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究?!卑柵炼。?004年)對機器學習的定義是:“機器學習使用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準?!?.1.2機器學習的定義2.1機器學習概述機器學習是人工智能中研究怎樣使用計算機模擬或實現(xiàn)人類學習活動的科學,其理論和方法已被廣泛應用于解決工程應用和科學領域的復雜問題。機器學習的研究主要分為兩個方向:第一個是傳統(tǒng)機器學習的研究,第二個是大數(shù)據(jù)環(huán)境下機器學習的研究。2.1.3機器學習的研究內容2.1機器學習概述1.傳統(tǒng)機器學習的研究內容傳統(tǒng)機器學習關注學習機制,涵蓋決策樹、隨機森林、神經(jīng)網(wǎng)絡與貝葉斯學習,強調可解釋性與泛化能力。(1)決策樹通過信息增益等準則分裂特征,結構清晰、可解釋,剪枝抑制過擬合,適合中小規(guī)模與表格數(shù)據(jù)。(2)ID3引入信息論,偏向多值屬性;C4.5改進為信息增益率并支持連續(xù)屬性,但需遍歷閾值,內存占用大。(3)1984年提出剪枝思想顯著提升泛化;Chi-Square依據(jù)屬性與類別關聯(lián)統(tǒng)計量;AS-SISTANT允許類別取值交集。(4)隨機森林集成多棵樹,袋外估計評估誤差,抗過擬合、魯棒性強,對高維與缺失數(shù)據(jù)友好,缺點是可解釋性弱。(5)人工神經(jīng)網(wǎng)絡(ArtificialNeuralNetworks,ANN)具非線性表達與自適應能力,擅長模式與語音識別、非結構化數(shù)據(jù),但訓練需大量數(shù)據(jù)與算力。2.1機器學習概述2.大數(shù)據(jù)環(huán)境下機器學習的研究內容大數(shù)據(jù)促使機器學習以分布式并行提升效能,提取可理解知識;降噪與分治降成本提效率,支撐多模態(tài)智能分析與產業(yè)升級。(1)分布式與并行計算支撐大規(guī)模訓練,橫向擴展算力,縮短訓練時長,滿足海量數(shù)據(jù)實時與批處理需求。(2)分治策略與降噪機制緩解冗余與異常干擾,降低存儲與通信成本,穩(wěn)定模型性能,提升總體學習效率。(3)數(shù)據(jù)轉向與處理能力提升,強化采集、清洗、標注、治理與存儲,支撐端云協(xié)同與數(shù)據(jù)生命周期管理。(4)新型數(shù)據(jù)涌現(xiàn):文本與情感、圖像與視頻、圖與網(wǎng)絡,推動跨模態(tài)表示學習與檢索,拓展應用邊界。(5)面向智能數(shù)據(jù)分析,融合挖掘與學習,實現(xiàn)自動化規(guī)劃與人機協(xié)同,賦能產業(yè)升級與新興業(yè)態(tài)發(fā)展。本章目錄2.1機器學習概述12.2基于學習方式的分類2.5機器學習的應用2.4機器學習的算法2.3機器學習的基本結構2.2基于學習方式的分類機器學習的核心是“使用算法解析數(shù)據(jù),從中學習,然后對世界上的某件事情做出決定或預測”。機器學習有3種主要類型,即監(jiān)督學習、無監(jiān)督學習和強化學習,機器學習的3種主要類型如圖2-3所示。圖2-3機器學習的3種主要類型2.2基于學習方式的分類監(jiān)督學習,也稱有導師學習,是指輸入數(shù)據(jù)中有導師信號,以概率函數(shù)、代數(shù)函數(shù)或人工神經(jīng)網(wǎng)絡為基函數(shù)模型,采用迭代計算方法,學習結果為函數(shù)。監(jiān)督學習以標注數(shù)據(jù)訓練函數(shù),預測新樣本結果;含分類與回歸,兩者依賴特征-目標映射與誤差最小化。(1)分類將樣本映射到離散類別,如垃圾郵件過濾,基于歷史標注學習判別邊界,提升準確率并控制誤報率。(2)回歸預測連續(xù)數(shù)值,如天氣預報,利用歷史多變量特征擬合函數(shù),關注偏差-方差權衡與區(qū)間不確定性。(3)訓練需輸入與輸出成對標注,采用損失函數(shù)與正則化減過擬合,交叉驗證與早停提升泛化與穩(wěn)定性。2.2.1監(jiān)督學習2.2基于學習方式的分類無監(jiān)督學習又稱無導師學習、歸納性學習,是指輸入數(shù)據(jù)中無導師信號,采用聚類方法,學習結果為類別。典型的無監(jiān)督學習有發(fā)現(xiàn)學習、聚類、競爭學習等。無監(jiān)督學習通過循環(huán)和遞減運算來減小誤差,達到分類的目的。在無監(jiān)督學習中,數(shù)據(jù)是無標簽的。由于大多數(shù)真實世界的數(shù)據(jù)都沒有標簽,因此這樣的算法就特別有用。無監(jiān)督學習分為聚類和降維。聚類用于根據(jù)屬性和行為對象進行分組。這與分類不同,因為這些組不是用戶提供的。聚類的一個例子是將一個組劃分成不同的子組(如基于年齡和婚姻狀況),然后應用到有針對性的營銷方案中。降維通過找到共同點來減少數(shù)據(jù)集的變量。大多數(shù)的大數(shù)據(jù)可視化使用降維來識別趨勢和規(guī)則。2.2.2無監(jiān)督學習2.2基于學習方式的分類強化學習(ReinforcementLearning,簡稱RL,也稱增強學習)是一種以環(huán)境反饋——即獎勵或懲罰信號——為指導,結合統(tǒng)計學與動態(tài)規(guī)劃方法,通過試錯機制實現(xiàn)學習的關鍵技術。強化學習通過智能體與環(huán)境交互試錯,學習最優(yōu)策略以最大化累積獎勵;不依賴標簽,重績效。應用涵蓋棋類、自動駕駛、推薦與機器人控制。強化學習的核心組成如下:(1)環(huán)境(Environment):環(huán)境是智能體外部世界,定義狀態(tài)、動作與獎勵。根據(jù)動作返回新狀態(tài)與獎勵,形成交互閉環(huán);可為現(xiàn)實場景或仿真平臺。(2)智能體(Agent):執(zhí)行決策與學習的主體,目標最大化長期回報?;跔顟B(tài)按策略選動作,并依獎勵信號持續(xù)更新策略以優(yōu)化表現(xiàn)。(3)狀態(tài)(State):刻畫環(huán)境某時刻信息,供智能體決策。形式可為數(shù)值向量或多模態(tài)數(shù)據(jù),如棋局布局、視頻幀與多傳感器讀數(shù)。(4)動作(Action):智能體在給定狀態(tài)的決策輸出,直接作用環(huán)境演化??蔀殡x散選擇或連續(xù)控制,如移動方向、速度與轉向角。(5)獎勵(Reward):環(huán)境對行為的反饋度量優(yōu)劣。正獎勵強化期望行為,負獎勵懲罰錯誤;獎勵設計決定學習動力與策略優(yōu)化方向。(6)策略(Policy):定義狀態(tài)到動作的映射或概率分布,可確定性或隨機性。策略為算法核心,主導決策效率與整體性能。2.2.3強化學習2.2基于學習方式的分類1.基于學習策略的分類基于學習策略,機器學習分為模擬人腦的和直接采用數(shù)學方法的。(1)模擬人腦的機器學習符號學習基于認知心理學,以符號為輸入、推理搜索圖或狀態(tài)空間,目標為概念與規(guī)則,含記憶、示例、演繹、類比、解釋等。神經(jīng)網(wǎng)絡學習以腦科學為基礎,數(shù)值輸入與迭代優(yōu)化權值和拓撲。(2)直接采用數(shù)學方法的機器學習以統(tǒng)計機器學習為主,基于數(shù)據(jù)與目標選擇模型與超參數(shù),輸入樣本并按策略訓練,利用合適算法優(yōu)化,最終用訓練后模型進行分析與預測。統(tǒng)計機器學習有3個要素:①

模型:在未進行訓練前,其可能的參數(shù)有多個甚至無窮多個,故可能的模型也有多個甚至無窮多個,這些模型構成的集合就是假設空間。②

策略:即從假設空間中挑選出參數(shù)最優(yōu)的模型的準則。模型的分類或預測結果與實際情況的誤差(損失函數(shù))越小,模型就越好。那么策略就是誤差最小。③

算法:即從假設空間中挑選模型的方法(等同于求解最佳的模型參數(shù))。機器學習的參數(shù)求解通常都會轉化為最優(yōu)化問題,故學習算法通常是最優(yōu)化算法,如最速梯度下降法、牛頓法以及擬牛頓法等。2.2.4機器學習的其他分類2.2基于學習方式的分類2.基于學習方法的分類基于學習方法,機器學習有歸納、演繹、類比和分析等類別。(1)歸納學習。符號歸納學習:典型的有示例學習、決策樹學習。函數(shù)歸納學習(發(fā)現(xiàn)學習):典型的有神經(jīng)網(wǎng)絡學習、示例學習、發(fā)現(xiàn)學習、統(tǒng)計學習。(2)演繹學習。(3)類比學習:典型的有案例(范例)學習。(4)分析學習:典型的有解釋學習、宏操作學習。3.基于數(shù)據(jù)形式的分類基于數(shù)據(jù)形式,機器學習分為結構化方法和非結構化方法。(1)結構化學習:以結構化數(shù)據(jù)為輸入,以數(shù)值計算或符號推演為方法。典型的有神經(jīng)網(wǎng)絡學習、統(tǒng)計學習、決策樹學習、規(guī)則學習。(2)非結構化學習:以非結構化數(shù)據(jù)為輸入,典型的有類比學習、案例學習、解釋學習、文本挖掘、圖像挖掘、Web挖掘等2.2基于學習方式的分類4.基于學習目標的分類基于學習目標,機器學習分為概念、規(guī)則、函數(shù)、類別、貝葉斯網(wǎng)絡等方法。(1)概念學習:學習目標和結果為概念,或者說是獲得概念的學習。典型的有示例學習。(2)規(guī)則學習:學習目標和結果為規(guī)則,或者說是獲得規(guī)則的學習。典型的有決策樹學習。(3)函數(shù)學習:學習的目標和結果為函數(shù),或者說是獲得函數(shù)的學習。典型的有神經(jīng)網(wǎng)絡學習。(4)類別學習:學習目標和結果為對象類,或者說是獲得類別的學習。典型的有聚類分析。(5)貝葉斯網(wǎng)絡學習:學習目標和結果是貝葉斯網(wǎng)絡,或者說是獲得貝葉斯網(wǎng)絡的學習。其又可分為結構學習和多數(shù)學習。本章目錄2.1機器學習概述12.2基于學習方式的分類2.5機器學習的應用2.4機器學習的算法2.3機器學習的基本結構2.3機器學習的基本結構機器學習的基本流程包括數(shù)據(jù)預處理、模型學習、模型評估及新樣本預測。環(huán)境提供高質量信息以減輕學習負擔;學習部分更新知識庫,重表示與可推理可擴展;執(zhí)行部分重復雜性、反饋與透明性;整體實現(xiàn)對現(xiàn)有知識的擴展改進。機器學習與人腦思考過程的對比如圖2-4所示。圖2-4機器學習與人腦思考過程的對比2.3機器學習的基本結構信息質量決定學習系統(tǒng)設計難度。若環(huán)境數(shù)據(jù)質量高且與知識庫原則差異小,學習部分易于處理、對齊與吸收,快速更新知識庫,提高執(zhí)行效率與穩(wěn)定性,降低訓練與維護成本。面向雜亂無序數(shù)據(jù),系統(tǒng)需充分采集后篩除冗余細節(jié),歸納總結并抽象一般原則,再寫入知識庫。此過程任務繁重,設計復雜度高,需可靠特征工程與穩(wěn)健算法支撐。2.3.1環(huán)境2.3機器學習的基本結構知識庫是影響學習系統(tǒng)設計的第二個關鍵因素。在選擇合適的表示方式時,設計者需要兼顧以下四個方面:(1)表達能力強:選用的表示方式應能夠充分表達復雜的知識和關系,使系統(tǒng)能夠捕捉到細微差別,滿足具體任務的需求。(2)易于推理:表示方式應支持高效的推理過程,讓系統(tǒng)能夠快速得出結論或推導出新的知識,以應對環(huán)境的變化和任務的要求。(3)容易修改知識庫:知識表示應便于更新和修改,以適應新的信息或變化的需求。這一特性使得系統(tǒng)能夠不斷演化,融入新知識,保持其相關性和有效性。(4)知識表示易于擴展:隨著應用的擴展,知識表示方法應該能夠無縫整合新的知識模塊,支持系統(tǒng)的靈活擴展,以適應日益復雜的場景和需求。2.3.2知識庫2.3機器學習的基本結構執(zhí)行部分是整個學習系統(tǒng)的核心,因為它的操作直接體現(xiàn)了學習部分所力求改進的效果。執(zhí)行部分負責將學習到的知識應用于實際任務,從而實現(xiàn)目標和解決問題。在設計學習系統(tǒng)時,需要關注與執(zhí)行部分相關的三個關鍵問題:復雜性、反饋和透明性。(1)復雜性:執(zhí)行部分需在策略復雜度與可操作性間權衡。過復雜影響實時性與效率;設計應支持復雜操作又保持簡潔,便于實施與維護。(2)反饋:建立強反饋機制,評估執(zhí)行效果,及時準確回傳數(shù)據(jù),助策略調整與知識庫優(yōu)化,提升學習能力與對新情境適應性。(3)透明性:提升執(zhí)行過程可解釋與可理解性,尤其在敏感任務中。透明化增強信任,便于用戶理解決策依據(jù)并參與系統(tǒng)優(yōu)化2.3.3執(zhí)行部分2.4機器學習的算法學習是一項復雜的智能活動,其中學習過程與推理過程密切相關。學習中使用的推理越多,系統(tǒng)的能力就越強。要全面理解大多數(shù)機器學習算法,基本掌握一些關鍵的數(shù)學概念是非常重要的,這些概念包括:(1)線性代數(shù)線性代數(shù)是機器學習的重要基礎,涉及的概念包括:矩陣運算:用于描述和操作數(shù)據(jù)集的基本形式。特征值與特征向量:在降維和數(shù)據(jù)分析中起著關鍵作用。向量空間:為理解數(shù)據(jù)之間的關系提供結構。范數(shù):用于測量向量的長度或大小,是優(yōu)化算法中的一個重要工具。2.4機器學習的算法(2)微積分微積分提供了處理變化和優(yōu)化的工具,主要概念包括:偏導數(shù):用于描述多變量函數(shù)的變化率,特別是在優(yōu)化目標函數(shù)時。向量值函數(shù):將多個輸入映射到多個輸出,廣泛應用于深度學習和多變量優(yōu)化中。方向梯度:描述函數(shù)在某個方向上的變化率,對梯度下降算法等優(yōu)化方法至關重要。(3)概率論與統(tǒng)計學這兩者為處理不確定性和數(shù)據(jù)分析提供了理論基礎,包括:貝葉斯定理:用于更新概率信息和進行推斷,廣泛應用于分類和預測模型中。組合學:用于處理離散結構和確定可能的組合,幫助理解算法的復雜性。抽樣方法:用于從總數(shù)據(jù)集中提取樣本,支持推斷與模型評估。掌握這些數(shù)學概念將為更深入的機器學習研究和應用奠定堅實的基礎。2.3機器學習的基本結構信息質量決定學習系統(tǒng)設計難度。若環(huán)境數(shù)據(jù)質量高且與知識庫原則差異小,學習部分易于處理、對齊與吸收,快速更新知識庫,提高執(zhí)行效率與穩(wěn)定性,降低訓練與維護成本。面向雜亂無序數(shù)據(jù),系統(tǒng)需充分采集后篩除冗余細節(jié),歸納總結并抽象一般原則,再寫入知識庫。此過程任務繁重,設計復雜度高,需可靠特征工程與穩(wěn)健算法支撐。2.3.1環(huán)境2.3機器學習的基本結構知識庫是影響學習系統(tǒng)設計的第二個關鍵因素。在選擇合適的表示方式時,設計者需要兼顧以下四個方面:(1)表達能力強:選用的表示方式應能夠充分表達復雜的知識和關系,使系統(tǒng)能夠捕捉到細微差別,滿足具體任務的需求。(2)易于推理:表示方式應支持高效的推理過程,讓系統(tǒng)能夠快速得出結論或推導出新的知識,以應對環(huán)境的變化和任務的要求。(3)容易修改知識庫:知識表示應便于更新和修改,以適應新的信息或變化的需求。這一特性使得系統(tǒng)能夠不斷演化,融入新知識,保持其相關性和有效性。(4)知識表示易于擴展:隨著應用的擴展,知識表示方法應該能夠無縫整合新的知識模塊,支持系統(tǒng)的靈活擴展,以適應日益復雜的場景和需求。2.3.2知識庫2.3機器學習的基本結構執(zhí)行部分是整個學習系統(tǒng)的核心,因為它的操作直接體現(xiàn)了學習部分所力求改進的效果。執(zhí)行部分負責將學習到的知識應用于實際任務,從而實現(xiàn)目標和解決問題。在設計學習系統(tǒng)時,需要關注與執(zhí)行部分相關的三個關鍵問題:復雜性、反饋和透明性。(1)復雜性:執(zhí)行部分需在策略復雜度與可操作性間權衡。過復雜影響實時性與效率;設計應支持復雜操作又保持簡潔,便于實施與維護。(2)反饋:建立強反饋機制,評估執(zhí)行效果,及時準確回傳數(shù)據(jù),助策略調整與知識庫優(yōu)化,提升學習能力與對新情境適應性。(3)透明性:提升執(zhí)行過程可解釋與可理解性,尤其在敏感任務中。透明化增強信任,便于用戶理解決策依據(jù)并參與系統(tǒng)優(yōu)化。2.3.3執(zhí)行部分本章目錄2.1機器學習概述12.2基于學習方式的分類2.5機器學習的應用2.4機器學習的算法2.3機器學習的基本結構2.4機器學習的算法2.4.1專注于學習能力一個算法應該具有以下5個重要特征:(1)有窮性:算法必須能夠在有限的步驟后終止。這意味著算法的執(zhí)行是可控的,不會進入無盡循環(huán),能夠保證在一定時間內完成計算任務。(2)確切性:算法的每一個步驟都必須清晰且準確地定義,以避免產生歧義。這種明確性確保了在執(zhí)行過程中沒有不確定性,使得每一步都容易理解和實現(xiàn)。(3)輸入項:算法可以接受零個或多個輸入,這些輸入用于描述運算對象的初始狀態(tài)。即使沒有輸入,算法本身也應提供所需的初始條件,以便進行后續(xù)計算。(4)輸出項:算法應至少產生一個輸出,以反映對輸入數(shù)據(jù)處理后的結果。沒有輸出的算法通常沒有實際意義,因此輸出是評估算法有效性的重要方面。(5)可行性:算法中的每個計算步驟都應能夠分解為基本的可執(zhí)行操作。這意味著所有步驟可以在有限時間內完成,確保算法的有效性和實際應用的可行性。2.4機器學習的算法算法的要素主要如下:(1)數(shù)據(jù)對象的運算和操作:計算機可以執(zhí)行的基本操作是通過指令形式描述的。這些指令組成了計算機系統(tǒng)的指令集,定義了系統(tǒng)能夠執(zhí)行的所有操作。基本的運算和操作通??梢苑譃橐韵滤念悾孩偎阈g運算:包括加法、減法、乘法和除法等基本數(shù)學運算,用于數(shù)值計算和數(shù)據(jù)處理。②邏輯運算:包括與(AND)、或(OR)和非(NOT)運算,這些運算用于處理布爾邏輯,常用于條件判斷和控制流。③關系運算:包括大于、小于、等于和不等于等比較運算,用于評估數(shù)據(jù)之間的關系,通常用于條件語句和決策過程。④數(shù)據(jù)傳輸:包括輸入、輸出和賦值運算,負責在計算機和外部環(huán)境之間傳遞數(shù)據(jù),以及在不同數(shù)據(jù)存儲之間轉移和分配數(shù)據(jù)。(2)算法的控制結構:算法功能受操作選擇與執(zhí)行順序共同影響??刂平Y構統(tǒng)籌順序、分支與循環(huán),保障邏輯流達成目標。合理設計可提升效率與可讀性,使復雜問題求解更系統(tǒng)規(guī)范。2.4機器學習的算法2.算法的評定同一問題可以用不同的算法來解決,而算法的質量將直接影響程序的效率。因此,算法分析的主要目標在于選擇合適的算法并對其進行改進。算法評價主要考慮時間復雜度和空間復雜度:(1)時間復雜度:度量計算工作量與效率,隨規(guī)模增大而上升,運行時間顯著受輸入大小影響,常用漸近表示。(2)空間復雜度:度量內存占用,分析類似時間復雜度,采用漸近表示;相對更易評估內存使用。(3)正確性:最關鍵標準,要求對全部輸入產生預期輸出,經(jīng)數(shù)學證明或測試驗證,決定可靠性。(4)可讀性:衡量易讀與理解。高可讀性具清晰結構與注釋,便于他人理解,降低維護成本。(5)健壯性:即容錯性。能妥善處理異?;虿缓侠磔斎?,避免崩潰與錯誤結果,提升穩(wěn)定性與體驗。2.4機器學習的算法回歸分析是一種用于建模和分析數(shù)據(jù)的預測性技術工具,旨在研究因變量(目標變量)與自變量(預測變量)之間的關系。它通常應用于預測分析、時間序列模型以及變量之間因果關系的發(fā)現(xiàn)?;貧w分析的曲線擬合過程如圖2-5所示。2.4.2回歸算法圖2-5回歸分析的曲線擬合過程2.4機器學習的算法例如,司機的魯莽駕駛與道路交通事故數(shù)量之間的關系可以通過回歸分析來研究,這是一種重要的數(shù)據(jù)建模和分析工具?;貧w分析主要包括七種常用技術:線性回歸、邏輯回歸、多項式回歸、逐步回歸、嶺回歸、套索回歸和彈性網(wǎng)絡回歸?;貧w分析的好處有很多,主要包括:(1)它能夠揭示自變量與因變量之間是否存在顯著關系,同時量化這種關系的強度。(2)它可以有效地表明多個自變量對單一因變量的影響程度,幫助理解各變量之間的相互作用。2.4機器學習的算法最著名的基于實例的算法是k-最近鄰(K-NearestNeighbor,KNN)算法,它是機器學習中最基礎和簡單的算法之一,既能用于分類,也能用于回歸。KNN的工作原理如下:(1)數(shù)據(jù)存儲:在訓練階段,KNN算法會將所有的訓練數(shù)據(jù)存儲在內存中。這個過程本質上是“記憶”,并不進行復雜的學習。(2)距離度量:當接收到一個新的數(shù)據(jù)點時,KNN算法會計算該數(shù)據(jù)點與所有訓練數(shù)據(jù)點之間的距離。常用的距離度量方法包括歐幾里得距離、曼哈頓距離和閔可夫斯基距離。選擇不同的距離度量會影響分類結果。(3)查找最近鄰:算法會根據(jù)計算出的距離,選擇距離新數(shù)據(jù)點最近的k個訓練樣本?!発”的選擇通常是一個超參數(shù),可以通過交叉驗證等方法進行調優(yōu)。(4)分類或回歸:在分類任務中,KNN算法會對這k個鄰居進行投票,選擇出現(xiàn)頻率最高的類別作為新數(shù)據(jù)點的預測類別;在回歸任務中,則會求取這k個鄰居的平均值作為預測結果。KNN算法的一個顯著優(yōu)點是其簡單性和易于解釋性,適合于處理小型到中型數(shù)據(jù)集。對于不均勻分布的特征向量,KNN也能有效地進行分類。它能夠自適應數(shù)據(jù)的變化,處理具有復雜邊界的多類分類問題。2.4.3基于實例的算法2.4機器學習的算法決策樹以樹狀組織“弱”學習器,將輸入空間劃分為區(qū)域,葉節(jié)點對應類別。自根遞歸分割樣本至純,沿根至葉路徑即分類規(guī)則。結構簡單,訓練與預測高效。1.工作原理決策樹的工作原理可以概括為以下幾個步驟:(1)模型構建:自根遞歸分裂特征節(jié)點,按分支劃分樣本,直至子集同類成葉。(2)特征選擇:用信息增益、增益比、基尼評估區(qū)分力,選最佳特征分裂。(3)遞歸分裂:每層擇優(yōu)分裂并生成子節(jié)點,至達深度/樣本/增益等停止條件。(4)預測過程:自根按特征路徑下行,至葉節(jié)點,輸出對應類標簽或回歸值。2.4.4決策樹算法2.4機器學習的算法2.應用場景決策樹被廣泛應用于各個領域,包括:(1)金融領域:信用評分、風險評估等。(2)醫(yī)療領域:疾病診斷、治療方案推薦等。(3)市場營銷:客戶細分、產品推薦等。(4)計算機視覺:圖像識別與處理等。決策樹算法通過其簡單有效的結構和直觀的可解釋性,使得在多種實際應用中展現(xiàn)了良好的表現(xiàn)。通過結合集成方法(如隨機森林和提升決策樹)能顯著提高其性能,克服單一決策樹的不足。決策樹算法如圖2-6所示。圖2-6決策樹算法2.4機器學習的算法單一特征難以識別動物,組合多特征可提升預測。隨機森林以隨機特征構建多樹并集成,抗噪與過擬合更強。匯總各樹預測評估訓練與測試誤差,衡量擬合與精度,優(yōu)勢顯著。(1)高精度分類器:隨機森林算法通過集成多個決策樹的預測結果,通常能夠生成高精度的分類器,有效提高了分類的準確性。(2)處理大量變量:該算法能夠處理大量的變量和復雜的數(shù)據(jù)集,能夠很好地應對高維數(shù)據(jù),適用于多種實際應用中的特征選擇。(3)平衡分類誤差:隨機森林具有自然的防過擬合能力,并且能夠在不同類別的分類資料集之間平衡誤差,從而減少模型對噪聲數(shù)據(jù)的敏感性,提升對未知數(shù)據(jù)的泛化能力。(4)內置特征重要性評估:隨機森林可以通過計算特征的影響力,自動評估每個特征的重要性,為后續(xù)的特征選擇或降維提供依據(jù)。隨機森林算法通過集成多個決策樹的力量,不僅提高了模型的穩(wěn)定性和準確性,還有效解決了個別樹模型容易過擬合的問題,成為了一種廣泛應用于分類和回歸問題的強大工具。2.4機器學習的算法2.4.5樸素貝葉斯算法樸素貝葉斯算法是一種基于貝葉斯定理的簡單而高效的分類算法,常用于文本分析、垃圾郵件過濾和情感分析等領域。它由一系列算法組成,這些算法共享一個共同的原則:在分類時,被分類的每個特征都與其他特征的值獨立。2.4機器學習的算法1.工作原理樸素貝葉斯算法主要基于貝葉斯定理,其公式如下:2.4機器學習的算法使用樸素貝葉斯算法時,模型主要經(jīng)歷以下幾個步驟:(1)特征概率計算:首先計算每個特征在每個類別下的條件概率。這通常是通過統(tǒng)計數(shù)據(jù)集中的特征頻率或使用拉普拉斯平滑等方法來完成。(2)先驗概率估計:然后,需要計算每個類別的先驗概率,這可以通過類別的頻率來獲取。(3)分類:在進行分類時,根據(jù)貝葉斯定理來計算待分類樣本的后驗概率,選擇具有最高后驗概率的類別作為預測結果。2.4機器學習的算法2.應用實例樸素貝葉斯算法在很多實際應用中都非常流行,例如:(1)垃圾郵件過濾:許多垃圾郵件過濾器使用樸素貝葉斯算法來分析和分類電子郵件。使用用戶輸入的類標記數(shù)據(jù)(如“垃圾郵件”或“正常郵件”)進行訓練后,算法能夠對新郵件進行適當分類。(2)文本情感分析:在社交媒體和用戶評論中,樸素貝葉斯被廣泛用于情感分析,以判斷文本的情感傾向(如正面、負面或中立)。(3)推薦系統(tǒng):在個性化推薦中,樸素貝葉斯也可以用于分析用戶行為數(shù)據(jù),輔助建立用戶偏好模型。2.4機器學習的算法聚類算法是一類用于發(fā)現(xiàn)數(shù)據(jù)集中的元素之間的共性并將其進行分組的無監(jiān)督學習技術。通過對數(shù)據(jù)的聚類分析,我們可以識別出自然形成的類別或群體,從而幫助理解數(shù)據(jù)結構。聚類算法廣泛應用于市場細分、社交網(wǎng)絡分析、圖像處理等多種領域。其中最常用的聚類算法之一是均值聚類算法。這是一種基于劃分的聚類方法,其工作過程可以描述如下:1.工作原理(1)選擇簇數(shù):首先,分析人員需要預先指定簇的數(shù)量。這個參數(shù)對于最終的聚類結果有重要影響,因此通常需要通過實驗或交叉驗證來選擇一個合適的值。(2)初始化:隨機選擇個數(shù)據(jù)點作為初始簇中心(或質心)。(3)分配步驟:對于每個數(shù)據(jù)點,計算它與每個簇中心的距離,通常采用歐幾里得距離。將每個數(shù)據(jù)點分配給距離其最近的簇中心,從而完成初始分組。(4)更新步驟:根據(jù)當前成員的數(shù)據(jù)點位置,重新計算每個簇的中心位置。具體來說,對于每個簇,從其成員點的平均值計算新的簇中心。(5)迭代:重復進行分配步驟和更新步驟,直到簇中心位置不再發(fā)生顯著變化或者達到設定的迭代次數(shù)。這時,聚類過程被視作收斂。2.4.6聚類算法

2.4機器學習的算法2.應用場景k均值聚類算法具有廣泛的應用,主要包括:市場細分:通過對客戶數(shù)據(jù)進行聚類,企業(yè)可以識別出不同顧客群體,制定個性化的市場營銷策略。圖像壓縮:在圖像處理中,均值可以用來識別顏色群體,從而壓縮圖像數(shù)據(jù)。社會網(wǎng)絡分析:在社交網(wǎng)絡中,通過聚類用戶行為,可以識別出特定類型的用戶群體,進行深入的網(wǎng)絡分析。異構數(shù)據(jù)分析:在生物信息學中,均值用于分析基因表達數(shù)據(jù),尋找相似的基因組或樣本。聚類算法,特別是均值聚類算法,提供了一種有效的方式來理解和組織復雜的數(shù)據(jù)集。2.4機器學習的算法支持向量機(SupportVectorMachine,SVM)是一種在統(tǒng)計學習理論中的強大算法,廣泛用于分類和回歸分析。它與傳統(tǒng)學習方法的思維方式有很大不同,主要體現(xiàn)在通過映射輸入空間到高維特征空間來簡化問題,使得原本非線性可分的問題在高維空間中變得線性可分。2.4.7支持向量機算法2.4機器學習的算法1.工作原理支持向量機的基本思想可以概括為以下幾個步驟:(1)空間變換:通過一種非線性變換,將輸入數(shù)據(jù)從原始空間映射到一個高維特征空間。這種變換的目的是尋找一個更有效的分隔超平面。常用的映射方法包括多項式核、徑向基函數(shù)(RBF)核等。(2)尋找最優(yōu)超平面:在高維空間中,支持向量機通過找到一個最優(yōu)的分隔超平面來進行分類。這個超平面最大化了不同類別樣本點的間隔(margin)。具體而言,支持向量機的目標是解決以下優(yōu)化問題:最大化邊界(margin):找到一個超平面,使得到最近的正負樣本的距離最大。確定支持向量:位于邊界附近的樣本點(支持向量)是確定分類決策的關鍵。超平面的方程通常可以表示為:(3)分類決策:一旦劃分了樣本空間,支持向量機就可以通過超平面進行分類。當新的樣本數(shù)據(jù)出現(xiàn)時,支持向量機判斷該樣本屬于哪個類別,依據(jù)于其到超平面的距離。(4)處理軟間隔:數(shù)據(jù)含噪或不可線性可分時,SVM引入軟間隔,允許少量樣本越界。通過軟間隔優(yōu)化,提高訓練誤差容忍度,增強模型泛化。2.4機器學習的算法2.應用實例支持向量機被廣泛應用于多個領域,主要包括:垃圾郵件識別:通過分析特征(如郵件內容、發(fā)件人等),支持向量機可以高效地將郵件分類為垃圾郵件或正常郵件。人臉識別:在計算機視覺領域,支持向量機可以用于對人臉數(shù)據(jù)進行分類,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論