《人工智能導(dǎo)論(第2版)》課件-第1章:人工智能概述_第1頁
《人工智能導(dǎo)論(第2版)》課件-第1章:人工智能概述_第2頁
《人工智能導(dǎo)論(第2版)》課件-第1章:人工智能概述_第3頁
《人工智能導(dǎo)論(第2版)》課件-第1章:人工智能概述_第4頁
《人工智能導(dǎo)論(第2版)》課件-第1章:人工智能概述_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能的歷史1956年夏天,由約翰·麥卡錫等發(fā)起,匯聚多領(lǐng)域頂尖學(xué)者,標(biāo)志著AI領(lǐng)域的誕生,具有里程碑意義達(dá)特茅斯會(huì)議召開約翰·麥卡錫、馬文·閔斯基、克勞德·香農(nóng)和納撒尼爾·羅切斯特共同發(fā)起,旨在探討和推動(dòng)人工智能的發(fā)展會(huì)議發(fā)起人達(dá)特茅斯會(huì)議的召開1.人工智能的誕生1956年達(dá)特茅斯會(huì)議,正式提出AI概念,探討機(jī)器模擬人類智能,涉及自動(dòng)計(jì)算機(jī)、語言處理、神經(jīng)網(wǎng)絡(luò)、抽象思維等議題AI概念首次提出01核心議題為如何讓機(jī)器模擬人類智能,與會(huì)者深入探討多個(gè)前沿議題,為AI發(fā)展奠定基礎(chǔ)會(huì)議核心議題021.人工智能的誕生達(dá)特茅斯會(huì)議被公認(rèn)為AI起點(diǎn),對(duì)人類科技發(fā)展產(chǎn)生深遠(yuǎn)影響,奠定人工智能研究基礎(chǔ)歷史地位確認(rèn)涉及人工智能發(fā)展路徑,對(duì)后續(xù)研究有深遠(yuǎn)指導(dǎo),公認(rèn)AI誕生標(biāo)志,影響科技?xì)v程會(huì)議影響范圍達(dá)特茅斯會(huì)議的影響黃金時(shí)代:1956-70年代,AI研究蓬勃興起,科學(xué)家們開發(fā)出首個(gè)能模擬人類推理的程序——"邏輯理論家"AI開創(chuàng)性研究早期AI:機(jī)器學(xué)習(xí)與專家系統(tǒng)雛形,提升棋藝,編入專家規(guī)則機(jī)器學(xué)習(xí)與專家系統(tǒng)雛形人工智能的黃金時(shí)代2.第一次興起和衰退AI研究的早期方向關(guān)注邏輯推理、語言理解和機(jī)器學(xué)習(xí),開創(chuàng)性工作如LISP編程語言的開發(fā)早期計(jì)算機(jī)局限性硬件落后:運(yùn)算弱、內(nèi)存小、存儲(chǔ)有限,但科學(xué)家仍在此基礎(chǔ)上推動(dòng)AI發(fā)展2.第一次興起和衰退科學(xué)家對(duì)AI的樂觀預(yù)測(cè)科學(xué)家樂觀預(yù)測(cè),10-20年內(nèi)AI可能達(dá)到人類智能,吸引眾多學(xué)者投身研究AI寒冬的原因分析AI寒冬源于過度樂觀預(yù)期與現(xiàn)實(shí)復(fù)雜性挑戰(zhàn)科學(xué)家的樂觀預(yù)測(cè)與AI寒冬2.第一次興起和衰退硬件局限、數(shù)據(jù)匱乏,AI發(fā)展受阻,理論與實(shí)踐差距大技術(shù)局限制約AI發(fā)展01符號(hào)主義AI在處理模糊性和常識(shí)推理時(shí)受限,早期自然語言處理系統(tǒng)因無法理解上下文導(dǎo)致錯(cuò)誤研究方法的局限性02技術(shù)與研究方法的局限性2.第一次興起和衰退AI復(fù)興原因經(jīng)歷AI寒冬后,研究者反思,轉(zhuǎn)向?qū)嶋H應(yīng)用,計(jì)算機(jī)硬件進(jìn)步,個(gè)人電腦普及,奠定AI研究與應(yīng)用物質(zhì)基礎(chǔ)0102專家系統(tǒng)作用專家系統(tǒng)成為AI應(yīng)用突破口,結(jié)合領(lǐng)域知識(shí)與推理機(jī)制,解決復(fù)雜問題,推動(dòng)AI技術(shù)向?qū)嵱没l(fā)展AI的復(fù)興與專家系統(tǒng)3.第二次興起和衰退專家系統(tǒng)是第二次AI興起的焦點(diǎn),它將專家知識(shí)編碼成規(guī)則,讓計(jì)算機(jī)能在特定領(lǐng)域模擬專家決策AI的第二次興起MYCIN,醫(yī)療診斷專家系統(tǒng),準(zhǔn)確率超90%,媲美住院醫(yī)師,傳染病診斷里程碑醫(yī)療診斷里程碑:MYCIN專家系統(tǒng):理論與實(shí)踐3.第二次興起和衰退自動(dòng)配置硬件,確保兼容性,降低人工錯(cuò)誤XCON功能年均節(jié)省百萬成本,錯(cuò)誤率降至2%以下,提升生產(chǎn)效率和客戶滿意度XCON成效展示專家系統(tǒng)實(shí)用價(jià)值,推動(dòng)企業(yè)級(jí)AI應(yīng)用發(fā)展,成為商業(yè)化典范XCON影響XCON:專家系統(tǒng)在工業(yè)的應(yīng)用3.第二次興起和衰退01專家系統(tǒng)興衰之謎專家系統(tǒng)80年代崛起,被視為AI商業(yè)化典范,90年代卻衰落,其興衰之謎蘊(yùn)含深層原因02知識(shí)獲取的瓶頸專家系統(tǒng)的核心是知識(shí)庫,但知識(shí)獲取困難,專家的隱性知識(shí)難以轉(zhuǎn)化為計(jì)算機(jī)規(guī)則,且知識(shí)庫維護(hù)成本高03缺乏自適應(yīng)能力專家系統(tǒng)無法適應(yīng)新情況,依賴預(yù)設(shè)規(guī)則,面對(duì)未知就失效專家系統(tǒng)的局限與式微3.第二次興起和衰退始于21世紀(jì)初,AI技術(shù)普及,深入日常生活,從智能音箱喚醒到面部識(shí)別解鎖,購物推薦,成為生活基礎(chǔ)設(shè)施第三次AI浪潮第三次浪潮使AI技術(shù)走出實(shí)驗(yàn)室,廣泛應(yīng)用,改變了技術(shù)發(fā)展方向,實(shí)現(xiàn)了技術(shù)與日常生活的深度融合技術(shù)發(fā)展軌跡變化4.第三次興起AlexNet的突破ImageNet競(jìng)賽中AlexNet降低圖像識(shí)別錯(cuò)誤率,開啟深度學(xué)習(xí)時(shí)代,展現(xiàn)巨大潛力深度學(xué)習(xí)的發(fā)展深度學(xué)習(xí)后續(xù)在計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等領(lǐng)域持續(xù)創(chuàng)新,刷新紀(jì)錄AlphaGo的勝利2016年AlphaGo戰(zhàn)勝李世石,證明AI在復(fù)雜策略游戲中具備強(qiáng)大力量,引發(fā)公眾關(guān)注深度學(xué)習(xí)的突破與應(yīng)用4.第三次興起從早期低準(zhǔn)確率到如今能理解上下文、識(shí)別不同人的智能音箱,僅用十年實(shí)現(xiàn)巨大進(jìn)步語音交互演進(jìn)01人臉識(shí)別技術(shù)超越人類,廣泛應(yīng)用于安防支付,AI能理解圖像內(nèi)容,自動(dòng)生成藝術(shù)創(chuàng)作計(jì)算機(jī)視覺應(yīng)用024.第三次興起Transformer架構(gòu)模型如DeepSeek,展現(xiàn)驚人語言能力,流暢對(duì)話,寫作,編程,翻譯,甚至創(chuàng)作詩歌小說自然語言處理的飛躍自動(dòng)駕駛重塑交通,安全駕駛新紀(jì)元自動(dòng)駕駛技術(shù)的潛力AI發(fā)展注重技術(shù)、倫理、法律的協(xié)調(diào),以解決數(shù)據(jù)隱私、公平性、責(zé)任等社會(huì)問題,確保技術(shù)進(jìn)步與社會(huì)價(jià)值相一致AI與社會(huì)的協(xié)調(diào)發(fā)展4.第三次興起上世紀(jì)70年代末,中科院自動(dòng)化所成立首個(gè)模式識(shí)別室,標(biāo)志我國(guó)AI研究起步,條件艱苦,圖像識(shí)別、語音處理領(lǐng)域開展開創(chuàng)性工作AI研究起步01科研人員依賴有限外文資料與簡(jiǎn)陋設(shè)備,在AI領(lǐng)域探索,展現(xiàn)出堅(jiān)韌不拔的科研精神科研環(huán)境025.我國(guó)人工智能發(fā)展歷史國(guó)內(nèi)高校積極開設(shè)人工智能課程,培養(yǎng)出大量專業(yè)人才,為AI領(lǐng)域發(fā)展奠定了人才基礎(chǔ)AI人才培養(yǎng)中國(guó)科學(xué)家在專家系統(tǒng)研究中取得突破,開發(fā)出中醫(yī)診斷專家系統(tǒng),體現(xiàn)獨(dú)特創(chuàng)新實(shí)力專家系統(tǒng)成就設(shè)立科研項(xiàng)目,成立中國(guó)人工智能學(xué)會(huì),高校開設(shè)相關(guān)課程,培養(yǎng)專業(yè)人才,研發(fā)中醫(yī)診斷專家系統(tǒng)80年代AI發(fā)展舉措改革開放推動(dòng)AI發(fā)展中國(guó)AI發(fā)展關(guān)鍵期:90年代,神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)深入研究,1993年首顆人工神經(jīng)網(wǎng)絡(luò)芯片問世,漢字識(shí)別、語音合成為后續(xù)應(yīng)用打下基礎(chǔ)5.我國(guó)人工智能發(fā)展歷史中國(guó)AI崛起,科研政策雙驅(qū)動(dòng),企業(yè)深度參與,國(guó)際影響力顯著提升AI崛起:科研政策雙驅(qū)動(dòng)012017年,中國(guó)發(fā)布全球首個(gè)人工智能國(guó)家戰(zhàn)略,目標(biāo)是到2030年成為世界主要?jiǎng)?chuàng)新中心。在政策推動(dòng)下,AI與實(shí)體經(jīng)濟(jì)融合,催生眾多領(lǐng)先企業(yè)AI創(chuàng)新中心建設(shè)規(guī)劃02AI技術(shù)深化應(yīng)用,賦能各行業(yè),成高質(zhì)量發(fā)展新引擎AI:賦能百業(yè),驅(qū)動(dòng)發(fā)展03中國(guó)AI:市場(chǎng)規(guī)模大,產(chǎn)業(yè)體系完善,需加強(qiáng)核心技術(shù)創(chuàng)新市場(chǎng)規(guī)模與核心技術(shù)0421世紀(jì)AI加速發(fā)展與應(yīng)用5.我國(guó)人工智能發(fā)展歷史AI與各行業(yè)深度融合,展現(xiàn)強(qiáng)大賦能效應(yīng)。技術(shù)融合百度、阿里、騰訊等積極布局AI,推動(dòng)技術(shù)創(chuàng)新。龍頭企業(yè)布局文心、通義千問等模型在多模態(tài)理解和生成上表現(xiàn)優(yōu)異。大語言模型進(jìn)展DeepSeek-V3和R1在語言處理、邏輯推理上超越國(guó)際頂級(jí)模型。DeepSeek大模型6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)010203計(jì)算機(jī)視覺商湯、曠視科技人臉識(shí)別技術(shù)世界領(lǐng)先,應(yīng)用于疫情防控。智能語音交互科大訊飛語音識(shí)別準(zhǔn)確率超98%,阿里云小蜜提供7×24小時(shí)服務(wù)。自動(dòng)駕駛技術(shù)百度Apollo、華為智能汽車解決方案重塑交通出行方式。6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)應(yīng)用場(chǎng)景擴(kuò)展AI將在更多領(lǐng)域?qū)崿F(xiàn)應(yīng)用,如教育、金融、制造等。人機(jī)協(xié)作AI將促進(jìn)人機(jī)協(xié)作,提升工作效率和生活質(zhì)量。技術(shù)創(chuàng)新AI技術(shù)將持續(xù)創(chuàng)新,推動(dòng)更多行業(yè)變革。倫理與安全AI發(fā)展將更加注重倫理和安全,確保技術(shù)的負(fù)責(zé)任使用。數(shù)據(jù)隱私保護(hù)AI技術(shù)將加強(qiáng)數(shù)據(jù)隱私保護(hù),保障用戶信息安全。6.人工智能發(fā)展趨勢(shì)6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)通用人工智能挑戰(zhàn)需算法、架構(gòu)、計(jì)算力突破,深化認(rèn)知與神經(jīng)科學(xué)理解,實(shí)現(xiàn)類人推理、學(xué)習(xí)與創(chuàng)造AGI探索深化當(dāng)前AI在特定任務(wù)表現(xiàn)優(yōu)異,但構(gòu)建通用智能系統(tǒng)仍需跨學(xué)科深度研究與技術(shù)革新6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)AI技術(shù)發(fā)展趨勢(shì):多模態(tài)數(shù)據(jù)處理,實(shí)現(xiàn)全面感知,提升自動(dòng)駕駛、智能機(jī)器人和個(gè)性化醫(yī)療等領(lǐng)域性能多模態(tài)融合將成為主流6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)基于試錯(cuò)與環(huán)境互動(dòng),AI自我優(yōu)化策略。隨著算法與計(jì)算能力進(jìn)步,更多實(shí)際場(chǎng)景將應(yīng)用強(qiáng)化學(xué)習(xí),如資源調(diào)度、金融決策和游戲設(shè)計(jì)強(qiáng)化學(xué)習(xí)原理強(qiáng)化學(xué)習(xí)將在更多領(lǐng)域得到應(yīng)用6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)邊緣計(jì)算與AI芯片結(jié)合提升物聯(lián)網(wǎng)設(shè)備效率,實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)處理,降低延遲,增強(qiáng)隱私保護(hù),需高效低功耗AI芯片與算法支持邊緣計(jì)算與AI芯片的結(jié)合將推動(dòng)AI在物聯(lián)網(wǎng)設(shè)備上的普及6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)從孤立工具轉(zhuǎn)向協(xié)作伙伴,共同解決復(fù)雜問題,實(shí)現(xiàn)更高價(jià)值A(chǔ)I角色轉(zhuǎn)變AI與人類協(xié)同,結(jié)合創(chuàng)造力與計(jì)算力,提升效率創(chuàng)新人機(jī)協(xié)作趨勢(shì)人機(jī)協(xié)作將成為常態(tài)政府、企業(yè)、研究機(jī)構(gòu)共商規(guī)范,確保AI公平透明安全,防范潛在風(fēng)險(xiǎn)AI倫理標(biāo)準(zhǔn)制定AI發(fā)展對(duì)經(jīng)濟(jì)、社會(huì)、文化影響深遠(yuǎn),長(zhǎng)期影響復(fù)雜超乎想象AI影響深度分析需密切關(guān)注AI技術(shù)進(jìn)步,及時(shí)調(diào)整策略,適應(yīng)快速變化的科技環(huán)境持續(xù)關(guān)注AI進(jìn)展積極面對(duì)AI帶來的挑戰(zhàn),抓住發(fā)展機(jī)遇,構(gòu)建人與AI和諧共存的未來應(yīng)對(duì)AI挑戰(zhàn)與機(jī)遇AI倫理與安全將受到前所未有的關(guān)注6.人工智能現(xiàn)狀和發(fā)展趨勢(shì)預(yù)測(cè)魚的重量1.生活場(chǎng)景當(dāng)我們站在魚攤前挑選鮮魚時(shí),能輕易測(cè)量魚的長(zhǎng)度,卻很難準(zhǔn)確判斷它的重量如果我們能收集某種魚的長(zhǎng)度和重量數(shù)據(jù),找出其中的規(guī)律,就能建立一個(gè)預(yù)測(cè)模型。下次買這種魚時(shí),只需簡(jiǎn)單測(cè)量其長(zhǎng)度,就能快速估算出重量,既方便又實(shí)用2.長(zhǎng)度和重量的關(guān)系可見,x和y是線性關(guān)系,用公式表示為:

如果知道了w1和w0,就可以根據(jù)長(zhǎng)度x預(yù)測(cè)重量y了3.什么是機(jī)器學(xué)習(xí)根據(jù)給定的一組長(zhǎng)度和重量數(shù)據(jù),計(jì)算得到w1和w0的過程,就是機(jī)器學(xué)習(xí)數(shù)據(jù)集:用于訓(xùn)練機(jī)器學(xué)習(xí)預(yù)測(cè)模型的一組數(shù)據(jù)稱為數(shù)據(jù)集,如上表1-1。數(shù)據(jù)集中的每個(gè)數(shù)據(jù)由數(shù)據(jù)和標(biāo)注組成數(shù)據(jù):預(yù)測(cè)模型的輸入,即預(yù)測(cè)的依據(jù),例如魚的長(zhǎng)度標(biāo)注:預(yù)測(cè)期望的輸出,例如魚的重量4.最小二乘法

線性問題的機(jī)器學(xué)習(xí),經(jīng)常使用最小二乘法,對(duì)于表1-1中給定的一組長(zhǎng)度x和重量y,最小二乘法根據(jù)下列公式計(jì)算預(yù)測(cè)模型中的w1和w0:

根據(jù)表1-1中的一組數(shù)據(jù)和標(biāo)注計(jì)算得到預(yù)測(cè)模型參數(shù)w1和w0的過程,就是機(jī)器學(xué)習(xí),也稱為模型訓(xùn)練。訓(xùn)練結(jié)束以后,就可以根據(jù)下列公式預(yù)測(cè)魚的重量了:5.魚的重量還與寬度和高度有關(guān)把長(zhǎng)度、高度、寬度記作x1、x2、x3,重量為y,根據(jù)長(zhǎng)度、高度、寬度與重量之間的線性關(guān)系表示為:生活經(jīng)驗(yàn)告訴我們,正如人有高矮,也有胖瘦,僅僅根據(jù)身高難以準(zhǔn)確估計(jì)人的重量,魚也有高矮胖瘦,表1-2中每條魚增加寬度和高度

同樣可以根據(jù)最小二乘法計(jì)算上述公式中的w0、w1、w2、w3預(yù)測(cè)手寫數(shù)字1.生活場(chǎng)景這一小節(jié)將進(jìn)入一個(gè)更加貼近日常生活的場(chǎng)景,讓計(jì)算機(jī)判斷一張圖片中的手寫數(shù)字具體是0到9中的哪一個(gè)下圖展示了MINST數(shù)據(jù)集中的一組手寫數(shù)字圖像,對(duì)每個(gè)圖像,我們一眼就能看出寫的是哪個(gè)數(shù)字?,F(xiàn)在要讓機(jī)器來識(shí)別2.兩類預(yù)測(cè)問題預(yù)測(cè)魚的重量假如一條魚的重量在1–10kg之間,它一般不會(huì)正好是某個(gè)整數(shù)例如,說一條魚3kg,它的真實(shí)重量可能是3.1或3.12或3.123……所以,預(yù)測(cè)魚的重量,預(yù)測(cè)結(jié)果有無窮多個(gè),不可能一一列舉預(yù)測(cè)手寫數(shù)字預(yù)測(cè)結(jié)果是0–9中的哪一個(gè)例如,預(yù)測(cè)結(jié)果是3,它就不可能是3.1或3.12或3.123所以,預(yù)測(cè)手寫數(shù)字,預(yù)測(cè)結(jié)果只有10個(gè),是有限個(gè),可以一一列舉回歸問題分類問題機(jī)器學(xué)習(xí)有兩類問題:回歸問題預(yù)測(cè)連續(xù)值,分類問題預(yù)測(cè)離散值3.兩分類問題魚的重量預(yù)測(cè)就是在尋找魚的長(zhǎng)度和重量之間存在的規(guī)律,然后利用這個(gè)規(guī)律建立一個(gè)可以預(yù)測(cè)重量的機(jī)器學(xué)習(xí)模型對(duì)于預(yù)測(cè)手寫數(shù)字的圖像中的數(shù)字具體是0-9中的哪一個(gè),雖然問題的形式變了,但核心思想是一樣的,我們還是要從數(shù)據(jù)中找出規(guī)律,建立預(yù)測(cè)模型MINST數(shù)據(jù)集包含60,000個(gè)0-9手寫數(shù)字圖像,每種數(shù)字約6,000個(gè)。現(xiàn)在我們只使用數(shù)字0和1的圖像,刪除其他圖像。預(yù)測(cè)結(jié)果就是:0還是1,只有兩個(gè)類別預(yù)測(cè)結(jié)果只有兩個(gè)類別,稱為兩分類問題兩分類問題舉例:預(yù)測(cè)病人有沒有癌癥,郵件是否垃圾郵件,明天會(huì)不會(huì)下雨,等等MINST數(shù)據(jù)集中的圖像分辨率是28X28,圖像是由28X28=784個(gè)像素值組成的,每個(gè)像素值表示這個(gè)像素的亮度,范圍在0-255之間,或0–15之間每個(gè)手寫數(shù)字圖像數(shù)據(jù)包括784個(gè)0-255之間的數(shù)值。對(duì)這284個(gè)數(shù)值建立一個(gè)線性模型,格式如下:

計(jì)算結(jié)果是一個(gè)連續(xù)值,如何根據(jù)它預(yù)測(cè)這個(gè)圖像是0還是1?辦法是使用一個(gè)S形曲線的邏輯函數(shù)把y變?yōu)楦怕?,?dāng)這個(gè)概率大于0.5時(shí)判給數(shù)字0,否則判給數(shù)字1Sigmoid函數(shù)能把實(shí)數(shù)范圍內(nèi)的值y轉(zhuǎn)化到(0,1)之間這種兩分類方法稱為邏輯回歸分類法3.兩分類問題實(shí)現(xiàn)了這個(gè)二分類的問題,就可以在此基礎(chǔ)上實(shí)現(xiàn)類別為0-9的多分類預(yù)測(cè)了。對(duì)于這10個(gè)數(shù)字的預(yù)測(cè)問題,需要定義10個(gè)回歸函數(shù)上述10個(gè)線性函數(shù)計(jì)算得到y(tǒng)0,y1,y2,……y9,再經(jīng)過邏輯函數(shù)轉(zhuǎn)換成概率,哪個(gè)概率最大,就判定這個(gè)圖像上寫的是哪個(gè)數(shù)字4.多分類問題這樣,通過使用10個(gè)兩分類流程,構(gòu)造實(shí)現(xiàn)了一個(gè)10個(gè)類別的多分類流程機(jī)器學(xué)習(xí)流程1.兩類機(jī)器學(xué)習(xí)問題回歸問題預(yù)測(cè)連續(xù)值根據(jù)魚的長(zhǎng)度預(yù)測(cè)魚的重量預(yù)測(cè)房?jī)r(jià),預(yù)測(cè)氣溫機(jī)器學(xué)習(xí)方法有:線性回歸法分類問題預(yù)測(cè)離散值預(yù)測(cè)圖像中的手寫數(shù)字垃圾郵件分類,圖像分類,文本分類機(jī)器學(xué)習(xí)方法有:邏輯回歸分類法回歸問題分類問題回歸問題和分類問題雖然看起來完全不同,但它們都遵循著相似的步驟和方法,有相同的機(jī)器學(xué)習(xí)基本流程2.機(jī)器學(xué)習(xí)流程首先明確是回歸問題還是分類問題,它決定了我們將要使用的算法和方法。無論是回歸還是分類,我們都希望建立一個(gè)模型,能夠根據(jù)輸入數(shù)據(jù)做出準(zhǔn)確的預(yù)測(cè)1.明確預(yù)測(cè)目標(biāo)類型數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ),沒有數(shù)據(jù)就無法訓(xùn)練模型。在魚的例子中,我們需要收集大量魚的長(zhǎng)度和重量數(shù)據(jù);在手寫數(shù)字的例子中,我們需要收集大量手寫數(shù)字的圖像和對(duì)應(yīng)的數(shù)字標(biāo)簽,這個(gè)標(biāo)簽也叫標(biāo)注2.收集和準(zhǔn)備數(shù)據(jù)2.機(jī)器學(xué)習(xí)流程訓(xùn)練集用于訓(xùn)練模型,測(cè)試集用于評(píng)估模型的性能。通常我們會(huì)將大部分?jǐn)?shù)據(jù)用于訓(xùn)練,比如80%,剩下的20%用于測(cè)試這樣做的目的是確保模型在未見過的數(shù)據(jù)上也能表現(xiàn)良好3.數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集劃分乳腺癌數(shù)據(jù)集2.機(jī)器學(xué)習(xí)流程對(duì)于魚的例子,我們可能選擇線性回歸算法;對(duì)于手寫數(shù)字的例子,我們可能選擇邏輯回歸分類法,也可能選擇神經(jīng)網(wǎng)絡(luò)或支持向量機(jī)4.選用機(jī)器學(xué)習(xí)算法訓(xùn)練模型是最核心的步驟。使用訓(xùn)練集數(shù)據(jù)及其標(biāo)注來擬合模型,讓模型學(xué)習(xí)數(shù)據(jù)中的規(guī)律。在訓(xùn)練過程中,模型會(huì)不斷調(diào)整參數(shù),以減少預(yù)測(cè)誤差5.根據(jù)算法訓(xùn)練模型2.機(jī)器學(xué)習(xí)流程模型訓(xùn)練完成后,需要評(píng)估它的性能。需要使用測(cè)試集檢驗(yàn)?zāi)P偷谋憩F(xiàn),看它在未見過的數(shù)據(jù)上是否預(yù)測(cè)準(zhǔn)確。評(píng)估指標(biāo)因問題類型而異:回歸問題常用平均絕對(duì)誤差或均方誤差,分類問題常用混淆矩陣、準(zhǔn)確率、精確率或召回率6.評(píng)估模型如果模型表現(xiàn)良好,就可以部署它來解決實(shí)際問題。例如,將魚的重量預(yù)測(cè)模型集成到一個(gè)漁業(yè)管理系統(tǒng),將手寫數(shù)字識(shí)別模型應(yīng)用到一個(gè)自動(dòng)郵件分揀系統(tǒng)中7.部署使用機(jī)器學(xué)習(xí)算法1.線性回歸法和邏輯回歸分類法

解決分類問題,預(yù)測(cè)離散的類別標(biāo)簽輸出是經(jīng)過Sigmoid函數(shù)轉(zhuǎn)換后的值,表示某個(gè)類別的概率通常使用最大似然估計(jì)法計(jì)算模型參數(shù)線性回歸法邏輯回歸分類法2.支持向量機(jī)向量就像是一個(gè)有方向的箭頭,在數(shù)學(xué)中可以表示為一組有序的數(shù)字。比如在二維空間中,一個(gè)向量可以用兩個(gè)數(shù)字表示在實(shí)際問題中,向量可以表示各種特征,前面魚的例子中魚的長(zhǎng)度、寬度、高度組成一個(gè)向量,手寫數(shù)字圖像的784個(gè)像素值也組成一個(gè)向量在處理圖像時(shí),很少直接使用像素值,而是先從圖像中提取特征,用提取的特征作為代表圖像的向量。例如提取顏色直方圖、紋理特征或邊緣信息。在處理文本時(shí),可能會(huì)計(jì)算詞頻特征或TF-IDF特征;處理語音時(shí),可能會(huì)提取梅爾頻率倒譜系數(shù)等聲學(xué)特征。這些特征提取過程非常重要,因?yàn)楹玫奶卣髂軒椭С窒蛄繖C(jī)更好地理解數(shù)據(jù)2.支持向量機(jī)支持向量機(jī)(SVM)可以用于分類和回歸任務(wù)其核心思想是尋找一個(gè)最優(yōu)超平面,將不同類別的數(shù)據(jù)分開,并最大化兩類數(shù)據(jù)之間的間隔在二維空間中,超平面是一條直線;在高維空間中,它是一個(gè)平面或更高維的幾何結(jié)構(gòu)。參見圖SVM通過支持向量確定超平面,支持向量是距離超平面最近的數(shù)據(jù)點(diǎn),直接影響分類器的性能。SVM廣泛應(yīng)用于文本分類、圖像識(shí)別、生物信息學(xué)等領(lǐng)域3.人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的計(jì)算模型,它由大量相互連接的處理單元(稱為神經(jīng)元)組成,能夠通過學(xué)習(xí)數(shù)據(jù)中的模式來完成特定任務(wù)每個(gè)神經(jīng)元接收輸入信號(hào),經(jīng)過加權(quán)求和后通過激活函數(shù)產(chǎn)生輸出,這些輸出又作為下一層神經(jīng)元的輸入神經(jīng)網(wǎng)絡(luò)通常包括輸入層、隱藏層和輸出層,其中隱藏層的數(shù)量和每層的神經(jīng)元數(shù)量可以根據(jù)問題復(fù)雜度進(jìn)行調(diào)整神經(jīng)網(wǎng)絡(luò)最常見的訓(xùn)練方法是反向傳播算法,通過比較網(wǎng)絡(luò)輸出與真實(shí)值之間的誤差,從輸出層向輸入層逐層調(diào)整連接權(quán)重,逐步減少預(yù)測(cè)誤差3.卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種處理具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的深度學(xué)習(xí)模型。它的核心思想是通過局部連接和權(quán)值共享來高效處理高維矩陣數(shù)據(jù),例如圖像中的像素矩陣卷積運(yùn)算是CNN最核心的數(shù)學(xué)操作,它是一種特殊的線性運(yùn)算,通過在輸入矩陣上滑動(dòng)一個(gè)小的卷積核來依次計(jì)算局部區(qū)域的加權(quán)和在卷積運(yùn)算中,卷積的第一個(gè)參數(shù)稱為輸入矩陣,第二個(gè)參數(shù)稱為卷積核或核函數(shù),卷積運(yùn)算的結(jié)果稱為輸出或特征映射每次卷積從輸入矩陣截取一個(gè)與卷積核同樣大小的子矩陣,把兩者對(duì)應(yīng)位置的兩個(gè)數(shù)相乘以后累加,就得到這次卷積運(yùn)算的結(jié)果3.卷積神經(jīng)網(wǎng)絡(luò)卷積運(yùn)算經(jīng)過滑動(dòng)卷積逐次計(jì)算的特點(diǎn)使得卷積運(yùn)算具有兩個(gè)重要特性首先是局部連接。它通過一個(gè)小的“卷積核”在輸入數(shù)據(jù)上滑動(dòng),并在每個(gè)位置執(zhí)行加權(quán)求和,輸出的每個(gè)元素只與輸入中一小塊區(qū)域的元素相關(guān)聯(lián)其次是權(quán)值共享。卷積核在整個(gè)輸入矩陣上滑動(dòng)。這意味著,卷積核中的權(quán)重參數(shù)在所有位置都是共享的。權(quán)重共享減少了模型的參數(shù)數(shù)量,降低了模型的復(fù)雜性2012年前,CNN的發(fā)展相對(duì)緩慢,主要受限于計(jì)算能力不足、數(shù)據(jù)量不夠大以及梯度消失等問題,導(dǎo)致深層網(wǎng)絡(luò)難以訓(xùn)練。這些早期的探索為后來AlexNet的成功奠定了基礎(chǔ),但當(dāng)時(shí)大多數(shù)計(jì)算機(jī)視覺任務(wù)仍主要依賴傳統(tǒng)的手工特征提取方法深度學(xué)習(xí)1.深度學(xué)習(xí)的興起AlexNet是深度學(xué)習(xí)發(fā)展史上的一個(gè)重要里程碑,它在2012年的ImageNet圖像分類競(jìng)賽中取得了突破性的成績(jī),大幅超越了傳統(tǒng)方法深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,它通過模擬人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來處理復(fù)雜的數(shù)據(jù)。與傳統(tǒng)機(jī)器學(xué)習(xí)算法相比,深度學(xué)習(xí)能夠自動(dòng)從數(shù)據(jù)中提取多層次的特征,從而在許多任務(wù)中表現(xiàn)出色I(xiàn)mageNet圖像分類競(jìng)賽要求在包含1400萬張標(biāo)注了圖像類別的數(shù)據(jù)集上訓(xùn)練圖像分類模型,要求參賽模型在1000個(gè)類別中實(shí)現(xiàn)分類2.AlexNet網(wǎng)絡(luò)架構(gòu)AlexNet由五個(gè)卷積層和三個(gè)全連接層組成,其中卷積層負(fù)責(zé)提取圖像的局部特征,而全連接層則用于最終的分類任務(wù)2.AlexNet網(wǎng)絡(luò)架構(gòu)第1卷積層使用96個(gè)11×11的卷積核,步長(zhǎng)為4;第1卷積層池化核為3x3,池化步長(zhǎng)為2第2卷積層的輸入是上一層的輸出,使用256個(gè)5×5的卷積核,步長(zhǎng)為1;使用2×2的最大池化層第3卷積層和第4卷積層均使用3×3的小卷積核,步長(zhǎng)為1,卷積核數(shù)量分別為384和384。這兩層沒有池化操作,目的是在保持特征圖尺寸不變的情況下,進(jìn)一步融合和抽象特征第5卷積層同樣使用3×3的卷積核,輸出通道數(shù)為256,之后使用最大池化層將特征圖尺寸降為AlexNet網(wǎng)絡(luò)具有強(qiáng)大的特征提取能力:第1和第2卷積層提取低級(jí)特征:對(duì)局部的、微小的結(jié)構(gòu)變化高度敏感,檢測(cè)簡(jiǎn)單的邊緣、角點(diǎn)、顏色斑點(diǎn)、特定方向的紋理(如水平/垂直條紋)等,語義非常弱,接近原始像素的抽象表達(dá)第3和第4卷積層提取中間特征:由低級(jí)特征組合而成,開始識(shí)別更復(fù)雜的視覺部件和局部結(jié)構(gòu),例如紋理的組合、重復(fù)模式、以及更復(fù)雜的邊緣組合(如拐角、T型連接),形成物體的組成部分(如車輪、眼睛、窗戶輪廓)或更豐富的紋理區(qū)域,開始具備一定的局部語義信息第5卷積層提取高級(jí)特征:整合中層特征,形成具有強(qiáng)語義含義的表示,能夠識(shí)別完整的物體(如人臉、汽車、狗)、場(chǎng)景類別(如街道、室內(nèi))或圖像的全局屬性2.AlexNet網(wǎng)絡(luò)架構(gòu)感受野是指卷積層輸出的特征圖上某個(gè)特征點(diǎn)能夠感知到的原始輸入圖像的區(qū)域范圍第1卷積層的卷積核大小都為11X11,這使得它們擅長(zhǎng)捕捉一些局部的、細(xì)節(jié)的特征,比如邊緣、角點(diǎn)或者簡(jiǎn)單的紋理深層卷積核的感受野會(huì)變得越來越大,這使得它們能夠識(shí)別更復(fù)雜的模式,比如物體的部分或者整體這種從局部到全局的特征提取過程,正是CNN能夠有效理解圖像內(nèi)容的關(guān)鍵所在3.深度學(xué)習(xí)在計(jì)算機(jī)視覺中的應(yīng)用AlexNet的成功標(biāo)志著深度學(xué)習(xí)的一個(gè)重要轉(zhuǎn)折點(diǎn)。在此之前,傳統(tǒng)的圖像分類方法主要依賴于手工設(shè)計(jì)的特征提取器,如SIFT和HOG,但這些方法在復(fù)雜場(chǎng)景下的性能存在明顯瓶頸。AlexNet通過其深度CNN網(wǎng)絡(luò)架構(gòu)提取特征,顯著降低了圖像分類的錯(cuò)誤率在目標(biāo)檢測(cè)領(lǐng)域,傳統(tǒng)檢測(cè)方法如DPM很快被基于深度學(xué)習(xí)的新方法取代。R-CNN系列算法直接借鑒了AlexNet的特征提取思路,通過先在圖像上生成候選區(qū)域,再用卷積網(wǎng)絡(luò)提取特征進(jìn)行分類。隨后出現(xiàn)的YOLO和SSD等模型進(jìn)一步優(yōu)化了這一流程,實(shí)現(xiàn)了端到端的訓(xùn)練和更快的檢測(cè)速度3.深度學(xué)習(xí)在計(jì)算機(jī)視覺中的應(yīng)用圖像分割任務(wù)同樣受益于AlexNet的啟發(fā)。全卷積網(wǎng)絡(luò)將AlexNet中的全連接層轉(zhuǎn)換為卷積層,使網(wǎng)絡(luò)可以接受任意尺寸的輸入并輸出相同尺寸的分割圖。隨后的U-Net、DeepLab等模型在此基礎(chǔ)上進(jìn)一步改進(jìn),在醫(yī)學(xué)圖像分割、遙感圖像解譯等應(yīng)用中展現(xiàn)出驚人效果圖像生成領(lǐng)域的發(fā)展同樣受益于AlexNet的啟發(fā)。正是AlexNet的成功使得神經(jīng)網(wǎng)絡(luò)可以勝任復(fù)雜的生成任務(wù)。從最初的DCGAN到后來的StyleGAN,這些生成模型都采用卷積結(jié)構(gòu)作為基礎(chǔ)架構(gòu)。風(fēng)格遷移技術(shù)的出現(xiàn)也得益于AlexNet的中間層特征提取能力。這些技術(shù)不僅能夠生成逼真圖像,還被廣泛應(yīng)用于圖像修復(fù)、數(shù)據(jù)增強(qiáng)等實(shí)際場(chǎng)景3.深度學(xué)習(xí)的廣泛應(yīng)用在自然語言處理領(lǐng)域,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)在機(jī)器翻譯、文本生成等任務(wù)中展現(xiàn)出強(qiáng)大能力;而Transformer架構(gòu)則徹底革新了自然語言處理領(lǐng)域,DeepSeek、文心一言、ChatGPT等大語言模型正是基于Transformer架構(gòu)AlexNet猶如一把鑰匙打開了深度學(xué)習(xí)時(shí)代的大門,其影響遠(yuǎn)遠(yuǎn)超出了計(jì)算機(jī)視覺領(lǐng)域,深刻改變了整個(gè)人工智能的發(fā)展軌跡在語音識(shí)別和語音合成領(lǐng)域,深度學(xué)習(xí)同樣帶來了革命性變化。傳統(tǒng)的語音識(shí)別系統(tǒng)依賴于復(fù)雜的聲學(xué)模型和語言模型,而深度學(xué)習(xí)的引入使得端到端的語音識(shí)別成為可能。深度學(xué)習(xí)方法顯著提高了語音識(shí)別的準(zhǔn)確率,使得智能語音助手如Siri、Alexa等能夠更加自然地與用戶交互深度學(xué)習(xí)的應(yīng)用3.深度學(xué)習(xí)在計(jì)算機(jī)視覺中的應(yīng)用AlexNet的成功標(biāo)志著深度學(xué)習(xí)的一個(gè)重要轉(zhuǎn)折點(diǎn)。在此之前,傳統(tǒng)的圖像分類方法主要依賴于手工設(shè)計(jì)的特征提取器,如SIFT和HOG,但這些方法在復(fù)雜場(chǎng)景下的性能存在明顯瓶頸。AlexNet通過其深度CNN網(wǎng)絡(luò)架構(gòu)提取特征,顯著降低了圖像分類的錯(cuò)誤率在目標(biāo)檢測(cè)領(lǐng)域,傳統(tǒng)檢測(cè)方法如DPM很快被基于深度學(xué)習(xí)的新方法取代。R-CNN系列算法直接借鑒了AlexNet的特征提取思路,通過先在圖像上生成候選區(qū)域,再用卷積網(wǎng)絡(luò)提取特征進(jìn)行分類。隨后出現(xiàn)的YOLO和SSD等模型進(jìn)一步優(yōu)化了這一流程,實(shí)現(xiàn)了端到端的訓(xùn)練和更快的檢測(cè)速度3.深度學(xué)習(xí)在計(jì)算機(jī)視覺中的應(yīng)用圖像分割任務(wù)同樣受益于AlexNet的啟發(fā)。全卷積網(wǎng)絡(luò)將AlexNet中的全連接層轉(zhuǎn)換為卷積層,使網(wǎng)絡(luò)可以接受任意尺寸的輸入并輸出相同尺寸的分割圖。隨后的U-Net、DeepLab等模型在此基礎(chǔ)上進(jìn)一步改進(jìn),在醫(yī)學(xué)圖像分割、遙感圖像解譯等應(yīng)用中展現(xiàn)出驚人效果圖像生成領(lǐng)域的發(fā)展同樣受益于AlexNet的啟發(fā)。正是AlexNet的成功使得神經(jīng)網(wǎng)絡(luò)可以勝任復(fù)雜的生成任務(wù)。從最初的DCGAN到后來的StyleGAN,這些生成模型都采用卷積結(jié)構(gòu)作為基礎(chǔ)架構(gòu)。風(fēng)格遷移技術(shù)的出現(xiàn)也得益于AlexNet的中間層特征提取能力。這些技術(shù)不僅能夠生成逼真圖像,還被廣泛應(yīng)用于圖像修復(fù)、數(shù)據(jù)增強(qiáng)等實(shí)際場(chǎng)景3.深度學(xué)習(xí)的廣泛應(yīng)用在自然語言處理領(lǐng)域,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)在機(jī)器翻譯、文本生成等任務(wù)中展現(xiàn)出強(qiáng)大能力;而Transformer架構(gòu)則徹底革新了自然語言處理領(lǐng)域,DeepSeek、文心一言、ChatGPT等大語言模型正是基于Transformer架構(gòu)AlexNet猶如一把鑰匙打開了深度學(xué)習(xí)時(shí)代的大門,其影響遠(yuǎn)遠(yuǎn)超出了計(jì)算機(jī)視覺領(lǐng)域,深刻改變了整個(gè)人工智能的發(fā)展軌跡在語音識(shí)別和語音合成領(lǐng)域,深度學(xué)習(xí)同樣帶來了革命性變化。傳統(tǒng)的語音識(shí)別系統(tǒng)依賴于復(fù)雜的聲學(xué)模型和語言模型,而深度學(xué)習(xí)的引入使得端到端的語音識(shí)別成為可能。深度學(xué)習(xí)方法顯著提高了語音識(shí)別的準(zhǔn)確率,使得智能語音助手如Siri、Alexa等能夠更加自然地與用戶交互人工智能的運(yùn)作支撐體系1.人工智能的運(yùn)作支撐我們將重點(diǎn)了解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論