版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
4.1機器學(xué)習(xí)概述1.機器學(xué)習(xí)解決的問題2.機器學(xué)習(xí)所需的基礎(chǔ)3.機器學(xué)習(xí)的概念4.機器學(xué)習(xí)的發(fā)展歷程5.機器學(xué)習(xí)的評估指標(biāo)1.機器學(xué)習(xí)解決的問題基于數(shù)據(jù)和模式識別,處理多種類型的任務(wù),涵蓋分類、預(yù)測、聚類等場景。分類問題定義:將數(shù)據(jù)點分配到預(yù)定義類別中。示例:垃圾郵件檢測(“垃圾郵件”/“正常郵件”)?;貧w問題定義:通過特征與目標(biāo)變量的關(guān)系,預(yù)測新數(shù)據(jù)的輸出值(連續(xù)值)。示例:房價預(yù)測(根據(jù)面積、位置等特征預(yù)測房價)。聚類問題定義:將數(shù)據(jù)分組為相似子集,無需預(yù)先定義類別。示例:客戶細分(根據(jù)購買行為劃分客戶群體)。異常檢測定義:識別不符合一般模式的數(shù)據(jù)點。示例:信用卡欺詐檢測(識別可疑交易)。推薦系統(tǒng)定義:根據(jù)用戶歷史行為和偏好推薦產(chǎn)品/服務(wù)。示例:Netflix電影推薦、Amazon商品推薦。序列預(yù)測定義:預(yù)測時間序列數(shù)據(jù)中的未來值。示例:天氣預(yù)測、股票價格預(yù)測。2.機器學(xué)習(xí)所需的基礎(chǔ)數(shù)學(xué)基礎(chǔ)線性代數(shù):矩陣運算、向量空間等。概率論與統(tǒng)計:概率分布、期望值、方差、假設(shè)檢驗等。微積分:函數(shù)導(dǎo)數(shù)、優(yōu)化問題。技能要求編程:Python/R/Java,及相關(guān)庫(scikit-learn、TensorFlow、PyTorch)。數(shù)據(jù)預(yù)處理:清洗、變換、特征工程、可視化。理論基礎(chǔ):監(jiān)督/無監(jiān)督學(xué)習(xí)、過擬合/欠擬合、模型評估等。3.機器學(xué)習(xí)的概念什么是機器學(xué)習(xí)?通俗理解:讓計算機通過分析數(shù)據(jù)自主學(xué)習(xí)和改進,而非依賴人工編寫的固定規(guī)則。類比:教孩子觀察思考以解決問題,而非直接給出答案。示例:識別貓和狗的圖片不編寫區(qū)分規(guī)則,而是通過大量標(biāo)注好的圖片,讓計算機自主學(xué)習(xí)“貓”和“狗”的特征。3機器學(xué)習(xí)的概念專業(yè)定義:人工智能的一個分支,通過算法和統(tǒng)計模型,使計算機從數(shù)據(jù)中自動學(xué)習(xí)并提升性能,核心是“自主建立模型以解決新問題”。TomM.Mitchell的定義:“一個計算機程序在完成某類任務(wù)T時,如果它的性能P在經(jīng)驗E的基礎(chǔ)上有所提高,那么我們就說它從這些經(jīng)驗中學(xué)習(xí)?!焙诵囊兀喝蝿?wù)(T)、性能(P)、經(jīng)驗(E)。4.機器學(xué)習(xí)的發(fā)展歷程從理論到應(yīng)用:機器學(xué)習(xí)的演進早期探索(20世紀(jì)40-50年代)1943年:McCulloch和Pitts提出首個神經(jīng)網(wǎng)絡(luò)模型。1950年:圖靈提出“圖靈測試”,探討機器智能。1957年:Rosenblatt發(fā)明感知機(最早的神經(jīng)網(wǎng)絡(luò)之一)。符號主義與專家系統(tǒng)(60-80年代)主導(dǎo)方法:邏輯推理和規(guī)則系統(tǒng)(人工編寫規(guī)則)。局限:處理復(fù)雜、模糊問題能力差。4.機器學(xué)習(xí)的發(fā)展歷程統(tǒng)計學(xué)習(xí)與復(fù)興(80年代末-21世紀(jì)初)1986年:Hinton等人提出反向傳播算法,推動多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練。1995年:Vapnik和Cortes提出支持向量機(SVM),成為主流分類算法。趨勢:從符號主義轉(zhuǎn)向“數(shù)據(jù)驅(qū)動”。深度學(xué)習(xí)革命(21世紀(jì)初至今)2006年:Hinton等人提出深度信念網(wǎng)絡(luò)(DBN),開啟深度學(xué)習(xí)時代。2012年:AlexNet在ImageNet競賽中突破,推動深度學(xué)習(xí)在計算機視覺的應(yīng)用。4.機器學(xué)習(xí)的發(fā)展歷程5現(xiàn)代發(fā)展(近年)2016年:AlphaGo擊敗圍棋世界冠軍,展示強化學(xué)習(xí)的潛力。2018年:BERT模型提升自然語言處理性能。現(xiàn)狀:強化學(xué)習(xí)、GAN、Transformer等模型興起,廣泛應(yīng)用于醫(yī)療、金融、自動駕駛等領(lǐng)域。5.評估指標(biāo)(基礎(chǔ)概念)如何評估模型性能?——基礎(chǔ)術(shù)語TP(TruePositive):真正例,正確預(yù)測為正例的數(shù)量。TN(TrueNegative):真負(fù)例,正確預(yù)測為負(fù)例的數(shù)量。FP(FalsePositive):假正例,錯誤預(yù)測為正例的數(shù)量。FN(FalseNegative):假負(fù)例,錯誤預(yù)測為負(fù)例的數(shù)量。5.評估指標(biāo)(分類任務(wù)1)1.準(zhǔn)確率準(zhǔn)確率(Accuracy)是指模型正確預(yù)測的樣本數(shù)占總樣本數(shù)的比例,表達式為2.精確率(Precision)定義:預(yù)測為正例的樣本中,實際為正例的比例(“預(yù)測正例的可靠性”)。3.召回率(Recall)定義:實際為正例的樣本中,被正確預(yù)測的比例(“正例的覆蓋能力”)。4.F1值F1值(F1Score)是精確率和召回率的調(diào)和平均數(shù),適用于不均衡數(shù)據(jù)的情況,表達式為5.評估指標(biāo)(ROC曲線與AUC)ROC曲線:以假正率(FPR)為橫軸,真正率(TPR,即召回率)為縱軸的曲線。AUC(AreaUnderCurve):定義:ROC曲線下的面積,衡量模型整體性能。取值:越
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全托管服務(wù)合同范本
- 學(xué)校食堂配送合同范本
- 房子托管整租合同范本
- 戶外素木桌椅合同范本
- 夾具治具購銷合同范本
- 彩鋼房承包合同協(xié)議書
- 戶外廣告轉(zhuǎn)讓合同范本
- 室內(nèi)拆除公司合同范本
- 學(xué)校舞臺搭建合同范本
- 房產(chǎn)公司車庫合同范本
- 《海南自由貿(mào)易港建設(shè)總體方案》解讀
- 倉庫安全管理臺賬模板
- GB/T 6730.46-2025鐵礦石砷含量的測定蒸餾分離-砷鉬藍分光光度法
- 護理管理學(xué)課程教學(xué)大綱
- 2026屆天津市和平區(qū)物理八上期末調(diào)研模擬試題含解析
- 酒店餐飲合作方案(3篇)
- 食堂員工偷竊管理辦法
- 海爾卡薩帝復(fù)式洗衣機C8 U12G1說明書
- 銀行客戶經(jīng)理(對公業(yè)務(wù))考試題庫
- DLT 5161-2026 電氣裝置安裝工程質(zhì)量檢驗及評定
- 堡壘機使用管理制度
評論
0/150
提交評論