版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、北郵阿里巴巴技術(shù)聯(lián)盟機器學(xué)習(xí)概述研究方法概念學(xué)習(xí)資料機器學(xué)習(xí)是近20多年興起的一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。機器學(xué)習(xí)理論主要是設(shè)計和分析一些讓計算機可以自動“學(xué)習(xí)”的算法。即從數(shù)據(jù)中自動分析獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進(jìn)行預(yù)測的算法。定義:“機器學(xué)習(xí)是對能通過經(jīng)驗自動改進(jìn)的計算機算法的研究”。定義:“機器學(xué)習(xí)是一種讓計算機在沒有事先明確地編程的情況下做出正確反應(yīng)的科學(xué)” 。機器學(xué)習(xí):定義機器學(xué)習(xí)已經(jīng)有了十分廣泛的應(yīng)用,例如:數(shù)據(jù)挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語
2、音和手寫識別、戰(zhàn)略游戲和機器人運用。機器學(xué)習(xí):應(yīng)用機器學(xué)習(xí):應(yīng)用監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)機器學(xué)習(xí)算法統(tǒng)計分類回歸分析聚類關(guān)聯(lián)規(guī)則機器學(xué)習(xí)算法分類監(jiān)督學(xué)習(xí)算法:統(tǒng)計分類監(jiān)督學(xué)習(xí)算法:回歸分析監(jiān)督學(xué)習(xí)算法特征n目標(biāo)訓(xùn)練集特征n目標(biāo)特征n目標(biāo)特征1特征1特征1監(jiān)督學(xué)習(xí)算法:訓(xùn)練/學(xué)習(xí)身高發(fā)長抽煙性別1.881.4cm是男1.6615.3cm否女1.7822.6cm否女監(jiān)督學(xué)習(xí)算法特征n測試集特征n特征n特征1特征1特征1結(jié)果目標(biāo)目標(biāo)目標(biāo)監(jiān)督學(xué)習(xí)算法:預(yù)測身高發(fā)長抽煙1.660cm是1.765.1cm否1.5514.4cm否性別男男女統(tǒng)計分類特征n測試集特征1結(jié)果離散值監(jiān)督學(xué)習(xí)算法:分類?回歸?回歸分析特征
3、n特征1連續(xù)值離散值連續(xù)值決策樹KNN邏輯回歸監(jiān)督學(xué)習(xí)算法樸素貝葉斯神經(jīng)網(wǎng)絡(luò)監(jiān)督學(xué)習(xí)算法隨機森林SVM算法優(yōu)化AdaBoost遺傳算法監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)機器學(xué)習(xí)算法統(tǒng)計分類回歸分析聚類關(guān)聯(lián)規(guī)則機器學(xué)習(xí)算法分類無監(jiān)督學(xué)習(xí)算法:聚類無監(jiān)督學(xué)習(xí)算法:關(guān)聯(lián)規(guī)則刮風(fēng)降溫降雨冰雹111011001000101001111100刮風(fēng)降溫降雨冰雹111011001000101001111100-監(jiān)督-統(tǒng)計分類-無監(jiān)督-關(guān)聯(lián)規(guī)則無監(jiān)督學(xué)習(xí)算法特征n訓(xùn)練集特征n特征n特征1特征1特征1無監(jiān)督學(xué)習(xí)算法:訓(xùn)練/學(xué)習(xí)監(jiān)督學(xué)習(xí)算法特征n測試集特征n特征n特征1特征1特征1結(jié)果目標(biāo)目標(biāo)目標(biāo)無監(jiān)督學(xué)習(xí)算法:預(yù)測無監(jiān)督學(xué)習(xí)算法
4、K-meansBIRCHApriori研究方法概念學(xué)習(xí)資料優(yōu)化算法(變體/高級)基本算法程序?qū)嵺`(樣本優(yōu)化)容易理解的算法邏輯核心的數(shù)學(xué)原理特色/優(yōu)缺點主要應(yīng)用方向?qū)W習(xí)內(nèi)容講課要求學(xué)習(xí)內(nèi)容和講課要求其他特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)n預(yù)處理特征樣本集原始樣本集機器學(xué)習(xí)算法訓(xùn)練預(yù)測輸出驗證集評價目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n訓(xùn)練集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n驗證集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)預(yù)測目標(biāo)預(yù)測目標(biāo)預(yù)測目標(biāo)機器學(xué)習(xí)實施過程改進(jìn)特征不顯著怎么辦?-人腦戰(zhàn)勝電腦,分析并提取出樣本的數(shù)據(jù)特征時間用戶ID商品ID操作1月1日001001點擊1月2日002002收藏1月3日0
5、01001購買1月3日001004點擊1月5日002005點擊1月6日002006購買特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)n特征樣本集原始樣本集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征提取統(tǒng)計分析變換特征運算時間用戶ID商品ID操作1月1日001001點擊1月2日002002收藏1月3日001001購買1月3日001004點擊1月5日002005點擊1月6日002006購買用戶ID商品ID點擊次數(shù)操作日期購買日期00100123300100413NULL00200212NULL00200515NULL002006166噪聲太多導(dǎo)致算法過擬合怎么辦?-預(yù)處理,過濾噪聲年齡肝臟大小體重肝硬化231060
6、kg否78865kg否36555kg否341380kg否13743kg否461175kg是22863kg否29859kg否581071kg否特征1n預(yù)處理特征樣本集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n訓(xùn)練集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n驗證集目標(biāo)特征1n目標(biāo)預(yù)處理過濾采樣劃分集合特征1n目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n目標(biāo)單一算法受局限怎么辦?-算法迭代、融合-重新考慮新特征訓(xùn)練特征1n訓(xùn)練集1目標(biāo)特征1n目標(biāo)特征1n目標(biāo)算法融合:訓(xùn)練特征1n訓(xùn)練集2目標(biāo)特征1n目標(biāo)特征1n目標(biāo)機器學(xué)習(xí)算法A預(yù)測特征1n訓(xùn)練集2預(yù)測目標(biāo)特征1n預(yù)測目標(biāo)特征1n預(yù)測目標(biāo)目標(biāo)目標(biāo)目標(biāo)輸出算法
7、融合:訓(xùn)練機器學(xué)習(xí)算法B特征1n訓(xùn)練集2預(yù)測目標(biāo)特征1n預(yù)測目標(biāo)特征1n預(yù)測目標(biāo)目標(biāo)目標(biāo)目標(biāo)訓(xùn)練算法A訓(xùn)練算法融合算法B算法C算法D特征1n驗證集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n訓(xùn)練集1目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n訓(xùn)練集2目標(biāo)特征1n目標(biāo)特征1n目標(biāo)預(yù)測特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)n預(yù)處理特征樣本集原始樣本集機器學(xué)習(xí)算法訓(xùn)練預(yù)測輸出驗證集評價目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n訓(xùn)練集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)特征1n驗證集目標(biāo)特征1n目標(biāo)特征1n目標(biāo)預(yù)測目標(biāo)預(yù)測目標(biāo)預(yù)測目標(biāo)機器學(xué)習(xí)實施過程改進(jìn)統(tǒng)計分析特征提取算法原理融合方法樣本構(gòu)造理論實踐算法選擇優(yōu)化算法(變體/高級)基本算法程序?qū)嵺`(樣本優(yōu)化)容易理解的算法邏輯核心的數(shù)學(xué)原理特色/優(yōu)缺點主要應(yīng)用方向?qū)W習(xí)內(nèi)容講課要求學(xué)習(xí)內(nèi)容和講課要求其他研究方法概念學(xué)習(xí)資料機器學(xué)習(xí),Mitchell 著, 機械工業(yè)出版社;機器學(xué)習(xí)實戰(zhàn),Peter Harrington著;人民郵電出版社統(tǒng)計學(xué)完全教程, (美)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 平衡訓(xùn)練新方法
- 距骨骨折合并下肢血管損傷的手術(shù)策略優(yōu)化研究-洞察及研究
- 免疫治療對腫瘤細(xì)胞耐藥性的影響-洞察及研究
- 2026年考試題自動化儀表維修知識測試題庫
- 網(wǎng)絡(luò)彈性防護(hù)策略
- 未來五年聲學(xué)測量儀器企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略分析研究報告
- 未來五年遺囑公證服務(wù)企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略分析研究報告
- 未來五年校辦企業(yè)管理服務(wù)企業(yè)縣域市場拓展與下沉戰(zhàn)略分析研究報告
- 2025河南鄭州航空港鄭飛特種裝備招聘4人備考題庫及答案詳解一套
- 2025云南昆明市第三人民醫(yī)院“鳳凰引進(jìn)計劃”高層次人才招引備考題庫及1套參考答案詳解
- 河南豫能控股股份有限公司及所管企業(yè)2026屆校園招聘127人考試備考題庫及答案解析
- 2026浙江寧波市鄞州人民醫(yī)院醫(yī)共體云龍分院編外人員招聘1人筆試參考題庫及答案解析
- (2025年)新疆公開遴選公務(wù)員筆試題及答案解析
- 物業(yè)管家客服培訓(xùn)課件
- 直銷公司旅游獎勵方案
- 中央空調(diào)多聯(lián)機施工安全管理方案
- 2026年當(dāng)兵軍事理論訓(xùn)練測試題及答案解析
- 有關(guān)中國居民死亡態(tài)度的調(diào)查報告
- 核對稿100和200單元概述
- 醫(yī)學(xué)統(tǒng)計學(xué)(12)共143張課件
- 特種設(shè)備安全檢查臺賬
評論
0/150
提交評論