版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
計算與人工智能概論第7章智能學習目錄監(jiān)督學習半監(jiān)督學習31無監(jiān)督學習13223監(jiān)督學習1PART監(jiān)督學習——定義模型訓練數(shù)據(jù)類別標記(label)訓練?=是新數(shù)據(jù)樣本(劉二,公務員,8萬,?)…,類別標記未知使用學習算法(learningalgorithm)回歸分類圖1.房屋屬性和價格之間的關聯(lián)圖2.腫瘤分類案例預測結果為連續(xù)值預測結果為離散值監(jiān)督學習——任務分類回歸與分類是監(jiān)督學習領域的兩個主要任務回歸處理過程問題分解發(fā)現(xiàn)各個房屋屬性與房屋價格之間的關聯(lián);選取合適的房屋屬性來預測房屋的價格模式識別通過繪圖表示房屋屬性和房屋價格之間的關聯(lián)以預測房屋價格為例回歸是用模型來擬合一組正確的訓練數(shù)據(jù),以便對未知的連續(xù)變量進行預測。問題抽象為模型學習某條最優(yōu)的線(回歸線)或者某個最優(yōu)的超平面(回歸超平面),使得已存在的數(shù)據(jù)盡可能地分布在這條線或者這個超平面的周圍。算法設計設計回歸方程:采用線性回歸、多項式回歸等算法回歸處理過程問題分解發(fā)現(xiàn)各種屬性與腫瘤性質的關聯(lián);選取合適的屬性來預測腫瘤是否為良性模式識別在二維平面上把已有數(shù)據(jù)標注出來,發(fā)現(xiàn)各種屬性與腫瘤性質之間是否存在關聯(lián)以腫瘤分類為例分類處理過程分類用于預測一個離散值或者類別,而不是一系列連續(xù)值屬性。問題抽象為模型學習某條最優(yōu)的線或某個最優(yōu)的超平面,使得已存在的數(shù)據(jù)盡可能地被這條線或這個平面分開來。算法設計采用支持向量機以及決策樹等算法來訓練模型分類處理過程監(jiān)督學習應用領域郵件過濾文本情感分析遙感天氣預測無監(jiān)督學習2PART無監(jiān)督學習—定義模型訓練數(shù)據(jù)無類別標記訓練使用學習算法(learningalgorithm)數(shù)據(jù)的內在結構餐廳名人均消費…等待時間餐廳A¥57…10min餐廳B¥16…4min餐廳C¥108…26min分析研究對象的特征屬性,把相似的研究對象按一定的方式歸為同類無監(jiān)督學習—聚類無監(jiān)督學習—聚類問題分解收集該地段的餐廳信息從數(shù)據(jù)中挖掘出一些有用的特征屬性依據(jù)合適的特征屬性把餐廳歸為幾類,從而發(fā)現(xiàn)該地段缺少的餐廳類型。模式識別把特征相似的對象歸為一類考慮合適的特征屬性可以提高歸類的準確性以構建餐廳需求模型為例無監(jiān)督學習—聚類問題抽象假設指定將餐廳歸為三類,那么問題就轉變?yōu)槟P蛯W習根據(jù)餐廳的特征屬性預測餐廳屬于[0,1,2]三類中的哪一類。算法設計——K-Means算法K-means聚類(不斷迭代過程)隨機選取K個對象作為初始的聚類中心;把每個對象分配給距離它最近的聚類中心;根據(jù)聚類中現(xiàn)有的對象重新計算聚類中心;在得到類別中心下繼續(xù)進行類別劃分;如果連續(xù)兩次的類別劃分結果不變則停止算法;否則循環(huán)2~5。K-means聚類算法無監(jiān)督學習——降維在實際工作中,數(shù)據(jù)維數(shù)通常很高,對計算機計算和存儲能力要求高。什么是降維?降維就是在保留有用的數(shù)據(jù)特征的前提下將高維的數(shù)據(jù)壓縮成低維的數(shù)據(jù),從而提高計算速度和減少存儲。無監(jiān)督學習——降維主成分分析法是一種常用的降維方法,主要思想是利用少數(shù)變量來代替原先的多個變量,將原先的多個變量中的有用的信息提取到幾個變量中。指標1指標2指標3指標4指標5指標6指標7指標8指標9指標10指標11指標12假如有12個可以使用的指標,直接把這12個指標都用于模型訓練不可取指標1指標2指標3指標4指標5指標6指標7指標8指標9指標10指標11指標12這12個指標所包含的信息有很大一部分是重疊的,所以需要預先對這些指標進行整合指標一指標二指標三將12個指標中的一些有用信息提取出來,綜合成3個指標,使得這些指標能夠反映原來的12個指標的大部分信息,從而達到降維的目的。無監(jiān)督學習應用領域用戶細分金融反欺詐投資理財推薦系統(tǒng)半監(jiān)督學習3PART半監(jiān)督學習監(jiān)督學習:目的明確需要標記數(shù)據(jù)能夠根據(jù)結果來衡量效果無監(jiān)督學習:沒有明確的目的不需要借助人工標簽和反饋等信息數(shù)據(jù)沒有標簽,很難量化模型的學習效果然而現(xiàn)實場景更多的是:我們能獲得少量的標記數(shù)據(jù)和大量的未標記數(shù)據(jù)。半監(jiān)督學習半監(jiān)督學習在監(jiān)督學習中,因為只給出了兩個有標簽的樣本(-1,-)和(1,+),那么從圖中可以看出最佳決策邊界是x=0,這就意味著對于所有的樣本,x<0被分類為負,x>0被分類為正。半監(jiān)督學習假設每個類的實例都圍繞類的中心,我們可以從無標簽樣本(黑色圓點)中獲得更多的信息。例如,兩個有標簽的樣本并不是類的中心,我們可以重新通過半監(jiān)督學習估計出決策邊界是x=0.3。半監(jiān)督學習——基本流程對少量標記數(shù)據(jù)和大量未標記數(shù)據(jù)進行半監(jiān)督學習的基本流程如下:①利用少量標記數(shù)據(jù)對分類器進行參數(shù)的初始化。②用初始化
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 渠道撈垃圾協(xié)議書
- 蘇聯(lián)停火協(xié)議書
- 苗木綠化協(xié)議書
- 莆田繼承協(xié)議書
- 融投資合同范本
- 視頻素材協(xié)議書
- 認證廉政協(xié)議書
- 設備故障協(xié)議書
- 設施借用協(xié)議書
- 試吃協(xié)議書范本
- 企業(yè)機要管理制度
- T/CWAN 0068-2023銅鋁復合板
- JJG 539-2016 數(shù)字指示秤宣貫材料
- 兒童寓言故事-烏鴉喝水
- 2023年四川省普通高中學業(yè)水平合格性考試物理試題(含答案)
- 弱電系統(tǒng)維護中的安全和文明措施
- 中國高血壓防治指南修訂版解讀培訓課件
- 2024-2025學年青海省西寧市七年級(上)期末英語試卷(含答案)
- 人教川教版三年級上冊生命生態(tài)安全全冊課件
- 后勤服務方案(技術方案)
- 學術交流英語(學術寫作)智慧樹知到期末考試答案2024年
評論
0/150
提交評論