版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章
Logistic回歸學(xué)習(xí)目標(biāo)理解Logistic回歸的基本原理掌握利用Scikit-learn庫(kù)進(jìn)行Logistic回歸的基本方法掌握Scikit-learn庫(kù)Logistic回歸模塊常用參數(shù)、屬性與方法的使用123目錄頁(yè)4.1基本原理4.2應(yīng)用實(shí)例Logistic回歸4.1基本原理線性回歸主要研究因變量(與待求解問(wèn)題相關(guān)取值)和自變量(與待求解問(wèn)題相關(guān)的特征)之間是否存在線性關(guān)系的問(wèn)題。事實(shí)上,因變量與自變量之間的線性關(guān)系僅是為簡(jiǎn)化問(wèn)題復(fù)雜度所做的假設(shè)或?yàn)榍蠼鈴?fù)雜模型的初始探測(cè),因而,線性回歸在實(shí)際中不但不易獲得較好的效果,而且不易直接應(yīng)用于分類問(wèn)題的求解或應(yīng)用于分類問(wèn)題求解時(shí)易導(dǎo)致不可靠的結(jié)果。4.1.1基本概念針對(duì)線性回歸存在的問(wèn)題,一個(gè)直接的解決方法是對(duì)因變量進(jìn)行非線性映射以使其取值具有特定的含義;Logistic回歸即是在線性回歸的基礎(chǔ)上通過(guò)Sigmoid函數(shù)變換而構(gòu)成的分類方法。Sigmoid函數(shù)4.1.1基本概念
4.1.2數(shù)學(xué)模型與求解
4.1.2數(shù)學(xué)模型與求解
4.1.2數(shù)學(xué)模型與求解
4.1.2數(shù)學(xué)模型與求解
4.2應(yīng)用實(shí)例Scikit-learn庫(kù)包含Logistic回歸模塊及相關(guān)數(shù)據(jù)集線性回歸模塊的引入方式:fromsklearn.linear_modelimportLogisticRegression函數(shù)原型:LogisticRegression(penalty='l2',dual=False,tol=0.0001,C=1.0,fit_intercept=True,intercept_scaling=1,class_weight=None,random_state=None,solver='liblinear',max_iter=100,multi_class='ovr',verbose=0,warm_start=False,n_jobs=1)4.2.1分類可視化Logistic回歸分析算法主要用于解決兩類樣本分類問(wèn)題,當(dāng)相關(guān)樣本包含兩個(gè)特征時(shí),兩類樣本之間的分類邊界實(shí)為二維坐標(biāo)系下的一條直線;對(duì)樣本與分類邊界進(jìn)行可視化有利于理解Logistic回歸分析原理與性能。(1)問(wèn)題描述首先構(gòu)造特征數(shù)量及類別數(shù)據(jù)均為2的仿真數(shù)據(jù),然后利用Logistic回歸模型實(shí)現(xiàn)樣本的預(yù)測(cè)與兩類樣本分類界線的可視化(2)編程實(shí)現(xiàn)見4.2.1分類可視化.py4.2.1分類可視化(3)結(jié)果分析以上代碼運(yùn)行結(jié)果如下。預(yù)測(cè)精度:0.944.2.2鳶尾花識(shí)別根據(jù)植物的特征對(duì)其所屬類別進(jìn)行識(shí)別有助于提高人們對(duì)植物的認(rèn)識(shí)或輔助研究者對(duì)植物特征及其類別之間的相關(guān)性進(jìn)行分析。(1)問(wèn)題描述Scikit-learn庫(kù)中的鳶尾花數(shù)據(jù)集包含三種類別,選擇前兩類并利用Logistic回歸算法完成以下實(shí)驗(yàn):①對(duì)鳶尾花樣本進(jìn)行分類并求取相應(yīng)模型的精度。②對(duì)比L1正則化與L2正則化在C值為0.02時(shí)模型參數(shù)變化及預(yù)測(cè)精度。(2)編程實(shí)現(xiàn)見4.2.2鳶尾花識(shí)別.py4.2.2鳶尾花識(shí)別(3)運(yùn)行結(jié)果數(shù)據(jù)基本信息:(100,4);Class_1:50;Class_2:50特征名稱:['sepallength(cm)','sepalwidth(cm)','petallength(cm)','petalwidth(cm)']前10個(gè)樣本的預(yù)測(cè)概率:[[0.959253480.04074652][0.004738790.99526121][0.980644550.01935545][0.009669360.99033064][0.009378430.99062157][0.124893580.87510642][0.983289260.01671074][0.006001180.99399882]
[0.004916330.99508367][0.023464010.97653599]]前10個(gè)樣本的預(yù)測(cè)概率:[0101110111]前10個(gè)樣本的預(yù)測(cè)精度:1.0L1正則化系數(shù):[[0.0.0.078426570.]]非零L1正則化系數(shù):[1]L2正則化系數(shù):[[-0.08598023-0.360591510.565874290.2397033]]非零L2正則化系數(shù):[4]4.2.2鳶尾花識(shí)別(3)運(yùn)行結(jié)果Logistic回歸算法既可用于兩類分類問(wèn)題的求解,也可用于預(yù)測(cè)事件發(fā)生的概率;在此例中,其預(yù)測(cè)了樣本所屬兩類別的概率并從中選擇最大者作為最終預(yù)測(cè)的類別,精度較高。L1與L2正則化相應(yīng)的精度對(duì)比4.2.3乳腺癌預(yù)測(cè)(1)問(wèn)題描述利用Scikit-learn庫(kù)乳腺癌數(shù)據(jù)集(包含細(xì)胞厚度、細(xì)胞大小、形狀等30個(gè)特征)完成以下實(shí)驗(yàn):①對(duì)特征數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。②利用L2正則化進(jìn)行特征提取并對(duì)比特征提取前后的相應(yīng)模型的預(yù)測(cè)精度。③確定最優(yōu)C值并構(gòu)建乳腺癌預(yù)測(cè)模型并評(píng)估其預(yù)測(cè)精度。(2)編程實(shí)現(xiàn)見4.2.3乳腺癌預(yù)測(cè).py4.2.3乳腺癌預(yù)測(cè)(3)結(jié)果分析數(shù)據(jù)基本信息:(569,30);Cancer_No:357;Cancer_Yes:212特征名稱:['meanradius''meantexture''meanperimeter''meanarea''meansmoothness''meancompactness''meanconcavity''meanconcavepoints''meansymmetry''meanfractaldimension''radiuserror''textureerror''perimetererror''areaerror''smoothnesserror''compactnesserror''concavityerror''concavepointserror''symmetryerror''fractaldimensionerror''worstradius''worsttexture''worstperimeter''worstarea''worstsmoothness''worstcompactness''worstconcavity''worstconcavepoints''worstsymmetry''worstfractaldimension']預(yù)測(cè)精度:0.9440559440559441特征提取前模型精度最高值及對(duì)應(yīng)的C值:0.99058693244739760.51特征提取后模型精度最高值及對(duì)應(yīng)的C值:0.9905315614617945.01訓(xùn)練數(shù)據(jù)相應(yīng)的精度:0.9859357696566999測(cè)試數(shù)據(jù)相應(yīng)的精度:0.95857142857142854.2.3乳腺癌預(yù)測(cè)(3)結(jié)果分析
本章小結(jié)Logistic回歸將線性回歸的輸出通過(guò)非線性映射的方式變
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安徽建筑大學(xué)《產(chǎn)品設(shè)計(jì)》2024 - 2025 學(xué)年第一學(xué)期期末試卷
- 安徽工業(yè)大學(xué)《環(huán)境影響評(píng)價(jià)》2024 - 2025 學(xué)年第一學(xué)期期末試卷
- 2026上海市農(nóng)業(yè)科學(xué)院招聘35人備考題庫(kù)(第一批)附答案詳解(滿分必刷)
- 2026北京航空航天大學(xué)航空科學(xué)與工程學(xué)院聘用編人機(jī)交互項(xiàng)目開發(fā)科研助理F崗招聘2人備考題庫(kù)及答案詳解(奪冠系列)
- 協(xié)議責(zé)任履行承擔(dān)保證承諾書9篇范文
- 多層辦公樓物業(yè)管理合作協(xié)議
- 2026山東發(fā)展智慧園區(qū)投資有限公司派遣制財(cái)務(wù)出納崗招聘的1人備考題庫(kù)含答案詳解(綜合題)
- 2026年2月江蘇省蘇北人民醫(yī)院招聘高層次人才27人備考題庫(kù)含答案詳解(綜合題)
- 環(huán)保材料研發(fā)生產(chǎn)技術(shù)合作合同
- 2025-2026福建福州市馬尾區(qū)教育局研究生專場(chǎng)招聘12人備考題庫(kù)附答案詳解(達(dá)標(biāo)題)
- 老友記電影第十季中英文對(duì)照劇本翻譯臺(tái)詞
- 2025年黑龍江省大慶市檢察官逐級(jí)遴選筆試題目及答案
- 國(guó)保秘密力量工作課件
- 影視分鏡師合同范本
- 腫瘤患者凝血功能異常日間手術(shù)凝血管理方案
- 2025年銀行柜員年終工作總結(jié)(6篇)
- 電力工程質(zhì)量保修承諾書(5篇)
- 英語(yǔ)詞根詞綴詞匯教學(xué)全攻略
- 胰腺炎華西中醫(yī)治療
- T-GDDWA 001-2023 系統(tǒng)門窗應(yīng)用技術(shù)規(guī)程
- 液壓計(jì)算(37excel自動(dòng)計(jì)算表格)
評(píng)論
0/150
提交評(píng)論