版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
STATISTICSRegressionAnalysis超級干貨:一文讀懂回歸分析超級干貨一文讀懂回歸分析匯報人:MOYANRegressionCONTENTS什么是回歸分析回歸分析方法如何選擇回歸模型回歸設(shè)計常用軟件0102040301什么是回歸分析RegressionAnalysis回歸是由英國的高爾頓(生物學(xué)家達(dá)爾文的表弟)在研究人類遺傳問題時提出來的概念。弗朗西斯·高爾頓FrancisGalton1822年2月16日-1911年1月17日回歸:即自變量與因變量之間關(guān)系的分析方法。RegressionPIONEERFrancisGalton英國著名統(tǒng)計學(xué)家回歸Regression最先應(yīng)用統(tǒng)計方法研究兩個變量之間關(guān)系問題的人FrancisGalton回歸的由來高爾頓致力研究父母身高與兒女身高之間關(guān)系:發(fā)現(xiàn)雖然有一個趨勢,父母高,兒女也高;父母矮,兒女也矮。但從平均意義上說,給定父母的身高,兒女的身高卻趨同于或者說回歸于總?cè)丝诘钠骄砀?。兒輩身高的“回歸”到中等身高,這就是回歸一詞的最初由來?;貧w分析研究問題確定Y與X間的定量關(guān)系表達(dá)式,即回歸方程對求得的回歸方程的可信度進行檢驗判斷自變量X對因變量Y有無影響利用所求得的回歸方程進行預(yù)測和控制Regression02回歸分析方法RegressionAnalysisLinearRegression回歸分析方法·線性回歸LinearRegression
因變量Y
x自變量線性回歸使用最佳的擬合直線(也就是回歸線)建立因變量(Y)和一個或多個自變量(X)之間的聯(lián)系回歸線函數(shù)一元線性回歸案例LogisticRegressionLogisticRegression邏輯回歸(LogisticRegression)是一種用于解決二分類(0or1)問題的機器學(xué)習(xí)方法,用于估計某種事物的可能性。實際上他是一種分類算法。
Sigmoid函數(shù)邏輯回歸重點是判定邊界用以對不同類別的數(shù)據(jù)分割的邊界,邊界的兩旁應(yīng)該是不同類別的數(shù)據(jù)。回歸分析方法·邏輯回歸回歸分析方法多項式回歸逐步回歸嶺回歸套索回歸RidgeRegressionLassoRegressionPolynomialRegressionStepwiseRegressionLogisticRegression對于一個回歸方程,如果自變量的指數(shù)大于1,那么它就是多項式回歸方程當(dāng)數(shù)據(jù)之間存在多重共線性(自變量高度相關(guān))時,就需要使用嶺回歸分析類似于嶺回歸,Lasso也會就回歸系數(shù)向量給出懲罰值項在處理多個自變量時,可以使用這種形式的回歸03如何選擇回歸模型RegressionAnalysisLogisticRegression選擇模型考量因素掌握多種回歸模型時,基于自變量和因變量的類型、數(shù)據(jù)的維數(shù)以及數(shù)據(jù)的其它基本特征去選擇最合適的技術(shù)非常重要。選擇正確的回歸模型時需要考慮的主要因素如下:識別變量數(shù)據(jù)探索是構(gòu)建預(yù)測模型的不可或缺的部分?jǐn)M合優(yōu)點比較不同模型的擬合優(yōu)點,分析不同的指標(biāo)參數(shù)交叉驗證交叉驗證是評估預(yù)測模型最好的方法混合變量數(shù)據(jù)集中存在是多個混合變量,不選擇自動模型目的導(dǎo)向所選擇的回歸技術(shù)也取決于你的目的回歸正則化在高維數(shù)據(jù)和數(shù)據(jù)集變量之間存在多重共線性的情況下運行良好。診斷回歸分析結(jié)果自變量與因變量是否具有預(yù)期的關(guān)系自變量對模型是否有幫助殘差是否有空間聚類模型是否出現(xiàn)了傾向性自變量中是否存在冗余評估模型的性能LogisticRegression預(yù)測步驟LogisticRegressionSTEP01STEP05STEP02STEP03STEP04步驟確定變量建立預(yù)測模型進行相關(guān)分析計算預(yù)測誤差確定預(yù)測值利用回歸分析預(yù)測未來趨勢步驟ATENTION正確應(yīng)用回歸分析預(yù)測時應(yīng)注意①用定性分析判斷現(xiàn)象之間的依存關(guān)系②避免回歸預(yù)測的任意外推③應(yīng)用合適的數(shù)據(jù)資料04回歸設(shè)計常用軟件RegressionAnalysis可用性數(shù)據(jù)管理文件管理統(tǒng)計分析容量提供良好的用戶界面、靈活的處理方式和簡明的語句或命令數(shù)據(jù)錄人、核查、修改、轉(zhuǎn)換和選擇數(shù)據(jù)文件/程序文件/結(jié)果文件等的建立/存取/修改/合并統(tǒng)計分析方法的計算機程序數(shù)量和種類決定了數(shù)據(jù)處理的深度統(tǒng)計軟件至少能同時進行不小于10個變量的上千個數(shù)據(jù)點的分析/綜合/對比與預(yù)測統(tǒng)計軟件是對回歸方案設(shè)計、試驗數(shù)據(jù)處理、回歸設(shè)計成果的應(yīng)用分析的支撐LogisticRegression0102030405統(tǒng)計軟件的選用原則統(tǒng)計軟件是對回歸方案設(shè)計、試驗數(shù)據(jù)處理、回歸設(shè)計成果的應(yīng)用分析的支撐回歸設(shè)計常用軟件LogisticRegressionSAS軟件系統(tǒng)Excel軟件Statistica軟件SPSS軟件R軟件學(xué)習(xí)資料《實用回歸分析》《應(yīng)用多元統(tǒng)計分析》該書從數(shù)據(jù)出發(fā),不是從假設(shè)、定理出發(fā);從歸納出發(fā),不是從演繹出法;強調(diào)案例分析;重統(tǒng)計思想的闡述,弱化數(shù)學(xué)證明的推導(dǎo)。編著:何曉群編著:高惠璇該書將多元統(tǒng)計方法的介紹與在計算機上實現(xiàn)這些方法的統(tǒng)計軟件(SAS系統(tǒng))結(jié)合起來,不僅可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省南京市聯(lián)合體2025-2026學(xué)年上學(xué)期期末九年級物理試卷(含答案)
- 黑龍江省龍東十校聯(lián)盟2025-2026學(xué)年高一(上)期末物理試卷(含答案)
- 廣東省深圳市南山區(qū)2025-2026學(xué)年上學(xué)期七年級1月期末數(shù)學(xué)試題(含答案)
- 2025-2026學(xué)年安徽省合肥45中八年級上冊(數(shù)學(xué)HK)期末試卷(無答案)
- 微觀經(jīng)濟學(xué)試題及答案
- 科幻文學(xué)溯源:從舶來品到本土化
- 2022-2023年人教版七年級數(shù)學(xué)上冊期末測試卷及參考答案
- 邊檢業(yè)務(wù)培訓(xùn)課件
- 初升高自主招生研討:初升高自主招生研討-方程與不等式(答案)
- 書讓我陶醉作文
- 鐵路勞動安全 課件 第一篇 安全基礎(chǔ)
- 防風(fēng)卷簾門施工合同樣本
- JJF 2137-2024表面鉑電阻溫度計校準(zhǔn)規(guī)范
- GB/T 4706.59-2024家用和類似用途電器的安全第59部分:口腔衛(wèi)生器具的特殊要求
- 華聯(lián)管理制度
- GB 25038-2024鞋類通用安全要求
- HG-T+20615-2009鋼制管法蘭(Class系列)
- 道路交通安全道路交通安全培訓(xùn)課件
- 2024-2030中國高壓輥磨機市場現(xiàn)狀研究分析與發(fā)展前景預(yù)測報告
- 校園規(guī)劃設(shè)計方案說明書
- 部隊冬季預(yù)防訓(xùn)練傷
評論
0/150
提交評論