版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1.1回歸分析的基本思想和初步應(yīng)用,必修3(第2章統(tǒng)計(jì)學(xué))知識結(jié)構(gòu),數(shù)據(jù)收集(隨機(jī)抽樣),排序和分析,數(shù)據(jù)估計(jì)和推斷,簡單隨機(jī)抽樣,分層抽樣,系統(tǒng)抽樣,估計(jì)總體和變量與樣本之間的相關(guān)性,估計(jì)總體分布與樣本頻率分布,估計(jì)總體數(shù)字特征與樣本數(shù)字特征,線性回歸分析,綜述,1相關(guān)性:對于兩個(gè)變量,當(dāng)自變量有一定值時(shí),因變量有一定的隨機(jī)性?;仡櫜⑺伎迹合嚓P(guān)性和功能之間有什么區(qū)別?函數(shù)關(guān)系中兩個(gè)變量之間的關(guān)系是確定性關(guān)系,是不確定性關(guān)系,函數(shù)關(guān)系是理想的關(guān)系模型?,F(xiàn)實(shí)生活中有大量的相關(guān)關(guān)系,這是一個(gè)比較普遍的情況。問題2:用什么方法來描述兩個(gè)線性相關(guān)變量之間的關(guān)系?2.最小二乘估計(jì),最小二乘估計(jì)下的線性回
2、歸方程:回歸線必須通過樣本點(diǎn)的中心;3.回歸分析的基本步驟:繪制散點(diǎn)圖,尋找回歸方程,預(yù)測和決策。這種方法被稱為回歸分析?;貧w分析是對兩個(gè)相關(guān)變量進(jìn)行統(tǒng)計(jì)分析的常用方法,它比數(shù)學(xué)3中的“回歸”更有意義。數(shù)理統(tǒng)計(jì)繪制散點(diǎn)圖,了解最小二乘法尋找回歸線性方程ybxa的思想,用回歸線性方程解決應(yīng)用問題,選擇1-2個(gè)統(tǒng)計(jì)案例引入線性回歸模型ybxa,了解模型中隨機(jī)誤差項(xiàng)e的成因,了解相關(guān)指數(shù)R2與模型擬合效果的關(guān)系,了解殘差圖在利用線性回歸模型解決一類非線性回歸問題中的作用。自學(xué)指南,1。結(jié)合實(shí)例1得到線性回歸模型和隨機(jī)誤差。并區(qū)分函數(shù)模型和回歸模型。在線性回歸模型中,E是用bx a預(yù)測真值Y的隨機(jī)誤差
3、,是一個(gè)不可觀測的量,那么我們應(yīng)該如何研究隨機(jī)誤差呢?3:如何發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤?如何衡量隨機(jī)模型的擬合效果?4.結(jié)合實(shí)例1思考:用回歸方程預(yù)測權(quán)重時(shí)應(yīng)該注意什么?5:總結(jié)建立回歸模型的基本步驟。閱讀課本第1頁和第6頁,思考并回答以下問題(注意:時(shí)間是12分鐘)。問題1:結(jié)合實(shí)例1得到線性回歸模型和隨機(jī)誤差。并區(qū)分函數(shù)模型和回歸模型?;貧w方程:由于所有的樣本點(diǎn)并不共線,而只是分散在一條直線上,身高和體重之間的關(guān)系可以用線性回歸模型來表示,其中A和B是模型的未知參數(shù),E稱為隨機(jī)誤差。想想函數(shù)模型和“回歸模型”的區(qū)別,函數(shù)模型:因變量Y完全由自變量X決定回歸模型:預(yù)測變量Y完全由解釋變量(2)決定,
4、忽略了某些因素的影響;(3)觀察誤差。中隨機(jī)誤差項(xiàng)e的原因是什么?問題2:在線性回歸模型中,E是bx a預(yù)測真值Y的隨機(jī)誤差,是一個(gè)不可觀測的量,那么我們應(yīng)該如何研究隨機(jī)誤差呢?結(jié)合實(shí)例1,影響體重的除身高以外的其他因素是不可測量的,所以我們不能期望有某種方法來獲得隨機(jī)誤差的值來提高預(yù)測變量的估計(jì)精度,但是我們可以估計(jì)預(yù)測變量的觀測值中包含的隨機(jī)誤差,這對我們發(fā)現(xiàn)樣本數(shù)據(jù)中的誤差和評估模型是非常有用的,所以我們在這里引入了殘差的概念。e=y-(bx a),問題3:如何發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤?如何衡量隨機(jī)模型的擬合效果?方法一:通過殘差分析可以在原始數(shù)據(jù)中發(fā)現(xiàn)可疑數(shù)據(jù),并判斷所建立模型的擬合效果。殘差
5、圖生成的產(chǎn)生和作用:坐標(biāo)的縱軸是殘差變量,橫軸可以有不同的選擇。它可以被編號;它可以是一個(gè)解釋性變量。功能:判斷模型的適用性。如果模型選擇正確,殘差圖中的點(diǎn)應(yīng)分布在以水平軸為中心的帶狀區(qū)域。下表列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。殘差圖的制作及作用。縱軸坐標(biāo)是剩余變量,橫軸可以有不同的選擇;如果模型選擇正確,殘差圖中的點(diǎn)應(yīng)分布在以水平軸為中心的帶狀區(qū)域;應(yīng)特別注意遠(yuǎn)離水平軸的點(diǎn)。高度和重量殘差圖、注意:第一個(gè)采樣點(diǎn)和第六個(gè)采樣點(diǎn)之間的殘差比較大,因此需要確認(rèn)采集過程中是否存在人為誤差。如果數(shù)據(jù)收集中有錯(cuò)誤,請糾正它,然后重新使用線性回歸模型來擬合數(shù)據(jù);如果數(shù)據(jù)收集沒有錯(cuò)誤,則
6、需要找到其他原因。此外,剩余點(diǎn)均勻地落在水平帶狀區(qū)域,這表明所選模型是合適的。帶狀區(qū)域越窄,模型的擬合精度越高,回歸方程的預(yù)測精度越高。顯然,R2值越大,殘差平方和越小,也就是說,模型擬合效果越好。在線性回歸模型中,R2代表分析變量對預(yù)測變量變化的貢獻(xiàn)率。R2越接近1,回歸效果越好(因?yàn)镽2越接近1,分析變量和預(yù)測變量之間的線性相關(guān)性越強(qiáng))。如果一組數(shù)據(jù)可能采用幾個(gè)不同的回歸方程進(jìn)行回歸分析,我們可以通過比較R2值來做出選擇,即選擇具有較大R2的模型作為這組數(shù)據(jù)的模型。注:相關(guān)指數(shù)R2是衡量模型擬合效果的指標(biāo)。在線性模型中,它代表獨(dú)立變量描述預(yù)測變量的能力。方法2:我們可以用相關(guān)指數(shù)R2來描述
7、回歸的效果,其計(jì)算公式是,從上面可以看出,分析變量對總效果的貢獻(xiàn)約為64%,即R2 0.64,可以描述為“身高決定64%的體重變化”,而機(jī)器誤差貢獻(xiàn)剩余的36%。因此,身高對體重的影響遠(yuǎn)大于隨機(jī)誤差。讓我們使用相關(guān)指數(shù)來分析示例1:問題4結(jié)合實(shí)例1思考用回歸方程預(yù)測權(quán)重時(shí)我們應(yīng)該注意什么?回歸方程只適用于我們研究的整個(gè)樣本。2.我們建立的回歸方程通常具有時(shí)效性。3.樣本值的范圍將影響回歸方程的適用范圍。4.我們不能期望回歸方程得到的預(yù)測值就是預(yù)測變量的精確值。(1)確定研究對象,明確哪個(gè)變量是分析變量,哪個(gè)變量是預(yù)測變量。(2)繪制確定的分析變量和預(yù)測變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等)。)。(3)根據(jù)經(jīng)驗(yàn)確定回歸方程的類型(如果我們觀察到數(shù)據(jù)是線性的,那么選擇線性回歸方程Y=BX A),(4)根據(jù)一定的規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法)。(5)獲得結(jié)果后,分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對應(yīng)的殘差過大,或者殘差呈現(xiàn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑結(jié)構(gòu)加固施工方案示范
- 小學(xué)數(shù)學(xué)分層教學(xué)設(shè)計(jì)方案分享
- 幼兒園繪本閱讀課程實(shí)施方案
- 現(xiàn)代企業(yè)人員績效考核方案模板
- 建筑材料GRG施工詳細(xì)方案
- 少先隊(duì)詩歌朗誦活動方案與指導(dǎo)
- 中小學(xué)教師教學(xué)競賽方案
- 物流配送中心信息化建設(shè)方案
- 眼科激光手術(shù)的法律風(fēng)險(xiǎn)與術(shù)后并發(fā)癥處理
- 眼外傷繼發(fā)性青光眼的早期診斷策略
- 不同時(shí)代的流行音樂
- 醫(yī)療衛(wèi)生機(jī)構(gòu)6S常態(tài)化管理打分表
- 幾種常用潛流人工濕地剖面圖
- vpap iv st說明總體操作界面
- 2023人事年度工作計(jì)劃七篇
- LY/T 1692-2007轉(zhuǎn)基因森林植物及其產(chǎn)品安全性評價(jià)技術(shù)規(guī)程
- GB/T 20145-2006燈和燈系統(tǒng)的光生物安全性
- 長興中學(xué)提前招生試卷
- 安全事故案例-圖片課件
- 螺紋的基礎(chǔ)知識
- 蜂窩煤成型機(jī)課程設(shè)計(jì)說明書
評論
0/150
提交評論