下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、回歸分析的基本思想及其初步應(yīng)用知識梳理一線性回歸方程的確定如果一組具有相關(guān)關(guān)系的數(shù)據(jù)作出散點(diǎn)圖大致分布在一條直線附近,那么我們稱這樣的變量之間的關(guān)系為線性相關(guān)關(guān)系(也稱一元線性相關(guān)),這條直線就是回歸直線,記為那么如何求得參數(shù)使得各點(diǎn)與此直線的距離的平方和為最小,即如何求得線性回歸方程呢? 在所求回歸直線方程中,當(dāng)取時(shí),與實(shí)際收集到的數(shù)據(jù)之間的偏差為,偏差的平方為(如圖1). 即 來刻畫出個(gè)點(diǎn)與回歸直線在整體上的偏差的平方和,顯然Q取最小值時(shí)的的值就是我們所求的: 其中為樣本數(shù)據(jù),為樣本平均數(shù),稱為樣本點(diǎn)中心,且所求線性回歸直線經(jīng)過樣本點(diǎn)中心(如圖2所示) 當(dāng)回歸直線斜率時(shí),為線性正相關(guān), 時(shí)
2、為線性負(fù)相關(guān).y 圖1 應(yīng)注意,這個(gè)最小距離不是通常所指的各數(shù)據(jù)的點(diǎn)到直線的距離,而是各數(shù)據(jù)點(diǎn)沿平行y軸方向到直線的距離(如圖1所示) y圖2對于上面參數(shù)的求法原理及方法是簡單的,但是運(yùn)算量較大,需要將展開,再合并,然后配方整理,從而求得. 例如,當(dāng)取怎樣實(shí)數(shù)時(shí), 的值為最小,顯然當(dāng)時(shí)最小值為,像這樣配方求最值的方法是經(jīng)常用到的, 線性回歸方程中的參數(shù)就是這樣求出的. 教材中用了添項(xiàng)法較為簡捷的求出了截距和斜率分別是使取最小值時(shí)的值求得,的值,請同學(xué)們體會(huì)其解法線性回歸方程的確定是進(jìn)行回歸分析的基礎(chǔ)二回歸分析:是對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法線性相關(guān)關(guān)系的強(qiáng)弱兩個(gè)變量之間線
3、性相關(guān)關(guān)系的樣本相關(guān)系數(shù)衡量線性相性關(guān)系的強(qiáng)弱,由于分子與斜率的分子一樣,因此,當(dāng)時(shí),兩個(gè)變量正相關(guān);當(dāng)時(shí)兩個(gè)變量負(fù)相關(guān)當(dāng)?shù)慕^對值接近,表明兩個(gè)變量的線性相關(guān)性很強(qiáng);當(dāng)?shù)慕^對值接近,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系規(guī)定當(dāng)時(shí),我們認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系解釋變量與隨機(jī)誤差對預(yù)報(bào)精度的影響以及殘差分析(1)有關(guān)概念圖3 y線性回歸模型其中和為模型的未知參數(shù);稱為解釋變量,稱為預(yù)報(bào)變量;是與之間的誤差,叫隨機(jī)誤差。隨機(jī)誤差的估計(jì)值為稱為相應(yīng)于樣本點(diǎn)的殘差(如圖)(2)隨機(jī)誤差的方差估計(jì)值衡量回歸方程的預(yù)報(bào)精度由于隨機(jī)誤差的均值0,因此,可以用隨機(jī)誤差的方差估計(jì)值(其中,殘差平方和為)衡
4、量回歸方程的預(yù)報(bào)精度,顯然越小,預(yù)報(bào)精度越高。(3)通過殘差分析判斷模型擬合效果由計(jì)算出殘差,然后選取橫坐標(biāo)為編號、或解釋變量或預(yù)報(bào)變量,縱坐標(biāo)為殘差作出殘差圖通過圖形分析,如果樣本點(diǎn)的殘差較大,就要分析樣本數(shù)據(jù)的采集是否有錯(cuò)誤;另一方面,可以通過殘差點(diǎn)分布的水平帶狀區(qū)域的寬窄,說明模型擬合效果,反映回歸方程的預(yù)報(bào)精度3相關(guān)指數(shù)反應(yīng)模型的擬合效果 (1)變量理解: 為總偏差平方和,表示解釋變量和隨機(jī)誤差產(chǎn)生的總的效應(yīng);為殘差平方和,表示了隨機(jī)誤差效應(yīng);,表示了解釋變量效應(yīng)()模型擬合效果,反映了隨機(jī)誤差對預(yù)報(bào)變量(總效應(yīng))的貢獻(xiàn)率;反映了解釋變量對預(yù)報(bào)變量(總效應(yīng))的貢獻(xiàn)率; 因此,越接近(即
5、越接近0),表示回歸的效果越好,即解釋變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng)三非線性回歸的問題轉(zhuǎn)化為線性回歸問題圖4(1)作散點(diǎn)圖確定曲線模型根據(jù)收集的數(shù)據(jù)作散點(diǎn)圖(如圖),可見兩個(gè)變量不呈線性相關(guān)關(guān)系而是分布在某一條指數(shù)函數(shù)曲線的周圍,也可以認(rèn)為樣本點(diǎn)集中在某二次曲線的附近(2)非線性轉(zhuǎn)化為線性這時(shí)通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系;通過換元把二次函數(shù)關(guān)系變換為線性關(guān)系在這兩種情況下就可以利用線性回歸模型,建立和之間的非線性回歸方程了 (3)比較兩種模型的擬合效果對于給定的樣本點(diǎn)可以通過轉(zhuǎn)換后的對應(yīng)數(shù)表作散點(diǎn)圖來確定線性回歸的擬合情況,判斷選用哪一種曲線模型較為合適;可以通過原始數(shù)據(jù)及和之間的非線性回歸方程列
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全隱患大排查大整治行動(dòng)工作方案
- 數(shù)學(xué)競賽與高中數(shù)學(xué)課程內(nèi)容整合研究教學(xué)研究課題報(bào)告
- 必修課核素教學(xué)設(shè)計(jì)與實(shí)操指導(dǎo)
- 部編版小學(xué)語文教案設(shè)計(jì)與課堂模擬
- 二年級小學(xué)語文修辭手法專項(xiàng)測試題
- 企業(yè)品牌視覺設(shè)計(jì)規(guī)范
- 建筑資質(zhì)申報(bào)流程及材料準(zhǔn)備全攻略
- 聾校一年級語文授課教案
- 小學(xué)計(jì)算機(jī)基礎(chǔ)操作練習(xí)題
- 幼兒數(shù)學(xué)基礎(chǔ)訓(xùn)練作業(yè)冊
- 2025年榆林市住房公積金管理中心招聘(19人)筆試考試備考題庫及答案解析
- 2025年常山縣機(jī)關(guān)事業(yè)單位公開招聘編外人員43人筆試考試參考試題及答案解析
- 2025年常州信息職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫附答案
- 2025年云南省人民檢察院聘用制書記員招聘(22人)模擬筆試試題及答案解析
- 2025年黨的基礎(chǔ)知識題庫及答案入黨理論知識考試試題
- 運(yùn)動(dòng)員退役協(xié)議書
- GB/T 38082-2025生物降解塑料購物袋
- 2025年10月自考02275計(jì)算機(jī)基礎(chǔ)與程序設(shè)計(jì)試題及答案版
- 2026國網(wǎng)寧夏電力有限公司招聘高校畢業(yè)生統(tǒng)一考試(第一批)備考題庫及答案詳解(網(wǎng)校專用)
- 探放水工崗位作業(yè)風(fēng)險(xiǎn)專項(xiàng)培訓(xùn)講義
- 2025甘肅酒泉市公安局招聘留置看護(hù)崗位警務(wù)輔助人員30人(第三批)筆試考試備考試題及答案解析
評論
0/150
提交評論