版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、實驗?zāi)康恼莆誷pss繪制散點圖和計算相關(guān)系數(shù)的方法掌握回歸分析的一般步驟和回歸的統(tǒng)計檢驗(包括回歸方程的擬合優(yōu)度檢驗、回歸方程的顯著性檢驗、回歸系數(shù)的顯著性檢驗和殘差分析)二、實驗內(nèi)容1、練習教材中P264案例8-1,通過繪制散點圖,分析家庭收入與打算購買的住房面積存在怎樣的統(tǒng)計關(guān)系,數(shù)據(jù)文件為“住房狀況調(diào)查.sav”圖形→舊對話框→散點圖→簡單分布→定義→把計劃面積放入Y軸;家庭收入放入X軸→確定→查看輸出窗口→說明大部分的數(shù)據(jù)點集中在一定區(qū)域中,有少部分數(shù)據(jù)點“脫離”整體數(shù)據(jù)較遠,家庭收入與計劃購買住房面積之間存在一定正的弱相關(guān)。分析→相關(guān)→雙變量→把家庭收入、計劃面積放入變量框→確定→查看輸出窗口→家庭收入與計劃面積的簡單相關(guān)系數(shù)為0.323,存在弱的正相關(guān)。P=0<0.01=α,認為兩總體不是零相關(guān)。3、練習教材中P309案例9-1,掌握線性回歸分析的基本操作,理解回歸參數(shù)的普通最小二乘估計的原理,掌握回歸方程的擬合優(yōu)度檢驗、回歸方程顯著性檢驗、回歸系數(shù)顯著性檢驗、殘差分析的基本概念、原理和判斷規(guī)則。數(shù)據(jù)文件為“高??蒲醒芯?sav”分析→回歸→線性→把課題總數(shù)放入因變量框;把投入人年數(shù)、投入高級職稱的人數(shù)、投入科研事業(yè)費、專著數(shù)、論文數(shù)、獲獎數(shù)放入自變量框→方法點進入→點統(tǒng)計量→選共線性診斷→繼續(xù)→確定→查看輸出窗口→由于該方程中含有多個變量,所以看調(diào)整R方=0.924,擬合優(yōu)度較高,被解釋變量可以被模型解釋的部分較多,不能被解釋的部分較小。1、容忍度是測量解釋變量間多重共線性的重要統(tǒng)計量。容忍度的取值范圍在0~1之間,越接近于0表示多重共線性越強;越接近于1表示多重共線性越弱。2、方差膨脹因子方差膨脹因子是容忍度的倒數(shù),方差膨脹因子的取值大于等于1。通常,如果膨脹因子大于等于10,說明解釋變量xi與方程中其余解釋變量之間有嚴重的多重共線性。3、特征根和方差比
特征根是診斷解釋變量間是否存在嚴重的多重共線性的另一種有效方法。最大特征根的值遠遠大于其他特征根的值,則說明這些解釋變量間具有相當多的重疊信息,原因是僅通過這一個特征根就基本刻畫出了所有解釋變量的絕大部分信息。解釋變量標準化后它的方差為1。如果某個特征根既能夠刻畫某解釋變量方差的較大部分(0.7以上),同時又可以刻畫另一根解釋變量方差的較大部分,則說明這兩個解釋變量間存在較強的線性相關(guān)關(guān)系。4、條件指數(shù)條件指數(shù)反映解釋變量間多重共線性的指標。當0<=Ki<10時,多重共線性較弱;當10<=Ki<100時,認為多重共線性較強;Ki>=100時,認為多重共線性很強。分析→回歸→線性→把課題總數(shù)放入因變量框;把投入人年數(shù)、投入高級職稱的人數(shù)、投入科研事業(yè)費、專著數(shù)、論文數(shù)、獲獎數(shù)放入自變量框→方法點向后→點統(tǒng)計量→選共線性診斷、殘差的Dubin-Watson→繼續(xù)→確定→查看輸出窗口擬合優(yōu)度的檢驗:經(jīng)過六步,完成回歸方程的建立,最終為第六個模型。隨著解釋變量的不斷減少,方程的擬合優(yōu)度下降了。說明建立回歸方程并不是一味追求高的擬合優(yōu)度為唯一目標的,還要重點考察解釋變量是否對被解釋變量有貢獻。方程的DW檢驗值為1.747,殘差存在一定程度的正自相關(guān)。(P296)第六個模型:P=0<α=0.05,說明投入人年數(shù)與被解釋變量間的線性關(guān)系顯著,它保留在模型中是合理的。最終方程是立項課題數(shù)=-94.524+0.492投入人年數(shù)意味著投入人年數(shù)每增加一個單位會使立項課題數(shù)增加0.492個單位。注:通常情況下,即使常數(shù)項在模型中不顯著,我們也會在模型中保留,去掉它會對模型帶來不利的影響。變量的剔除過程,在模型三中,剔除專著數(shù)的情況下,如果保留投入高級職稱的人年數(shù),那么它的標準化回歸系數(shù)是-0.439,但P=0.343>α,回歸系數(shù)的檢驗不顯著;同理,剔除高級職稱的人年數(shù),如果保留專著數(shù),那么它的標準化回歸系數(shù)是-0.103,但P=0.559>α,回歸系數(shù)的檢驗不顯著。分析→回歸→線性→繪制→選正態(tài)概率圖→繼續(xù)→確定→查看輸出窗口→數(shù)據(jù)點圍繞基準線還存在一定的規(guī)律性。分析→回歸→線性→繪制→把ZRESD放入Y軸、ZPRED放入X軸;繼續(xù)→確定→查看輸出窗口→隨著標準化預測值的變化,殘差點在0線周圍隨機分布,但殘差的等方差性并不完全滿足,方差似乎有增大的趨勢。分析→回歸→線性→保存→在殘差中選標準化,在預測值中選標準化→繼續(xù)→確定→分析→相關(guān)→雙變量→把預測值和殘差值選到變量窗口,相關(guān)系數(shù)選spearman→確定→查看輸出窗口→說明殘差與預測值的spearman等級相關(guān)系數(shù)為-0.176,且P=0.344,檢驗不顯著,因此認為異方差現(xiàn)象并不明顯。分析→回歸→線性→保存,選距離中cook距離,杠桿值→繼續(xù)→確定→查看輸出窗口→沒有發(fā)現(xiàn)強影響點。(庫克距離大于1對應(yīng)的解釋變量為強影響點。杠桿值越高,對應(yīng)的解釋變量就越可能是強影響點)*4、練習教材中P320案例9-2、案例9-3,了解曲線估計的一般原理和操作方法。對應(yīng)的數(shù)據(jù)文件為“年人均消費支出和教育.sav”。散點圖:圖形→舊對話框→散點圖→簡單分布→定義→教育支出放Y軸,年人均消費性支出放X軸→確定→查看輸出窗口→說明兩變量之間呈非線性關(guān)系,可嘗試二次曲線、三次曲線、復合函數(shù)、冪函數(shù)模型。分析→回歸→曲線估計→因變量教育支出;自變量年人均消費性支出→模型選二次項,立方,復合,冪→確定→查看輸出窗口有12個缺失值復合函數(shù)的擬合優(yōu)度高于冪函數(shù),值的增長速度高于冪函數(shù),從居民消費未來趨勢看,教育支出將可能占消費性支出的較大比例,并呈快速增長的趨勢,因此,采用復合函數(shù)。方程是教育支出=20.955×1.0004年人均消費性支出復合函數(shù)、冪函數(shù)的擬合回歸線,說明復合函數(shù)擬合高于冪函數(shù)。分析→回歸→曲線估計→因變量在外就餐;自變量年份→模型選指數(shù)分布,點保存,預測值,預測范圍,觀測值輸入27→繼續(xù)→確定→查看輸出窗口擬合優(yōu)度R方=0.938,比較理想;回歸方程顯著的顯著性檢驗:P=0<0.05,通過檢驗;回歸方程系數(shù)的顯著性檢驗:P=0<0.05,通過檢驗,說明模型可用;回歸方程是在外就餐=12.522*e0.154個案順序在外就餐的擬合回歸線;2003,2004年的預測值分別為683.49853,797.2。二、實驗作業(yè):一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進行基礎(chǔ)設(shè)施建設(shè)、國家重點項目建設(shè)、固定資產(chǎn)投資等項目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,管理者希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)是“例11.6.xls”。試繪制散點圖,并分析不良貸款與貸款余額、累計應(yīng)收貸款、貸款項目個數(shù)、固定資產(chǎn)投資額之間的關(guān)系;計算不良貸款、貸款余額、累計應(yīng)收貸款、貸款項目個數(shù)、固定資產(chǎn)投資額之間的相關(guān)系數(shù);求不良貸款對貸款余額的估計方程;檢驗不良貸款與貸款余額之間線性關(guān)系的顯著性(α=0.05);回歸系數(shù)的顯著性(α=0.05);繪制不良貸款與貸款余額回歸的殘差圖。圖形→散點→矩陣分布→把變量放入矩陣變量中→確定→從圖中看它們之間都有一定的線性關(guān)系。不良貸款與貸款余額的線性關(guān)系比較密切,與固定資產(chǎn)投資最不密切。分析→相關(guān)→雙變量→把要分析的變量放入變量框中→確定→查看輸出窗口→不良貸款與其他變量都屬于正線性相關(guān)關(guān)系,其中與各項貸款余額最密切(r=0.844),與本年度固定資產(chǎn)最不密切(r=0.519)。分析→回歸→線性→把不良貸款放入因變量;各項貸款余額放入自變量→確定→查看輸出窗口→方程是不良貸款余額=-0.830+0.038各項貸款余額R方=0.712,通過擬合優(yōu)度的檢驗;回歸方程的顯著性檢驗,P=0,拒絕原假設(shè),變量之間存在顯著的線性關(guān)系;回歸系數(shù)的顯著性檢驗P=0,拒絕原假設(shè),自變量對因變量有顯著影響,即兩變量之間存在顯著的線性關(guān)系。分析→回歸→線性→保存→選殘差的標準化→圖形→舊對話框→散點→簡單分布→把殘差放到Y(jié)軸,把貸款余額放入X軸→確定→查看輸出窗口→如果誤差項?服從正態(tài)分布這一假設(shè)成立,那么標準化殘差的分布也應(yīng)服從正態(tài)分布。圖中除一點外,標準化殘差都在-2~+2之間,這表明誤差項?服從正態(tài)分布的假定成立。(所謂殘差是指觀測值與預測值(擬合值)之間的差,即是實際觀察值與回歸估計值的差。)異常點2.練習《統(tǒng)計學》教材P330練習題11.1、11.6、11.7、11.8、11.15,對應(yīng)的數(shù)據(jù)文件為“習題11.1.xls”、“習題11.6.xls”、“習題11.7.xls”、“習題11.8.xls”、“習題11.15.xls”。(任選兩題)11.1從某一行業(yè)中隨機抽取12家企業(yè),所得產(chǎn)量與生產(chǎn)費用的數(shù)據(jù)如下:⑴繪制產(chǎn)量與生產(chǎn)費用的散點圖,判斷二者之間的關(guān)系形態(tài)。⑵計算產(chǎn)量與生產(chǎn)費用之間的線性相關(guān)系數(shù)⑶對相關(guān)系數(shù)的顯著性進行檢驗(α=0.05),并說明二者之間的關(guān)系強度。正線性相關(guān)關(guān)系r=0.92,P=0<α=0.05,拒絕原假設(shè),表明產(chǎn)量與生產(chǎn)費用之間的線性關(guān)系顯著。11.6下面是7個地區(qū)2000年的人均國內(nèi)生產(chǎn)總值(GDP)和人均消費水平的統(tǒng)計數(shù)據(jù):⑴人均GDP作自變量,人均消費水平作因變量,繪制散點圖,并說明二者之間的關(guān)系形態(tài)。⑵計算兩個變量之間的線性相關(guān)系數(shù),說明兩個變量之間的關(guān)系強度。⑶利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實際意義。⑷計算判定系數(shù),并解釋其意義。⑸檢驗回歸方程線性關(guān)系的顯著性(α=0.05)⑹如果某地區(qū)的人均GDP為5000元,預測其人均消費水平。⑺求人均GDP為5000元時,人均消費水平95%的置信區(qū)間和預測區(qū)間。正的線性相關(guān)關(guān)系R=0.998,相關(guān)系數(shù)接近于1,表明人均GDP與人均消費水平之間有非常強的正線性相關(guān)關(guān)系?;貧w方程人均消費水平=734.693+0.309人均GDP回歸系數(shù)0.309,表示人均GDP每增加一元,人均消費水平0.309元。R方=0.996,表示在人均消費水平的變差中,有99.6%是由人均GDP決定的。F=1331.692,P=0,拒絕原假設(shè),表明人均GDP與人均消費水平之間的線性關(guān)系顯著。人均消費水平=734.693+0.309人均GDP=734.693+0.309*5000=2279.693N=7,查t分布臨界值表t0.05/2(7-2)=2.5706,殘差sse=305795估計標準誤差置信區(qū)間=2279.693±2.5706x247.303x=2279.693±287.4即置信區(qū)間為(1992.293,2567.093)置信區(qū)間:預測區(qū)間:=2279.693±697.8即(1581.893,2977.493)11.7隨機抽取10家航空公司,對其最近一年的航班正點率和顧客投訴次數(shù)進行了調(diào)查,所得數(shù)據(jù)如下:⑴繪制散點圖,說明二者之間的關(guān)系形態(tài)⑵用航班正點率作自變量,顧客投訴次數(shù)作因變量,求出估計的回歸方程,并解釋回歸系數(shù)的意義⑶檢驗回歸系數(shù)的顯著性(α=0.05)⑷如果航班正點率為80%,估計顧客投訴次數(shù)⑸求航班正點率為80%時,顧客投訴次數(shù)95%的置信區(qū)間和預測區(qū)間。航班正點率和投訴次數(shù)之間為負的線性相關(guān)關(guān)系投訴次數(shù)=430.189-4.701航班正點率,航班正點率每增加1,投訴次數(shù)減少4.701次?;貧w系數(shù)的檢驗:P=0.001<α=0.05,拒絕原假設(shè),表明回歸系數(shù)顯著。投訴次數(shù)=430.189-4.701航班正點率=430.189-4.701*80=430.189-367.08=54.109N=10,查t分布臨界值表t0.05/2(10-2)=2.3060,殘差sse=2853.816估計標準誤差置信區(qū)間=54.109±2.3060x18.91x=54.109±16.5即置信區(qū)間為(37.609,70.609)預測區(qū)間:=54.109±46.57即(7.6,46.57)11.8下面是20個城市寫字樓出租率和每平方米月租金的數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年濰坊食品科技職業(yè)學院輔導員招聘考試真題匯編附答案
- 2024年鹽城農(nóng)業(yè)科技職業(yè)學院輔導員考試筆試真題匯編附答案
- 2024年蘇州工業(yè)園區(qū)職業(yè)技術(shù)學院輔導員招聘考試真題匯編附答案
- 2024年西安電子科技大學長安學院輔導員考試筆試題庫附答案
- 2024年邯鄲應(yīng)用技術(shù)職業(yè)學院輔導員考試筆試題庫附答案
- 2024年金陵科技學院輔導員招聘考試真題匯編附答案
- 2024年集美大學輔導員考試筆試題庫附答案
- 2025下半年湖北宜昌市遠安縣公安局招聘輔警擬聘用人員備考題庫及答案1套
- 2025年廣州民航職業(yè)技術(shù)學院輔導員招聘備考題庫附答案
- 2025年洛陽市公安機關(guān)招聘警務(wù)輔助人員501人考試題庫附答案
- 承包團建燒烤合同范本
- 工程項目施工計劃書
- 2023-2024學年深圳市初三中考適應(yīng)性考試英語試題(含答案)
- NB-T 47013.15-2021 承壓設(shè)備無損檢測 第15部分:相控陣超聲檢測
- 人教新起點英語五上《Unit5shopping》課件-課件
- 各品牌挖掘機挖斗連接尺寸數(shù)據(jù)
- 四川省成都市八年級上學期物理期末考試試卷及答案
- GB/T 38697-2020塊菌(松露)鮮品質(zhì)量等級規(guī)格
- 三菱FX3U系列PLC編程技術(shù)與應(yīng)用-第二章課件
- RoHS培訓資料課件
- 協(xié)調(diào)控制系統(tǒng)
評論
0/150
提交評論