應(yīng)用商務(wù)統(tǒng)計(jì)-線性回歸_第1頁
應(yīng)用商務(wù)統(tǒng)計(jì)-線性回歸_第2頁
應(yīng)用商務(wù)統(tǒng)計(jì)-線性回歸_第3頁
應(yīng)用商務(wù)統(tǒng)計(jì)-線性回歸_第4頁
應(yīng)用商務(wù)統(tǒng)計(jì)-線性回歸_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、首都經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計(jì)學(xué)院,線性回歸,案例介紹,背景、目標(biāo)、變量和分析,案例背景,目前中國的資本市場逐漸成熟,投資于股市成為眾多企業(yè)乃至個(gè)人的重要理財(cái)方式。因此利用上市公司當(dāng)年的公開的財(cái)務(wù)指標(biāo)對起來年盈利狀況予以預(yù)測就成為投資人最重要的決策依據(jù)。 本案例隨機(jī)抽取深市和滬市2002年和2003年各500個(gè)樣本,對上市公司的凈資產(chǎn)收益率(return on equity, ROE)進(jìn)行預(yù)測。,案例目標(biāo)與變量,目標(biāo):盈利預(yù)測 因變量:下一年的凈資產(chǎn)收益率(ROE) 自變量:當(dāng)年的財(cái)務(wù)信息 樣本容量:2002年500;2003年500,自變量,ROEt: 當(dāng)年凈資產(chǎn)收益率 ATO: 資產(chǎn)周轉(zhuǎn)率(ass

2、et turnover ratio) LEV: 債務(wù)資本比率(debt to asset ratio) 反映公司基本債務(wù)狀況 PB: 市倍率(price to book ratio) 反映公司預(yù)期未來成長率 ARR: 應(yīng)收賬款/主營業(yè)務(wù)收入(account receivable over total income) 反映公司的收入質(zhì)量,自變量,PM: 主營業(yè)務(wù)利潤/主營業(yè)務(wù)收入(profit margin) 反映公司利潤狀況 GROWTH: 主營業(yè)務(wù)增長率(sales growth rate) 反映公司已實(shí)現(xiàn)的當(dāng)年增長率 INV: 存貨/資產(chǎn)總計(jì)(inventory to asset rati

3、o) 反映公司的存貨狀況 ASSET: (對數(shù))資產(chǎn)總計(jì)(log-transformed asset) 反映公司的規(guī)模,對模型的進(jìn)一步分析,哪個(gè)自變量在預(yù)測方面最有用? 哪個(gè)自變量是最重要的? 如何使用模型進(jìn)行預(yù)測?,描述分析,獲得對數(shù)據(jù)的整體性認(rèn)識,讀取數(shù)據(jù),在SPSS中打開數(shù)據(jù)文件roe.sav 在R環(huán)境下將數(shù)據(jù)讀入系統(tǒng)并顯示,使用如下語句:,數(shù)據(jù)的概括性度量,SPSS:Analyze Descriptive Statistics Explore R語句:,變量間相關(guān)性分析,SPSS:Analyze Correlate Bivariate R語句:,SPSS:Graph Scatter R

4、語句: plot(a1$ROEt,a1$ROE),模型的建立,模型、假設(shè)和參數(shù)估計(jì),模型形式及假設(shè),線性回歸模型 模型假設(shè) 獨(dú)立性假設(shè) 同方差假設(shè) 正態(tài)性假設(shè),參數(shù)估計(jì),模型: 最小二乘估計(jì)量: 方差估計(jì)量:,擬合優(yōu)度,總平方和 殘差平方和 R-Square,參數(shù)估計(jì)的軟件實(shí)現(xiàn),SPSS:Analyze Regression Linear R語句: lm1=lm(ROEROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1) summary(lm1),顯著性檢驗(yàn),F檢驗(yàn),假設(shè) 檢驗(yàn)統(tǒng)計(jì)量 拒絕域,T檢驗(yàn),假設(shè) 檢驗(yàn)統(tǒng)計(jì)量 拒絕域,顯著性檢驗(yàn)的結(jié)論,從F檢

5、驗(yàn)的結(jié)果看,模型的線性關(guān)系是顯著的。 從T檢驗(yàn)的結(jié)果看,ROEt和LEV兩個(gè)變量通過了檢驗(yàn),GROWTH變量在顯著性水平降至0.1時(shí)也可以通過檢驗(yàn),因此這三個(gè)變量與因變量的線性關(guān)系較為顯著。 注意,這不說明應(yīng)該刪除其它變量!,模型的診斷,異方差性、非正態(tài)性、異常值,同方差性檢驗(yàn),同方差性檢驗(yàn),同方差性檢驗(yàn),同方差性檢驗(yàn),正態(tài)性檢驗(yàn),若 , 并且 則有,正態(tài)性檢驗(yàn),進(jìn)一步可以得到 以及 所以在正態(tài)性假設(shè)下,殘差 與 應(yīng)該成線性關(guān)系。,正態(tài)性檢驗(yàn),Q-Q 圖 殘差: 將殘差排序: Y: X:,將上面的方法應(yīng)用于本案例,目標(biāo)1:檢驗(yàn)?zāi)P褪欠穹先齻€(gè)假設(shè) 目標(biāo)2:找出異常值 SPSS實(shí)現(xiàn)方法:以預(yù)測值

6、為X軸,殘差為Y軸畫散點(diǎn)圖;畫Q-Q圖 R語句: par(mfrow=c(2,2) #設(shè)置畫圖為2x2的格式 plot(lm1,which=c(1:4) #畫出lm1中對應(yīng)于模型檢驗(yàn)的4張圖,包括殘差圖、QQ圖和Cook距離圖 檢驗(yàn)發(fā)現(xiàn)47號數(shù)據(jù)為異常值,需要將其消除 語句:a1=a1(-47),多重共線性,含義及檢驗(yàn),什么是多重共線性?,如果存在如下回歸方程 能不能把它變成下面這樣 如果對這個(gè)方程進(jìn)行回歸會發(fā)生什么事?,第一個(gè)例子,假如有兩個(gè)變量x1和x2,用最小二乘法得到如下參數(shù)估計(jì)量。,第二個(gè)例子,假如有三個(gè)變量x1、x2和x3,用最小二乘法得到如下參數(shù)估計(jì)量。,方差膨脹因子,定義下面的回歸形式為輔助回歸 令 為輔助回歸的判定系數(shù) 則方差膨脹因子為: 它反映了在多大程度上第i個(gè)自變量所包含的信息被其他自變量覆蓋,方差膨脹因子,R語句: 所有的VIF值都小于10且接近1,所以沒有多重共線性問題。,變量的選擇,AIC 和 BIC,AIC方法比較保守,其中p為自變量個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論