版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
本章內(nèi)容第一節(jié)解釋變量中含有定性變量的回歸模型第二節(jié)二項Logistic回歸模型第三節(jié)判別分析
當前1頁,總共41頁。第一節(jié)解釋變量中含有定性變量的回歸模型
在回歸分析中,我們對一些解釋變量是定性變量的情形先給予數(shù)理化,處理方法是引進只取0和1兩個值的虛擬變量。當某一屬性出現(xiàn)時,虛擬變量取值為1,否則為0。當前2頁,總共41頁。(一)簡單情況簡單情況是指定性變量只取兩類可能性的情況。例如研究企業(yè)資本結構問題,為企業(yè)資本結構,為企業(yè)規(guī)模。另外再考慮審計意見兩種情況:
企業(yè)資本結構的回歸模型為:
(9.1)當前3頁,總共41頁。(二)復雜情況復雜情況是指定定性變量可能取多類值的情況。假設以采掘業(yè)、建筑業(yè)、房地產(chǎn)業(yè)和社會服務業(yè)4個行業(yè)的上市公司為例,研究企業(yè)資本結構問題,其中為企業(yè)資本結構,為企業(yè)規(guī)模,為審計意見,另外再考慮行業(yè)差異。為了用虛擬變量反映這4個行業(yè),我們初步設想引入如下4個0-1型解釋變量:
當前4頁,總共41頁。
可是這樣作卻產(chǎn)生了一個新的問題,即4個自變量之和恒等于1,構成完全多重共線性。解決這個問題的方法很簡單,我們只需去掉一個0-1型變量,只保留3個0-1型解釋變量即可。所以,對于具有個分類的變量,當確定了參照系后,只需設置個0-1型解釋變量。企業(yè)資本結構的回歸模型為:
(9.2)當前5頁,總共41頁。第二節(jié)二項Logistic回歸模型
一、二項Logistic回歸模型概述(一)二項Logistic回歸模型的應用背景在許多會計研究問題中,所研究的被解釋變量往往只有“是”或“否”兩個可能結果,就需要設置虛擬變量。當被解釋變量為虛擬變量時,建立一般的多元線性回歸模型就會出現(xiàn)以下問題:(1)殘差不再滿足且的假設條件。(2)殘差不再服從正態(tài)分布。(3)被解釋變量的取值區(qū)間受限制。由此可見,當被解釋變量是0-1型變量時,無法直接采用一般的多元線性回歸模型建模,通常應采用Logistic回歸模型。本章只介紹二項Logistic回歸模型。當前6頁,總共41頁。
利用Logistic回歸可以直接預測觀測量相對于某一事件的發(fā)生概率在一般的多元回歸中,若以概率為被解釋變量,則方程為:(9.3)
但用該方程計算時,常會出現(xiàn)或的不合理情形。為此需要對作對數(shù)單位轉換,即,于是可得到Logistic回歸方程為:
(9.4)
其中、為常數(shù)和解釋變量的系數(shù),為自然數(shù),其曲線為型。當前7頁,總共41頁。某一事件不發(fā)生地概率為:Prob(noevent)=1-Prob(event)(9.5)二元Logistic模型對數(shù)據(jù)要求為:(1)被解釋變量應具二分特點。(2)解釋變量數(shù)據(jù)最好為多元正態(tài)分布。
當前8頁,總共41頁。(三)二項Logistic回歸模型中回歸系數(shù)的含義在應用中人們通常更關心的是解釋變量給發(fā)生比帶來的變化。當Logistic回歸模型的回歸系數(shù)確定后,將其代入的函數(shù),即
(9.6)
當其他解釋變量保持不變而研究變化一個單位對的影響時,可將新的發(fā)生比設為,則有:
(9.7)當前9頁,總共41頁。于是有
(9.8)
由此可知,當增加一個單位時,將引起發(fā)生比擴大倍。一般化則為
(9.9)
式(9.9)表明,當?shù)趥€解釋變量發(fā)生一個單元的變化時,幾率的變化值為。解釋變量的系數(shù)為正值,意味著事件發(fā)生的幾率會增加,的值大于1;解釋變量的系數(shù)為負值,意味著事件發(fā)生的幾率會減少,的值小于1;當為0時,此值等于1。當前10頁,總共41頁。(四)二項Logistic回歸模型的檢驗
1、回歸模型的顯著性檢驗
Logistic回歸模型顯著性檢驗的目的是檢驗解釋變量全體與Logit的線性關系是否顯著,是否可以用線性模型擬合。其原假設是:各回歸系數(shù)同時為0,解釋變量全體與Logit的線性關系不顯著。
(9.10)
好的模型的似然比值較高,其值相對較小。似然比值的變化說明當變量進入與被剔除出模型對數(shù)據(jù)擬合度方面的變化。當前11頁,總共41頁。
常用的3種卡方統(tǒng)計量分別為Model、Block、Step。(1)Model統(tǒng)計量檢驗除常數(shù)項以外,模型中所有變量系數(shù)為零的假設。(2)Block卡方值為當前值與后一組變量進入模型后的值之差。(3)Step卡方值是在建立模型的過程中,當前與下一步之間的差值。
SPSS將自動計算似然比卡方的觀測值和相伴概率值。如果相伴概率值小于給定的顯著水平,則應拒絕零假設;反之,如果相伴概率值大于給定的顯著水平,則不應拒絕零假設。當前12頁,總共41頁。2、回歸系數(shù)的顯著性檢驗
Logit回歸系數(shù)顯著性檢驗的目的是逐個檢驗模型中各解釋變量是否與Logit有顯著的線性關系,對解釋Logit是否有重要貢獻。其原假設是,即某回歸系數(shù)與零無顯著差異,相應的解釋變量與Logit之間的線性關系不顯著?;貧w系數(shù)顯著性檢驗采用的檢驗統(tǒng)計量是統(tǒng)計量,數(shù)學定義為
(9.11)
式(9.11)中,是回歸系數(shù),是回歸系數(shù)的標準誤差。檢驗統(tǒng)計量服從自由度為1的卡方分布。當前13頁,總共41頁。
SPSS將自動計算各解釋變量的的觀測值和相伴概率值。如果概率值小于給定的顯著性水平,則應拒絕零假設,認為某解釋變量的回歸系數(shù)與零有顯著差異,該解釋變量與Logit之間的線性關系顯著,應保留在模型中;反之,如果概率值大于給定的顯著性水平,則不應拒絕零假設,可以認為某解釋變量的回歸系數(shù)與零無顯著差異,該解釋變量與Logit之間的線性關系不顯著,不應保留在模型中。當前14頁,總共41頁。3、回歸模型的擬合優(yōu)度檢驗在Logistic回歸分析中,擬合優(yōu)度可以從兩大方面考察。第一,回歸模型能夠解釋被解釋變量變差的程度。第二,回歸模型計算出的預測值與實際值之間吻合的程度,即模型的總體錯判率是低還是高。常用的指標有Cox&Snell統(tǒng)計量、Nagelkerke統(tǒng)計量、錯判矩陣、Hosmer-Lemeshow統(tǒng)計量。
4、殘差分析
Logistic回歸中可以利用一下殘差指標進行殘差分析,主要包括:非標準化殘差、標準化殘差、Logit殘差等。當前15頁,總共41頁。二、二項Logistic回歸分析在SPSS中的實現(xiàn)
1.建立或打開數(shù)據(jù)文件后,進入Analyze→Regression→BinaryLogistic對話框,如圖9-1所示。圖9-1Logistic邏輯回歸分析主對話框當前16頁,總共41頁。
2、選擇被解釋變量放入Dependent框,選擇一個或多個解釋變量放入Covariates框。也可以將不同解釋變量組放在不同的塊(Block)中,進而分析不同解釋變量組對解釋變量的貢獻。
3、在Method框后選擇解釋變量的篩選策略,包括Enter選項、Forward:Conditional選項、Forward:LR選項、Forward:Wald選項、Backward:Conditional選項、Backward:LR選項、Backward:Wald選項。
4、SelectionVariable框,根據(jù)指定變量的取值范圍,選擇參與分析的觀察量。當前17頁,總共41頁。
5、單擊Categorical按鈕,展開如圖9-2對話框,設置處理分類變量的方式。適用于解釋變量(協(xié)變量)為非定距的品質(zhì)變量。圖9-2定義分類協(xié)變量對話框當前18頁,總共41頁。
(1)在Covariates框中包含了在主對話框中已經(jīng)選擇好的全部協(xié)變量及交互項。(2)CategoricalCovariates框中列出了所選擇的分類變量。(3)ChangeContrast欄,設置分類協(xié)變量中各類水平的對比方式。有Indicator選項、Simple選項、Difference選項、Helmert選項、Repeated選項、Polynomial選項、Deviation選項。(4)ReferenceCategory選項,如果選擇了Deviation、Simple、Indicator對比方式,可選擇First或Last,指定分類變量的第一類或最后一類作為參考類。(5)如果改變了ChangeCovariates的設置,單擊Change按鈕以示對選項的確定。當前19頁,總共41頁。
6、單擊Save按鈕,激活儲存新變量對話框,如圖9-3所示。選擇在數(shù)據(jù)文件中保存的新變量。圖9-3保存新變量對話框當前20頁,總共41頁。
(1)PredictedValue欄,預測值選項。其中,Probability復選項,表示每個觀測量發(fā)生特定事件的預測概率;Groupmembership復選項,表示依據(jù)預測概率得到的每個觀測量的預測分組。
(2)Residual欄,保存殘差,包括Unstandardized非標準化殘差、Logit殘差、Studentized學生化殘差、Standardized標準化殘差和Deviance偏差。
(3)Influence欄,保存每一個觀測量的影響力指標,包括Cook距離、Leveragevalues杠桿值和Dfbeta(s)統(tǒng)計量。當前21頁,總共41頁。7.單擊Options按鈕,展開如圖9-4所示對話框。圖9-4Options選擇項對話框當前22頁,總共41頁。
(1)StatisticsandPlot欄,輸出統(tǒng)計量和圖形。包括Classificationplots復選項、Correlationsofesti復選項、Hosmer-Lemeshowgoodness-of-f復選項、Iterationhistory復選項、Casewiselistingofresiduals復選項、CIforexp(B)復選項。(2)Display欄中,Ateachstep選項,表示對每一步計算過程輸出表、統(tǒng)計量和圖形。Atlaststep選項,表示只輸出最終方程的表、統(tǒng)計量和圖形。(3)ProbabilityforStepwise欄,設置變量進入模型及從模型中刪除的判據(jù)。(4)Classification欄,被解釋變量分類界限。(5)Maximum欄,設定最大迭代次數(shù)。(6)Includeconstantinm:模型包含常數(shù)項。當前23頁,總共41頁。8、圖形診斷模型,包括:(1)使用Graphs圖形功能,對保存在數(shù)據(jù)文件中的Deviance統(tǒng)計量做P-P圖。(2)將保存的StandardizedResiduals,DfBeta(s)和Leverage統(tǒng)計量,用SPSS圖形功能做散點圖(橫坐標為變量ID,縱坐標為各種保存的新變量)。當前24頁,總共41頁。第三節(jié)判別分析
一、判別分析的概念和基本步驟(一)判別分析的概念判別分析是根據(jù)觀察到的若干變量值,判斷研究對象如何分類的方法。判別分析能夠解決兩組或者更多組的情況,當包含兩組時,稱做兩組判別分析;當包含三組或者三組以上時,稱做多組判別分析聚類分析和判別分析都是分類學的基本方法,但它們也有很大的不同。當前25頁,總共41頁。(二)判別分析的基本步驟
1、判別分析的研究設計(1)解釋變量和被解釋變量的選擇。判別分析中,被解釋變量為定性變量。解釋變量可以為定量變量,也可以為定性變量。(2)樣本容量。在判別分析中,最小的組的大小必須超過解釋變量的個數(shù)。(3)樣本的分割。在實際研究中,很多時候樣本需要分割為兩個子樣本,一個子樣本用于估計判別函數(shù),另一個子樣本用于驗證判別函數(shù),每個子樣本都要有適當?shù)臉颖救萘縼碇С纸Y論。分割樣本有很多種方法,最常用的是將整個樣本隨機的分為兩組,這種驗證方法稱為分割樣本法或者交叉驗證法。當前26頁,總共41頁。2、判別分析的假定(1)每一個判別變量(解釋變量)不能是其他判別變量的線性組合,即不能出現(xiàn)多重共線性問題。(2)各組變量的協(xié)方差矩陣相等。判別分析最簡單和最常用的形式是采用線性判別函數(shù),它們是判別變量的簡單線性組合。在各組協(xié)方差矩陣相等的假設條件下,可以使用很簡單的公式來計算判別函數(shù)和進行顯著性檢驗。(3)各判別變量之間具有多元正態(tài)分布,即每個變量對于所有其他變量的固定值有正態(tài)分布。在這種條件下可以精確計算顯著性檢驗值和分組歸屬的概率。當違背該假設時,計算的概念將非常不準確。當前27頁,總共41頁。3、估計判別模型和評估整體擬合(1)計算方法。推導判別函數(shù)時可以使用兩種計算方法:聯(lián)立(直線)法和逐步法。聯(lián)立估計在計算時同時考慮所有的解釋變量。而當研究者考慮了相對較多的解釋變量時,逐步法是適用的。(2)統(tǒng)計顯著性。在計算了判別函數(shù)以后,必須評估它的顯著性。有一系列不同的統(tǒng)計準則可用。Wilk’slambda,Mahalanobisdistance和Rao’sV等都可以用來評估判別函數(shù)。當前28頁,總共41頁。(3)評估整體擬合。這個評估包括三個任務:計算每個觀測的判別得分、檢驗各組在判別得分上的差異、評估組關系預測的精度。
4、結果的解釋這個過程主要是解釋在判別分析中每個解釋變量的相對重要性,主要有三種方法:標準化判別權重、判別載荷、偏值。
5、結果的驗證判別分析的最后一個階段就是驗證判別分析的結果,通常采用分割樣本和交叉驗證法。當前29頁,總共41頁。1、建立或打開數(shù)據(jù)文件后,按Analyze→Classify→Discriminant的順序打開DiscriminantAnalysis對話框。見圖9-7所示。圖9-7判別分析主對話框當前30頁,總共41頁。
2、選擇分類變量及其范圍在主對話框中左面的矩形框中選擇表明已知的觀測量所屬類別的變量,按向右按鈕,使該變量名移到右面的GroupingVariable框中。此時矩形框下面的“DefineRange”按鈕加亮,按該按鈕,顯示如圖9-8所示的對話框,在該框中分類變量的最小值和最大值。圖9-8DefineRange對話框當前31頁,總共41頁。
3、指定判別分析的解釋變量在主對話框左面的變量表中選擇表明觀測量特征的變量,按下面一個箭頭按鈕把選中的變量移到Independents矩形框中,作為參與判別分析的變量。完成前面3步驟的操作即可使用各種系統(tǒng)默認值對數(shù)據(jù)集的數(shù)據(jù)進行判別分析了,但結果有時不能令人滿意,因此有必要根據(jù)以下步驟做進一步的分析。當前32頁,總共41頁。
4、選擇觀測量如果希望使用一部分觀測量進行判別函數(shù)的推導,而且有一個變量的某個值可以作為這些觀測量的標識,則用Select功能進行選擇。展開SetValue子對話框,如圖9-9所示,鍵入標識參與分析的觀測量所具有的該變量值。圖9-9SetValue子對話框在分析中一般均使用數(shù)據(jù)文件中的所有合法觀測量,因此此步驟也可以省略。當前33頁,總共41頁。5、選擇分析方法在主對話框中解釋變量矩形框下面有兩個選擇項,用于選擇判別分析方法。(1)Enterindependenttogether選項。當認為所有解釋變量都能對觀測量的特性提供豐富的信息且彼此獨立時,使用該選擇項。建立全模型,不需要進一步進行選擇。(2)Usestepwisemethod選項。當不認為所有解釋變量都能對觀測量的特性提供豐富的信息時,因此需要使用該選擇項,根據(jù)判別貢獻的大小再進行選擇。單擊該項,“Method”按鈕加亮,可以進一步選擇判別分析方法。當前34頁,總共41頁。
6、單擊“Method”按鈕,展開StepwiseMethod對話框,如圖9-10所示。其中:圖9-10StepwiseMethod對話框當前35頁,總共41頁。
(1)Method欄選擇,進行逐步判別分析的方法??晒┻x擇的判別分析方法有:Wilk’slambda選項、Unexplainedvariance選項、Mahalanobisdistance選項、SmallestFratio選項、Rao’sV選項。
(2)Criteria欄,選擇逐步判別停止的判據(jù)??晒┻x擇的判據(jù)有:UseFvalue選項使用值、UseProbabilityofF選項,用檢驗的概率決定變量是否加入函數(shù)或被剔除。
(3)Display欄顯示選擇的內(nèi)容,有Summaryofsteps復選項和FforPairwisedistances復選項進行選擇。當前36頁,總共41頁。
7、單擊Statistics按鈕,展開Statistics對話框,指定輸出的統(tǒng)計量,如圖9-11所示。圖9-11Statistics對話框當前37頁,總共41頁。
(l)Descriptives欄,選擇對原始數(shù)據(jù)的描述統(tǒng)計量的輸出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 出租網(wǎng)店合同范本
- 文店結賬合同范本
- 轉口貿(mào)易合同范本
- 勾機抵押合同協(xié)議
- 房屋翻修協(xié)議合同
- 陽江分包協(xié)議合同
- 采購軸承合同范本
- 情侶欠款合同范本
- 房屋解壓合同范本
- 趣閱簽約合同范本
- 光大銀行欽州市欽北區(qū)2025秋招信息科技崗筆試題及答案
- 消除艾滋病、梅毒和乙肝母嬰傳播課件
- 面條工藝技法培訓課件
- 25秋國開《形勢與政策》大作業(yè)及答案
- 機場場道維護員數(shù)字化技能考核試卷及答案
- 水環(huán)境治理基礎知識培訓課件
- 消防設施日常檢查與維護方案
- 低溫儲罐課件
- 遠程供電系統(tǒng)講解
- 口腔修復粘結技術
- 人民調(diào)解員培訓課件
評論
0/150
提交評論