已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于因子分析的LOGISTIC違約概率模型的實證研究作者葛釗本文針對一般商業(yè)銀行等單位采用LOGISTIC回歸估計PD的模型中多重共線性、沒有考慮時間因素等問題,構(gòu)建和驗證了基于因子分析的LOGISTIC違約概率測算模型的效果和可行性,并對財務(wù)指標進行了時間加權(quán)化處理的模型改進工作,在最后對模型的進一步優(yōu)化提出了新的思考和方向。本文樣本數(shù)據(jù)獲取渠道為中國證券市場公開信息,選取6家在20052006年和2010年發(fā)生過銀行貸款違約的制造業(yè)上市公司(違約筆數(shù)8筆),和31家同行業(yè)同期貸款未發(fā)生違約且非ST類的上市公司,并且總資產(chǎn)與銷售規(guī)模與違約公司相似(考慮到建模樣本數(shù)量過少,加入此約定為提高模型精度),組成39個建模數(shù)據(jù),進行模型構(gòu)造。其中,財務(wù)數(shù)據(jù)均取自違約/非違約公司對應(yīng)違約年份前一年末或前二年末的數(shù)據(jù),此是模型具有預(yù)測功能的必要條件。6家違約上市公司8條違約記錄(其中3條違約記錄來自同一公司)如下序號股票代碼最新公司全稱證監(jiān)會行業(yè)門類名稱證監(jiān)會行業(yè)次類名稱報表日期報表類型信息來源貸款類型1000413石家莊寶石電子玻璃股份有限公司制造業(yè)電子20051231Q4定期報告短期流貸2000498丹東化學(xué)纖維股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料20061231Q4定期報告短期流貸3000506中潤資源投資股份有限公司制造業(yè)造紙、印刷20050630Q2定期報告短期流貸4000557廣夏銀川實業(yè)股份有限公司制造業(yè)醫(yī)藥、生物制品20061231Q4定期報告短期流貸5600196上海復(fù)星醫(yī)藥集團股份有限公司制造業(yè)醫(yī)藥、生物制品20061231Q4定期報告短期流貸6600608上海寬頻科技股份有限公司制造業(yè)電子20051231Q4定期報告短期流貸7600608上海寬頻科技股份有限公司制造業(yè)電子20061231Q4定期報告短期流貸8600608上海寬頻科技股份有限公司制造業(yè)電子20100630Q2定期報告短期流貸6家上市公司發(fā)生逾期的貸款類型均為短期流貸,全部歸屬于公司風(fēng)險暴露中一般公司風(fēng)險暴露。另外,之所以將上海寬頻科技股份有限公司的三次逾期數(shù)據(jù)全部納入建模,是由于一方面可供建模的違約數(shù)據(jù)過少,將其加入不影響模型的建立和使用,另一方面數(shù)據(jù)量的增加增強了模型的預(yù)測能力。31家非違約上市公司信息如下(合并報表數(shù)據(jù))股票代碼最新公司全稱證監(jiān)會行業(yè)門類名稱證監(jiān)會行業(yè)次類名稱截止日期基本每股收益元/股營業(yè)收入元資產(chǎn)總計元000590紫光古漢集團股份有限公司制造業(yè)醫(yī)藥、生物制品20061231003287312308562057554000593四川大通燃氣開發(fā)股份有限公司批發(fā)和零售貿(mào)易批發(fā)和零售貿(mào)易20061231004262961854643441371000606青海明膠股份有限公司制造業(yè)醫(yī)藥、生物制品20061231012180495301641844773000619蕪湖海螺型材科技股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料20061231039397E092589E09000755山西三維集團股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料20061231045211E093454E09000788北大國際醫(yī)院集團西南合成制藥股份有限公司制造業(yè)醫(yī)藥、生物制品20061231006501365634737943749000790成都華神集團股份有限公司制造業(yè)醫(yī)藥、生物制品20061231004225243387703082775000792青海鹽湖工業(yè)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料200612311062596E095727E09000812陜西金葉科教集團股份有限公司制造業(yè)造紙、印刷20061231037313953982957758784000830魯西化工集團股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料200612310164009E094572E09000909數(shù)源科技股份有限公司制造業(yè)電子200612310019631126391778E09000912四川瀘天化股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料200612310774799E095101E09000936江蘇華西村股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料200612310152896E092677E09002004重慶華邦制藥股份有限公司制造業(yè)醫(yī)藥、生物制品20061231049287872529781297226002007華蘭生物工程股份有限公司制造業(yè)醫(yī)藥、生物制品20061231036354994023816570602002019浙江杭州鑫富藥業(yè)股份有限公司制造業(yè)醫(yī)藥、生物制品20061231005347989819592378458002022上海科華生物工程股份有限公司制造業(yè)醫(yī)藥、生物制品20061231053340326970485513935002025貴州航天電器股份有限公司制造業(yè)電子2006123108322784915640281027002045國光電器股份有限公司制造業(yè)電子200612310268563370691134E09002079蘇州固锝電子股份有限公司制造業(yè)電子20061231031435408883530697505002117東港股份有限公司制造業(yè)造紙、印刷20061231064415751481499356585600206有研半導(dǎo)體材料股份有限公司制造業(yè)電子200612310114990345191071E09600237安徽銅峰電子股份有限公司制造業(yè)電子20061231004509950109149E09600356牡丹江恒豐紙業(yè)股份有限公司制造業(yè)造紙、印刷200612310297580133271571E09600360吉林華微電子股份有限公司制造業(yè)電子200612310519067950551909E09600433廣東冠豪高新技術(shù)股份有限公司制造業(yè)造紙、印刷20061231008592813086862208294600589廣東榕泰實業(yè)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料20061231037973090351599E09600666西南藥業(yè)股份有限公司制造業(yè)醫(yī)藥、生物制品20061231008456151830846948311600793宜賓紙業(yè)股份有限公司制造業(yè)造紙、印刷20061231062535064636951950250600796浙江錢江生物化學(xué)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料20061231011430045963926870562600836上海界龍實業(yè)集團股份有限公司制造業(yè)造紙、印刷20061231015048220341332E09其中四川大通燃氣開發(fā)股份有限公司在2006年由醫(yī)藥、生物制品類轉(zhuǎn)為批發(fā)和零售貿(mào)易類;浙江錢江生物化學(xué)股份有限公司在2006年由醫(yī)藥、生物制品轉(zhuǎn)為石油、化學(xué)、塑膠、塑料類。特此說明。以下對從網(wǎng)絡(luò)公開信息獲取的數(shù)據(jù),進行數(shù)據(jù)手機、業(yè)務(wù)定義、數(shù)據(jù)清洗、模型分組、模型分析、變量構(gòu)造、變量分析和變量選擇等步驟。選取如下14個財務(wù)指標,作為建模數(shù)據(jù)估計模型參數(shù)。選取數(shù)據(jù)的原則主要是從數(shù)據(jù)的易獲得性、完整性考慮的,同時為了免去單因素初步篩選等較為簡單的過程,直接按現(xiàn)有資料綜合選取了顯著性較高的財務(wù)指標。所選指標全部是以百分比度量的財務(wù)比率,這樣的好處是將企業(yè)規(guī)模等因素在模型系統(tǒng)中的影響最小化,提高模型的預(yù)測精度。提取指標列表指標類型標號指標含義與計算公式備注VAR9凈利潤/總資產(chǎn)總資產(chǎn)報酬率/總資產(chǎn)凈利率VAR17凈利潤/報告期末股本每股收益攤薄盈利能力VAR10主營收入主營成本/主營收入主營業(yè)務(wù)利潤率VAR16銷售收入總額/平均資產(chǎn)總額總資產(chǎn)周轉(zhuǎn)率營運能力VAR15銷售收入總額/平均流動資產(chǎn)流動資產(chǎn)周轉(zhuǎn)率流動性與償債能力VAR8負債總額/總資產(chǎn)資產(chǎn)負債率VAR12總資產(chǎn)現(xiàn)金回收率經(jīng)營現(xiàn)金凈額/平均總資產(chǎn)總資產(chǎn)現(xiàn)金回收率VAR11經(jīng)營活動現(xiàn)金流量凈額/銷售收入銷售現(xiàn)金比率VAR5流動資產(chǎn)存貨/流動負債速動比VAR4流動資產(chǎn)/流動負債流動比VAR7利息保障倍數(shù)EBIT/利息利息保障倍數(shù)VAR6營運資金/總資產(chǎn)VAR14本年總資產(chǎn)增長額/年初資產(chǎn)總額總資產(chǎn)增長率經(jīng)營發(fā)展能力/成長能力VAR13本年主營業(yè)務(wù)收入增長額/年初主營業(yè)務(wù)收入主營業(yè)務(wù)收入增長率對于違約上市公司,做因子分析和LOGISTIC回歸時采用違約當年和前一年經(jīng)時間加權(quán)計算的財務(wù)數(shù)據(jù),對于非違約上市公司,由于違約公司違約發(fā)生年份大多集中于2005年和2006年,故對非違約公司財務(wù)數(shù)據(jù)以2005年和2006年為基礎(chǔ)做時間加權(quán)平均處理。采取此方法的目的主要是由于企業(yè)各種指標會隨著時間變化而變化,如果僅僅考慮最近一年的指標,可能會由于經(jīng)濟周期或偶然因素造成財務(wù)指標失真,最終影響違約概率測算的準確性。為解決這一問題,我采取了基于2年時間加權(quán)的方法計算模型的輸入變量。公式為11221/211/2其中,T取2,代表2年;XI代表按時間加權(quán)平均后的結(jié)果;XIT表示指標I第T年的數(shù)值。據(jù)此可知時間越晚的年份所占權(quán)重越大。將違約和非違約公司數(shù)據(jù)經(jīng)過時間加權(quán)方法進行調(diào)整,得到8個違約和31個非違約共計39個樣本,用SPSS軟件進行因素分析(抽取共同因素時選用主成分分析法)。這里特別指出的是,諸多文獻指出在進行此類問題的因素分析時,需先將數(shù)據(jù)按如下ZSCORE公式進行標準化處理其中,XIJ為第I個樣本的第J個指標值,XJ為樣本第J個指標的平均值,SJ為樣本第J個指標標準差,ZIJ為第I個樣本第J個指標值標準后化的得分。進行該標準化的目的主要為了消除各項財務(wù)指標由于量綱單位不同或正、逆性指標不同帶來的不可比擬性,但經(jīng)現(xiàn)有數(shù)據(jù)進行標準化前后的因子分析結(jié)果來看,分析所得數(shù)據(jù)和結(jié)論在標準化前后無絲毫不同,故本文未采取先將數(shù)據(jù)標準化,再進行分析,而是直接將數(shù)據(jù)進行了因子分析,過程和結(jié)論如下KMOANDBARTLETTSTESTKAISERMEYEROLKINMEASUREOFSAMPLINGADEQUACY685APPROXCHISQUARE584771DF91BARTLETTSTESTOFSPHERICITYSIG000從上表看到,KMO值為0685,當其數(shù)值越大時,表示變量間的共同因素越多,越適合進行因素分析。一般大于05時,均適合進行因素分析。此外,從BARTLETTS球形檢驗達顯著,代表母群體間有共同因素存在,同樣表明適合進行因素分析。選取特征值大于06的抽取共同因素,共抽取6了個共同因素,可以解釋的總變異量為91701。另外,可以看到采用最大方差法轉(zhuǎn)軸后每個因素的特征值和方差貢獻率都發(fā)生了變化,但累計方差貢獻率未發(fā)生變化,均為91701,而且轉(zhuǎn)軸縮小了各因素方差貢獻率之間的差距,使各因素解釋原變量的能力更加平衡。詳見下表TOTALVARIANCEEXPLAINEDINITIALEIGENVALUESEXTRACTIONSUMSOFSQUAREDLOADINGSROTATIONSUMSOFSQUAREDLOADINGSCOMPONENTTOTALOFVARIANCECUMULATIVETOTALOFVARIANCECUMULATIVETOTALOFVARIANCECUMULATIVE167504821648216675048216482162803200182001822073148076302320731480763023240217155371733175412529755521754125297555222761625853431492165818213292165818213222001571669147571651138724571651138724519551396383110662444569170162444569170112038592917017356254294243829320929633591961401977361018413119904711071505995521203424699798130201439994014008060100000EXTRACTIONMETHODPRINCIPALCOMPONENTANALYSIS以下是陡坡圖,可以看到從第6個點后坡度線比較平滑,故可以側(cè)面告訴我們選取6個因素是較為適宜的。以下是未轉(zhuǎn)軸的因素矩陣(因素負荷量小于01的未予顯示)。COMPONENTMATRIXACOMPONENT123456VAR00009931167157113VAR00017894215207VAR00004773475396VAR00014765141147450VAR00010755375230237134VAR00012754293280131104373VAR00005726532397VAR00011697328450252VAR00006660378529269138VAR00008645321508264333121VAR00013606385315398274VAR00015329728492165VAR00016433437666172295VAR00007490149738311228A6COMPONENTSEXTRACTED以下是經(jīng)過轉(zhuǎn)軸后的因素矩陣(因素負荷量小于01的未予顯示),轉(zhuǎn)軸方法為最大方差法,屬正交轉(zhuǎn)軸方法之一,也叫直交轉(zhuǎn)軸法,其特點是因素間沒有相關(guān)。我們正是想利用這一特性避免在后面的LOGISTIC回歸中出現(xiàn)多重共線性。另外,由下表可看出,轉(zhuǎn)軸前共同因素1包含VAR12、VAR11、VAR10,共同因素2包含VAR5、VAR4,共同因素3包含VAR8、VAR6,共同因素4包含VAR13、VAR14、VAR17、VAR9,共同因素5包含VAR16、VAR15,共同因素6包含VAR7。ROTATEDCOMPONENTMATRIXACOMPONENT123456VAR00012877158117182193143VAR00011854144322VAR00010524398468187269280VAR00005217910267119136VAR00004205894298188132VAR00008103175939136139107VAR00006346886135181VAR00013413807150VAR00014132196325728252299VAR00017589325173608175127VAR00009549409175594214199VAR00016164160126928VAR00015252221136881VAR00007167181119936AROTATIONCONVERGEDIN7ITERATIONS另外,從下面的因素得分協(xié)方差矩陣也可以看出6個公共因素是不相關(guān)的,從而達到了既簡化財務(wù)指標數(shù)目,又防止出現(xiàn)多重共線性的目的。COMPONENTSCORECOVARIANCEMATRIXCOMPONENT123456110000000000000000002000100000000000000030000001000000000000400000000010000000005000000000000100000060000000000000001000下圖是最終的得到的因素得分系數(shù)矩陣。COMPONENTSCORECOEFFICIENTMATRIXCOMPONENT123456VAR00004100569144055075116VAR00005056587154119049111VAR00006050046502062011145VAR00007069131093030026971VAR00008033251614073064047VAR00009019104111230035038VAR00010255073235131248120VAR00011480067055153022096VAR00012564093032352056030VAR00013089122039609132206VAR00014358094019606022253VAR00015146131023145471054VAR00016126210111084565020VAR00017072033064237003025由因素得分系數(shù)矩陣即可得到公共因素(F1F6)被表示成14個財務(wù)指標線性組合的形式,如F1的線性組合如下F101VAR40056VAR5005VAR60069VAR70033VAR80019VAR90255VAR10048VAR110564VAR120089VAR130358VAR140146VAR150126VAR160072VAR17所得到的用于下一步LOGISTIC回歸的原始數(shù)據(jù)從SPSS軟件中已給出,即序號上市公司名是否違約FAC1_1FAC2_1FAC3_1FAC4_1FAC5_1FAC6_11石家莊寶石電子玻璃股份有限公司是0664520709050564151559591608570482892丹東化學(xué)纖維股份有限公司是0944430099460622721654520529380205563中潤資源投資股份有限公司是204581003955022161145559081240485534廣夏銀川實業(yè)股份有限公司是0050870422215566810759941051380295075上海復(fù)星醫(yī)藥集團股份有限公司是0128270394760347320369740085770024686上海寬頻科技股份有限公司是2693690805250220110984910567170218397上海寬頻科技股份有限公司是137450418470112451526870401090524068上海寬頻科技股份有限公司是0030570182951228991442980199670156169紫光古漢集團股份有限公司否01025800252805057206940407339803491510四川大通燃氣開發(fā)股份有限公司否022591022550047940319870468230051511青海明膠股份有限公司否04659205426901113207521109739500573712蕪湖海螺型材科技股份有限公司否01568103501800506507831234654805007713山西三維集團股份有限公司否0822651068920137606340107606503322514北大國際醫(yī)院集團西南合成制藥股份有限公司否011810400770246940140950370401817115成都華神集團股份有限公司否00281401565106352601624110223404537116青海鹽湖工業(yè)股份有限公司否2171991023310356340692380915904828317陜西金葉科教集團股份有限公司否00461801485107070811024206359605892118魯西化工集團股份有限公司否07529708332200559301743923066303511419數(shù)源科技股份有限公司否19943300411702553214759203260300288620四川瀘天化股份有限公司否05813203049901467808478509294202350421江蘇華西村股份有限公司否03912500463703045701033149320343322重慶華邦制藥股份有限公司否04304304428706476601719408479735055223華蘭生物工程股份有限公司否13138604554606468404901204958302435724浙江杭州鑫富藥業(yè)股份有限公司否00339606907104241306469700170500380625上海科華生物工程股份有限公司否11064814639703130308583901359433847726貴州航天電器股份有限公司否07244847452704329806507304051923803827國光電器股份有限公司否133112025843021422592340079901105328蘇州固锝電子股份有限公司否13456916454301345609542115970820377929東港股份有限公司否09471905559901374802059714134307473730有研半導(dǎo)體材料股份有限公司否00787805627404430505312306078806944131安徽銅峰電子股份有限公司否0324720588370407608013905416200298232牡丹江恒豐紙業(yè)股份有限公司否01432300810702765303115501406202057933吉林華微電子股份有限公司否0160650402930174421556470702810259334廣東冠豪高新技術(shù)股份有限公司否11205803781501496206551802427405317135廣東榕泰實業(yè)股份有限公司否02741505984102656314163400089301032136西南藥業(yè)股份有限公司否12409306217700260607402801008901509537宜賓紙業(yè)股份有限公司否0833430790208150909374503351605296138浙江錢江生物化學(xué)股份有限公司否01057705793702583809630205756902386739上海界龍實業(yè)集團股份有限公司否08306302603101871075328045184008369這里特別需要說明的是,此表中的FAC1_1與上面F1的計算公式略有不同,是由于SPSS將數(shù)據(jù)自動進行了標準化操作,即FAC1_1等于因素得分系數(shù)矩陣(AIJ)和原始變量的標準化值的乘積之和,公式為FAC1_1A11(VAR1U)/A21(VAR2U)/,其中U所有樣本的均值,為所有樣本的標準差。FAC1_1FAC6_1可直接用于LOGISTIC回歸,作為其自變量估計參數(shù)使用。下面是所有數(shù)據(jù)準備完畢后,使用SAS軟件的LOGISTIC回歸函數(shù)進行回歸分析。程序代碼如下ODSGRAPHICSON/為繪制ROC曲線做準備/PROCLOGISTICDATADR_LOGISDEFAULTRISK_LOGISTICDESCENDINGPLOTSROCIDPROB/調(diào)用LOGISTIC;指定繪制ROC曲線;DESCENDING用來指定按照選項ORDER指定順序的倒序排列,目的是為得到針對違約概率P的模型參數(shù)/MODELYFAC1_1FAC2_1FAC3_1FAC4_1FAC5_1FAC6_1/SELECTIONSTEPWISESLSTAY015SLENTRY015DETAILSLACKFITSTB/指定Y為因變量,F(xiàn)AC1_1到FAC6_1為自變量;采用逐步篩選法,變量被選進和剔除模型的顯著水平均為15;DETAILS為輸出選擇方法的詳細信息;LACKFIT為進行對模型進行擬合失真檢驗HOSMERANDLEMESHOWTEST;STB指定輸出標準化數(shù)據(jù)模型選項/RUNODSGRAPHICSOFF以下為SAS軟件執(zhí)行以上程序輸出的結(jié)果和相應(yīng)的解釋THELOGISTICPROCEDUREMODELINFORMATIONDATASETDR_LOGISDEFAULTRISK_LOGISTICRESPONSEVARIABLEY0,非違約;1,違約MODELINFORMATIONNUMBEROFRESPONSELEVELS2MODELBINARYLOGITOPTIMIZATIONTECHNIQUEFISHERSSCORINGNUMBEROFOBSERVATIONSREAD39NUMBEROFOBSERVATIONSUSED39RESPONSEPROFILEORDEREDVALUEYTOTALFREQUENCY11008200031PROBABILITYMODELEDISY100以上主要顯示的是要建模的數(shù)據(jù)集信息,數(shù)據(jù)集為DR_LOGISDEFAULTRISK_LOGISTIC;響應(yīng)變量為Y,0代表未違約,1代表違約;響應(yīng)水平數(shù)為2;連接函數(shù)為BINARYLOGIT;最優(yōu)化方法為費雪得分算法;讀入和使用的觀測數(shù)均為39,其中違約觀測數(shù)為8,未違約觀測數(shù)為31;最后一行代表計算用的分析響應(yīng)變量的概率模型值為1事件的發(fā)生概率以下是采用逐步篩選法對變量進行篩選的過程STEPWISESELECTIONPROCEDURESTEP0INTERCEPTENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIED從上表可以看出此模型時是收斂的,和變量無關(guān),說明模型擬合達到收斂標準。2LOGL39580ANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT1135450396611667400006RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ266656600002下表說明的是下一步可能進入模型篩選的變量信息。其中第2、5、6號變量不符合我們制定的顯著性水平達15的標準。ANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC1_119897400017FAC2_110055408139FAC3_116159700131FAC4_119065900026FAC5_111375702408FAC6_110111507384第一個變量進入模型。STEP1EFFECTFAC1_1ENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIEDMODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESAIC4158033581MODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESSC43243369082LOGL3958029581以上三個指標值均為越小越好。以下三個指標值的P值均小于001,說明有顯著統(tǒng)計意義,建模效果比較顯著。TESTINGGLOBALNULLHYPOTHESISBETA0TESTCHISQUAREDFPRCHISQLIKELIHOODRATIO99983100016SCORE98974100017WALD70043100081ANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT1177810530411239800008FAC1_111411705334700430008107783從上表可以看出,F(xiàn)AC1_1前的系數(shù)顯著。STANDARDIZEDESTIMATE是在模型代碼中加入STB語句才出現(xiàn)的。ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC1_1024400860693ASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESPERCENTCONCORDANT847SOMERSD0694PERCENTDISCORDANT153GAMMA0694PERCENTTIED00TAUA0232PAIRS248C0847以上表格主要注意C統(tǒng)計量,它反映了實際觀測值和模型預(yù)測的事件概率的關(guān)聯(lián)強度,越高越好。另外PERCENTCONCORDANT代表ROC曲線所圍面積。RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ185470500023ANALYSISOFEFFECTSELIGIBLEFORREMOVALEFFECTDFWALDCHISQUAREPRCHISQFAC1_117004300081第一步篩選沒有變量被移除。NOTENOEFFECTSFORTHEMODELINSTEP1AREREMOVEDANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC2_110008409268FAC3_119663900019FAC4_118226500041FAC5_111974701599FAC6_110418705176第三個變量加入到模型中。STEP2EFFECTFAC3_1ENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIEDMODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESAIC4158027745SC43243327362LOGL3958021745TESTINGGLOBALNULLHYPOTHESISBETA0TESTCHISQUAREDFPRCHISQLIKELIHOODRATIO178345200001SCORE160570200003WALD87383200127ANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT121093070588930900028FAC1_111718706193770270005509476FAC3_112219712435318650074212238ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC1_1017900530604ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC3_1010900091243ASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESPERCENTCONCORDANT919SOMERSD0839PERCENTDISCORDANT81GAMMA0839PERCENTTIED00TAUA0281PAIRS248C0919RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ97410400450ANALYSISOFEFFECTSELIGIBLEFORREMOVALEFFECTDFWALDCHISQUAREPRCHISQFAC1_117702700055FAC3_113186500742NOTENOEFFECTSFORTHEMODELINSTEP2AREREMOVEDANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC2_110544504606ANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC4_118394100038FAC5_113046100809FAC6_110948203302STEP3EFFECTFAC4_1ENTEREDMODELCONVERGENCESTATUSCONVERGENCECRITERIONGCONV1E8SATISFIEDMODELFITSTATISTICSCRITERIONINTERCEPTONLYINTERCEPTANDCOVARIATESAIC4158019625SC43243262792LOGL3958011625TESTINGGLOBALNULLHYPOTHESISBETA0TESTCHISQUAREDFPRCHISQLIKELIHOODRATIO2795483CHISQSTANDARDIZEDESTIMATEANALYSISOFMAXIMUMLIKELIHOODESTIMATESPARAMETERDFESTIMATESTANDARDERRORWALDCHISQUAREPRCHISQSTANDARDIZEDESTIMATEINTERCEPT128978102837941600048FAC1_112469112063418960040713613FAC3_111413608246293870086507794FAC4_112198610069476720029012121ODDSRATIOESTIMATESEFFECTPOINTESTIMATE95WALDCONFIDENCELIMITSFAC1_1008500080900FAC3_1024300481225FAC4_1011100150799ASSOCIATIONOFPREDICTEDPROBABILITIESANDOBSERVEDRESPONSESPERCENTCONCORDANT960SOMERSD0919PERCENTDISCORDANT40GAMMA0919PERCENTTIED00TAUA0308PAIRS248C0960RESIDUALCHISQUARETESTCHISQUAREDFPRCHISQ08848308291以上為殘差的卡方檢驗,P值顯著說明殘差滿足正態(tài)分布。ANALYSISOFEFFECTSELIGIBLEFORREMOVALEFFECTDFWALDCHISQUAREPRCHISQFAC1_114189600407FAC3_112938700865FAC4_114767200290NOTENOEFFECTSFORTHEMODELINSTEP3AREREMOVEDANALYSISOFEFFECTSELIGIBLEFORENTRYEFFECTDFSCORECHISQUAREPRCHISQFAC2_110510204750FAC5_110589604426FAC6_110008909248第2、5、6號變量由于P值過大,沒有入選模型。以下表格是變量被入選時的P值等信息。NOTENOADDITIONALEFFECTSMETTHE015SIGNIFICANCELEVELFORENTRYINTOTHEMODELSUMMARYOFSTEPWISESELECTIONEFFECTSTEPENTEREDREMOVEDDFNUMBERINSCORECHISQUAREWALDCHISQUAREPRCHISQVARIABLELABEL1FAC1_1119897400017REGRFACTORSCORE1FORANALYSIS12FAC3_1129663900019REGRFACTORSCORE3FORANALYSIS13FAC4_1138394100038REGRFACTORSCORE4FORANALYSIS1ROC曲線對應(yīng)面積為09597,說明模型擬合效果令人滿意。PARTITIONFORTHEHOSMERANDLEMESHOWTESTY100Y000GROUPTOTALOBSERVEDEXPECTEDOBSERVEDEXPECTED14000044002400014399340002439844000443965400054395641011338974005043508400654335PARTITIONFORTHEHOSMERANDLEMESHOWTESTGROUPTOTALY100Y000OBSERVEDEXPECTEDOBSERVEDEXPECTED944363003710332970003HOSMERANDLEMESHOWGOODNESSOFFITTESTCHISQUAREDFPRCHISQ89660803452以上HOSMERANDLEMESHOWTEST的P值為03452,說明統(tǒng)計不顯著,所以接受原假設(shè)“模型不存在擬合失真”,即表示模型的擬合優(yōu)度已經(jīng)滿足要求。最后留在模型中的變量為第1、3、4號變量,所得到的LOGISTIC回歸模型為LOGITP2897824691X114136X321986X4,其中1或2897824691X114136X321986X412897824691X114136X321986X4對于LOGISTIC回歸的小結(jié)和說明1采用逐步篩選法進行回歸,可看到每加入一個新的變量到模型中后,AIC、SC、2LOGL三項指標均有所改善,但經(jīng)反復(fù)試驗,當?shù)?、3、4變量進入模型后,其他變量再進入后,對此三項指標的改善作用已極其有限,也會使其他指標,如WALD指標明顯惡化,并且第2、5、6變量本身P值過大,不顯著,同時考慮到采用1、3、4變量后AIC、SC、2LOGL、LIKELIHOODRATIO、SCORE、ROC曲線、優(yōu)比指標較優(yōu),WALD也在01以下,權(quán)衡后篩選出這3個變量構(gòu)建模型。2雖然最終的LOGISTIC模型中沒有用到第2、5、6個變量,但并不能省略之前對VAR417所包含數(shù)據(jù)的提取和因子分析的工作,因為最終模型用到的第1、3、4個變量可能利用到了VAR417里面包含的數(shù)據(jù)。唯一能進行簡化的工作只是可以在進行LOGISTC回歸時可以不利用第2、5、6個變量進行建模,不用采用逐步篩選法對變量進行篩選而已。3因為在做因子分析時,轉(zhuǎn)軸采用的是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年及未來5年市場數(shù)據(jù)中國騾鴨行業(yè)市場深度分析及投資潛力預(yù)測報告
- 軟件常用工具培訓(xùn)
- 軟件使用培訓(xùn)課件
- 畢業(yè)生法律知識
- 賈曉宇舞蹈美人圖課件
- 環(huán)保主題演講演講稿格式作文13篇范文
- 月亮下的童話寓言故事(11篇)
- 趣味知識問答比賽
- 購物中心主管培訓(xùn)
- 趣味法律知識
- 建筑結(jié)構(gòu)健康監(jiān)測技術(shù)方案
- 國家電網(wǎng)有限公司輸變電工程通 用設(shè)計(330~750kV輸電線路絕緣子金具串通 用設(shè)計分冊)2024版
- 欠債抵房屋協(xié)議合同
- TSG R0004-2025固定式壓力容器安全技術(shù)監(jiān)察規(guī)程
- 大學(xué)勞動教育(第二版)課件 第二章 勞動價值觀與勞動素養(yǎng)
- DBJ50T-240-2016 蒸壓加氣混凝土精確砌塊自承重墻體工程應(yīng)用技術(shù)規(guī)程
- 重難點08滑塊-滑板模型專題高一物理題組法突破重難點(原卷版)
- 2024鐵路營業(yè)線作業(yè)人員北斗安全預(yù)警防護系統(tǒng)技術(shù)條件
- 《東北解放區(qū)工業(yè)戲劇研究(1945-1949年)》
- 新版中國食物成分表
- 外研版七年級英語上冊電子版課文-七上外研版英語電子書
評論
0/150
提交評論