版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十章主成分分析和因子分析主要內(nèi)容10.1主成分分析和因子分析簡介10.2主成分分析10.3因子分析10.1主成分分析和因子分析簡介10.1.1基本概念和主要用途(1)基本概念
主成分分析就是考慮各指標(biāo)之間的相互關(guān)系,利用降維的方法將多個(gè)指標(biāo)轉(zhuǎn)換為少數(shù)幾個(gè)互不相關(guān)的指標(biāo),從而使進(jìn)一步研究變得簡單的一種統(tǒng)計(jì)方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降維”的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo),稱為主成分。每個(gè)主成分均是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。
因子分析是一種通過顯在變量測評(píng)潛在變量,通過具體指標(biāo)測評(píng)抽象因子的分析方法,最早是由心理學(xué)家ChalesSpearman在1904年提出的,它的基本思想是將實(shí)測的多個(gè)指標(biāo),用少數(shù)幾個(gè)潛在指標(biāo)(因子)的線性組合表示。10.1主成分分析和因子分析簡介(2)主要用途解決共線性問題;評(píng)估問卷的結(jié)構(gòu)效度;尋找變量之間的潛在結(jié)構(gòu);內(nèi)在結(jié)構(gòu)證實(shí)。(3)常用術(shù)語因子載荷變量共同度公共因子的方差貢獻(xiàn)10.1主成分分析和因子分析簡介3常用術(shù)語(1)因子載荷(2)變量共同度(3)公共因子的方差貢獻(xiàn)
10.1主成分分析和因子分析簡介10.1.2主成分和公因子數(shù)量的確定(1)確定時(shí)遵循幾個(gè)原則主成分的累積貢獻(xiàn)率:一般來說,提取主成分的累積貢獻(xiàn)率達(dá)到80%~85%以上就比較滿意了,可以由此確定需要提取多少個(gè)主成分。
特征值:特征值在某種程度上可以看成表示主成分影響力度大小的指標(biāo),如果特征值小于1,說明該主成分的解釋力度還不如直接引入原變量的平均解釋力度大。因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。
綜合判斷:大量的實(shí)際情況表明,如果根據(jù)累積貢獻(xiàn)率來確定主成分?jǐn)?shù)往往較多,而用特征值來確定又往往較少,很多時(shí)候應(yīng)當(dāng)將兩者結(jié)合起來,以綜合確定合適的數(shù)量。10.1主成分分析和因子分析簡介10.1.3兩者的區(qū)別與聯(lián)系(1)兩者都是在多個(gè)原始變量中通過它們之間的內(nèi)部相關(guān)性來獲得新的變量(主成分變量或因子變量),達(dá)到既能減少分析指標(biāo)個(gè)數(shù),又能概括原始指標(biāo)主要信息的目的。(2)提取公因子主要有主成分分析法和公因子法,若采用主成分法,則主成分分析和因子分析基本等價(jià)。(3)因子分析提取的公因子比主成分分析提取的主成分更具有解釋性。(4)兩者分析的實(shí)質(zhì)和重點(diǎn)不同。(5)兩者的SPSS操作都是通過“分析→降維→因子分析”過程實(shí)現(xiàn)的,主成分分析不需要因子旋轉(zhuǎn),而因子分析需要經(jīng)過旋轉(zhuǎn)。主要內(nèi)容10.1主成分分析和因子分析簡介10.2主成分分析10.3因子分析10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理
10.2主成分分析(1)統(tǒng)計(jì)原理
10.2主成分分析10.2.1統(tǒng)計(jì)原理與分析步驟(2)分析步驟
第1步原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理。第2步計(jì)算相關(guān)系數(shù)矩陣。第3步計(jì)算特征值及單位特征向量。第4步計(jì)算主成分的方差貢獻(xiàn)率和累積方差貢獻(xiàn)率。第5步計(jì)算主成分。
10.2主成分分析10.2.2SPSS實(shí)例分析【例10-1】為了從總體上反映世界經(jīng)濟(jì)全球化的狀況,現(xiàn)選擇了具有代表性的16個(gè)國家的數(shù)據(jù),這些國家參與經(jīng)濟(jì)全球化的程度指標(biāo)值如下表所示。試分析一個(gè)國家參與經(jīng)濟(jì)全球化的程度主要受哪些因素的影響。編號(hào)國家x1x2x3x4x5x6x7x8x9x10x11x12x13x14x151中國3.20554.528.530.8781.4090.89411.62.3050.5472.9324.8189.0032.73.9141.4722印度1.44931.10.2790.3390.2720.12.70.1280.1930.8252.3185.1270.640.2183日本14.07952.30.65310.25411.7691.09701.9671.36.17814.74627.29730.957.73415.1254韓國1.318136.31.0111.60.421.8381.30.770.782.26723.3242.8759.112.1290.4525新加坡0.275739.53.57227.8410.88413.31428.60.6220.1431.885169.772319.90754.2917.3280.7186美國29.64146.13.6826.42920.5634.8085.424.25329.94115.63810.78424.55513.624.49521.2747加拿大2.056101.50.8988.2762.3135.36910.52.4445.1453.85434.69167.04715.121.831.3628巴西2.43427.11.5842.3270.9622.9056.81.9532.30.8574.71610.1016.75.4981.1049墨西哥1.567151.41.6572.8370.7971.47110.90.670.2122.18618.48537.9864.54.8870.46810英國4.67118.40.49726.15112.45622.13711.216.55219.6425.54228.43458.766.1278.96811.28911法國4.639120.61.849.2424.49210.8488.58.2825.8415.2128.4654.05229.256.4538.88912德國6.84132.92.2529.5586.6467.7472.28.5898.9718.84332.12163.1743651.51412.1813意大利3.792104.50.3218.1533.7241.0592.50.771.9134.03222.86943.9242717.7765.67814俄羅斯1.358.61.5331.4990.5520.4992.50.310.2980.9877.7712.5811.12.0010.46915澳大利亞1.30994.50.5025.7730.9411.98718.90.5271.3711.13115.74533.79513.224.1170.79716新西蘭0.177110.50.2187.3740.1793.0431.50.1260.3380.24823.22147.38719.841.2740.21510.2主成分分析第1步分析:從數(shù)據(jù)來看,一共有15個(gè)因素,但有些因素是存在相關(guān)性的,同時(shí)各因素對(duì)全球化影響的程度也是不一樣的,故可采用主成分分析。第2步數(shù)據(jù)組織:按如教材所示的“指標(biāo)”一列定義變量,輸入數(shù)據(jù)并保存。第3步主成分分析的設(shè)置:按“分析→降維→因子分析”順序打開“因子分析”對(duì)話框,將x1~x15這15個(gè)變量移入“變量”對(duì)話框中,并按如下所示的圖形進(jìn)行設(shè)置。
10.2主成分分析10.2主成分分析說明:由于在SPSS中并沒有完整的主成分分析過程,其主成分分析過程是集成在“因子分析”過程中的,但并不完善。由于主成分的得分需要對(duì)因子得分情況進(jìn)行進(jìn)一步計(jì)算,故不需設(shè)置“得分”子對(duì)話框,即不需保存因子得分情況,即使保存了,因子得分也不是各主成分得分的結(jié)果。對(duì)于提取因子的個(gè)數(shù)問題,一般遵循兩個(gè)標(biāo)準(zhǔn),其一是累計(jì)方差貢獻(xiàn)率在80%以上,其二是其特征值大于1。本例之所以設(shè)置為3,是因?yàn)橥ㄟ^預(yù)先分析,發(fā)現(xiàn)前3個(gè)主成分可以解釋總體信息的86.7%。
10.2主成分分析第四步因子分析的結(jié)果:特征值和方差貢獻(xiàn)表成分初始特征值提取平方和載入合計(jì)方差的%累積%合計(jì)方差的%累積%16.04940.32540.3256.04940.32540.32525.81338.75579.0805.81338.75579.08031.1427.61686.6961.1427.61686.6964.8765.84292.5385.5993.99696.5346.3262.17498.7097.119.79699.5058.041.27299.7769.018.12199.89710.010.06399.96111.004.02799.98812.001.00999.99713.000.00299.99914.000.001100.000154.080E-72.720E-6100.000提取方法:主成分分析。從表中可以看出前3個(gè)主成分已經(jīng)解釋了總方差的近86.7%,故可以選擇前3個(gè)主成分進(jìn)行分析。10.2主成分分析第四步因子分析的結(jié)果:主成分的碎石圖該圖從另一個(gè)側(cè)面說明了取前三個(gè)主成分為宜。10.2主成分分析第四步因子分析的結(jié)果:旋轉(zhuǎn)前的因子載荷矩陣成分123x1.407.805.268x2.596-.727.209x3-.147.016.821x4.895-.333-.181x5.614.763.028x6.826-.124-.281x7.273-.627.184x8.636.703.041x9.619.703.008x10.552.766.196x11.654-.691.172x12.666-.685.166x13.863-.191-.297x14.728-.632.144x15.579.760.005提取方法
:主成分。a.已提取了
3個(gè)成分。說明:教材中公式10.7中的是標(biāo)準(zhǔn)化正交向量,并不是SPSS輸出“因子載荷矩陣”中的系數(shù)。而“因子載荷矩陣”中各分量的系數(shù)為單位特征向量乘以相應(yīng)的特征值的平方根的結(jié)果,其公式為。故需進(jìn)一步利用因子分析的結(jié)果進(jìn)行主成分分析。10.2主成分分析第五步利用因子分析的結(jié)果進(jìn)行主成分分析。10.2主成分分析第六步主要結(jié)果:編號(hào)國家y1y2y31中國-2.190.073.01-0.632印度-2.56-0.11-0.46-1.113日本0.451.85-0.270.884韓國-1.69-0.46-0.27-0.885新加坡5.28-6.261.19-0.206美國3.306.071.463.807加拿大-0.43-0.47-0.31-0.388巴西-1.91-0.06-0.43-0.839墨西哥-1.68-0.680.03-0.9410英國4.460.98-1.752.0511法國0.870.46-0.520.4912德國1.401.34-0.261.0613意大利-0.610.10-0.54-0.2514俄羅斯-2.35-0.20-0.30-1.0515澳大利亞-1.36-0.92-0.30-0.9316新西蘭-0.99-1.73-0.28-1.09過綜合得分的高低可知各國參與國際化水平的高低,其中美國最高,印度最低。主要內(nèi)容10.1主成分分析和因子分析簡介10.2主成分分析10.3因子分析10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟(1)統(tǒng)計(jì)原理其中x1,x2,…,xp為p個(gè)原有變量,是均值為零,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,F(xiàn)1,F(xiàn)2,…,F(xiàn)m為m個(gè)因子變量,m小于p,表示成矩陣形式為:10.3因子分析10.3.1統(tǒng)計(jì)原理與分析步驟(2)分析步驟第1步將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;第2步確定待分析的原有若干變量是否適合于因子分析;第3步構(gòu)造因子變量;第4步利用旋轉(zhuǎn)使得因子變量更具有可解釋性;第5步計(jì)算因子變量的得分。計(jì)算因子得分和模型為:j=1,2,…,m
10.3因子分析10.3.2SPSS實(shí)例分析【例10-2】為了研究幾個(gè)省市的科技創(chuàng)新力問題,現(xiàn)取了2005年8個(gè)省市的15個(gè)科技指標(biāo)數(shù)據(jù),試分析一個(gè)省的科技創(chuàng)新能力主要受哪些潛在因素的影響?省市x1x2x3x4x5x6x7x8x9x10x11x12x13x14x15北京22980.2648.524.493.555.5510.2344774.4525.0224.1779.24226.0134.423183.292.12天冿8767.4836.8214.082.621.964.4935451.7733.5921.38410.3473.1525.06495.781.82遼寧4465.6935.948.342.321.562.4518974.211.295.57263.3522.3215.21204.981.78上海10474.0635.9817.844.782.284.851485.8339.7219.08654.31112.3215.851303.322江蘇5060.7934.076.82.131.473.1724489.1843.1317.99206.6816.69.14134.891.41浙江5363.4831.085.423.951.221.8327435.387.947.63257.6522.665.8279.011.72山東3064.5933.224.441.811.051.5920022.579.175.69117.739.768.41106.361.34廣東3569.6437.275.813.661.092.1824327.3235.6724.99117.5120.45.08122.331.4710.3因子分析第1步分析:如題所述,要分析一個(gè)省的科技創(chuàng)新能力受哪些潛在因素的影響,可用因子分析法進(jìn)行分析。第2步數(shù)據(jù)組織:建立x1~x15共15個(gè)數(shù)據(jù)變量和一個(gè)“省市”字符型變量,將北京、天津等8個(gè)省市作為個(gè)案數(shù)據(jù)輸入并保存。第3步因子分析設(shè)置:按“分析→降維→因子分析”打開“因子分析”對(duì)話框,將x1~x15這15個(gè)變量移入“變量”對(duì)話框中,表示對(duì)這15個(gè)變量數(shù)據(jù)進(jìn)行因子分析。10.3因子分析“得分”對(duì)話框的設(shè)置:單擊“得分(S)…”按鈕,彈出此子對(duì)話框,選擇“保存為變量”,即將因子得分保存下來。第4步主要結(jié)果及分析:特征值與方差貢獻(xiàn)表可以看出前3個(gè)特征值大于1,同時(shí)這3個(gè)公共因子的方差貢獻(xiàn)率占了93.924%,說明提取這3個(gè)公共因子可以解釋原變量的絕大部分信息。10.3因子分析旋轉(zhuǎn)前的因子載荷矩陣表的底部表明使用的是主成分分析法,3個(gè)主成分被抽取出來。成分123x1.973-.158.052x2.919.036-.090x3.883-.161.334x4.985-.004-.022x5.482.497-.664x6.947-.242.131x7.972-.108.178x8.849.340-.301x9.300.834.386x10.611.637.399x11.955-.001-.211x12.992-.091-.001x13.876-.282.205x14.968-.156.032x15.859-.092-.385提取方法
:主成分。a.已提取了3個(gè)成分。10.3因子分析旋轉(zhuǎn)后的因子載荷矩陣是按照前面設(shè)定的“方差極大法”對(duì)因子載荷矩陣旋轉(zhuǎn)的結(jié)果。在表10.10所示未經(jīng)旋轉(zhuǎn)的載荷矩陣中,因子變量在許多變量上均有較高的載荷,從旋轉(zhuǎn)后的因子載荷矩陣可以看出,因子1在1、3、4、6、7、12、13、14上有較大載荷,反映科技投入與產(chǎn)出情況,可以命名為創(chuàng)新水平因子;因子2在指標(biāo)5、8、15上有較大載荷,反映地區(qū)經(jīng)濟(jì)發(fā)展及財(cái)政科教投入水平,可以命名為創(chuàng)新環(huán)境因子;因子3在指標(biāo)9和指標(biāo)10上有較大載荷,可以命名為高技術(shù)產(chǎn)業(yè)發(fā)展因子。成分123x1.936.286.130x2.776.459.202x3.924.016.251x4.867.413.221x5.068.940.180x6.966.177.095x7.944.202.235x8.541.726.327x9.018.137.956x10.377.172.876x11.794.558.118x12.913.365.161x13.937.071.084x14.926.301.119x15.705.626-.069提取方法:主成分。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。a.旋轉(zhuǎn)在
5次迭代后收斂。10.3因子分析因子轉(zhuǎn)換矩陣表表明因子提取的方法是主成分分析,旋轉(zhuǎn)的方法是方差極大法。成分1231.884.403.2392-.405.400.8223.236-.823.517提取方法:主成分。旋轉(zhuǎn)法:具有Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法。因子得分及綜合因子得分情況
省市F1F2F3F綜合排序山東-0.344-1.001-0.945-0.5368浙江-0.7910.905-1.223-0.4737江蘇-0.488-1.0241.073-0.3426廣東-0.791-0.1041.202-0.3275遼寧-0.002-0.500-1.206-0.2694天冿0.248-0.2750.5720.1773上海-0.1361.9470.4810.3662北京2.3050.0530.0451.4061TheEnd第十一章時(shí)間序列分析主要內(nèi)容11.1時(shí)間序列的建立和平穩(wěn)化11.2指數(shù)平滑法11.3ARIMA模型11.4時(shí)序序列的季節(jié)性分解11.1時(shí)間序列的建立和平穩(wěn)化11.1.1填補(bǔ)缺失值時(shí)間序列分析中的缺失值不能采用通常刪除的辦法來解決,因?yàn)檫@樣會(huì)導(dǎo)致原有時(shí)間序列周期性的破壞,而無法得到正確的分析結(jié)果。按“轉(zhuǎn)換→替換缺失值”打開“替換缺失值”對(duì)話框缺失值替換示例11.1時(shí)間序列的建立和平穩(wěn)化11.1.2定義日期變量定義日期模塊可以產(chǎn)生周期性的時(shí)間序列日期變量。使用“定義日期”對(duì)話框定義日期變量,需要在數(shù)據(jù)窗口讀入一個(gè)按某種時(shí)間順序排列的數(shù)據(jù)文件,數(shù)據(jù)文件中的變量名不能與系統(tǒng)默認(rèn)的時(shí)間變量名重復(fù),否則系統(tǒng)建立的日期變量會(huì)覆蓋同名變量。系統(tǒng)默認(rèn)的變量名有:年份,年份、季度,年份、月份,年份、季度、月份,日,星期、日,日、小時(shí)等。按“數(shù)據(jù)→定義日期”順序打開“定義日期”對(duì)話框
定義日期變量示例11.1時(shí)間序列的建立和平穩(wěn)化11.1.3創(chuàng)建時(shí)間序列時(shí)間序列分析建立在序列平穩(wěn)的條件上,判斷序列是否平穩(wěn)可以看它的均數(shù)方差是否不再隨時(shí)間的變化而變化,自相關(guān)系數(shù)是否只與時(shí)間間隔有關(guān)而與所處時(shí)間無關(guān)。在時(shí)間序列分析中,為檢驗(yàn)時(shí)間序列的平穩(wěn)性,經(jīng)常要用一階差分、二階差分,有時(shí)為選擇一個(gè)合適的時(shí)間序列模型還要對(duì)原時(shí)間序列數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換或平方轉(zhuǎn)換等。這就需要在已經(jīng)建立的時(shí)間序列數(shù)據(jù)文件中,再建立一個(gè)新的時(shí)間序列變量。按“轉(zhuǎn)換→創(chuàng)建時(shí)間序列”順序打開“創(chuàng)建時(shí)間序列”對(duì)話框創(chuàng)建時(shí)間序列示例11.1時(shí)間序列的建立和平穩(wěn)化11.1.3創(chuàng)建時(shí)間序列時(shí)序圖舉例,按“分析→預(yù)測→序列圖”順序打開“序列圖”對(duì)話框
時(shí)序圖示例主要內(nèi)容11.1時(shí)間序列的建立和平穩(wěn)化11.2指數(shù)平滑法11.3ARIMA模型11.4時(shí)序序列的季節(jié)性分解11.2指數(shù)平滑法11.2.1基本概念及統(tǒng)計(jì)原理(1)基本概念
指數(shù)平滑法的思想來源于對(duì)移動(dòng)平均預(yù)測法的改進(jìn)。指數(shù)平滑法的思想是以無窮大為寬度,各歷史值的權(quán)重隨時(shí)間的推移呈指數(shù)衰減,這樣就解決了移動(dòng)平均的兩個(gè)難題。(2)統(tǒng)計(jì)原理
11.2指數(shù)平滑法11.2.1基本概念及統(tǒng)計(jì)原理(2)統(tǒng)計(jì)原理
簡單模型Holt線性趨勢模型11.2指數(shù)平滑法11.2.2SPSS實(shí)例分析【例11-4】為了研究上海市的人口情況,某研究小組提取了1978~2004年上海市的人口數(shù)據(jù),其中有3個(gè)統(tǒng)計(jì)指標(biāo),即x1:年末人口數(shù)(萬人),x2:非農(nóng)業(yè)人口數(shù)(萬人),x3:人口密度(人/平方千米),具體數(shù)據(jù)如下表所示。試用指數(shù)平滑法對(duì)上海市的“年末人口數(shù)”進(jìn)行預(yù)測分析。年份x1x2x3年份x1x2x319781098.28645.23177619921289.37875.55203419791132.14687.38183019931294.74893.46204219801146.52702.43185419941298.81910.49204819811162.84715.08188019951301.37921.7205219821180.51731.31190819961304.43932.14205719831194.01745.86193019971305.46943.03205919841204.78760.75194819981306.58953.65206119851216.69776.37196719991313.12969.63207119861232.33802.56194420001321.63986.16208419871249.51822.31197120011327.14999.07209319881262.42838.93199120021334.231018.81210419891276.45855.84201320031341.771041.39211619901283.35864.46202420041352.391097.6213319911287.2869.882030
11.2指數(shù)平滑法第1步數(shù)據(jù)組織:將數(shù)據(jù)組織成4列,一列是“年份”,另外3列是3個(gè)人口數(shù)據(jù)的變量,輸入數(shù)據(jù)并保存。第2步分析:看用指數(shù)平滑法處理是否恰當(dāng)。按11.1.3節(jié)所述創(chuàng)建年末人口數(shù)的時(shí)序圖,如下圖所示。從此圖可以看出,年末人口數(shù)呈逐年增加趨勢,開始增長較快,然后變慢,近似線性趨勢,也可以說呈衰減的線性趨勢,或者用指數(shù)趨勢描述更準(zhǔn)確。所以選用指數(shù)平滑法進(jìn)行處理。11.2指數(shù)平滑法第3步定義日期變量:按11.1.2節(jié)所述將“年份”定義為日期變量。第4步指數(shù)平滑法設(shè)置:按“分析→預(yù)測→創(chuàng)建模型”順序打開“時(shí)間序列建模器”對(duì)話框。具體設(shè)置如幾下幾張圖所示:11.2指數(shù)平滑法11.2指數(shù)平滑法第5步主要結(jié)果及分析:模型的描述表模型類型模型
ID年末人口數(shù)模型_1Holt表示對(duì)“年末人口數(shù)”變量進(jìn)行指數(shù)平滑法處理,使用的是“Holt”模型。模型的擬合情況表
擬合統(tǒng)計(jì)量均值SE最小值最大值百分位5102550759095平穩(wěn)的R方-.005.-.005-.005-.005-.005-.005-.005-.005-.005-.005R方.995..995.995.995.995.995.995.995.995.995RMSE4.811.4.8114.8114.8114.8114.8114.8114.8114.8114.811MAPE.243..243.243.243.243.243.243.243.243.243MaxAPE1.632.1.6321.6321.6321.6321.6321.6321.6321.6321.632MAE3.001.3.0013.0013.0013.0013.0013.0013.0013.0013.001MaxAE18.707.18.70718.70718.70718.70718.70718.70718.70718.70718.707正態(tài)化的BIC3.386.3.3863.3863.3863.3863.3863.3863.3863.3863.386包含了8個(gè)擬合情況度量指標(biāo),其中“平穩(wěn)的R方”值為0.005,“R方”值為0.995,并給出了每個(gè)度量模型的百分位數(shù)。11.2指數(shù)平滑法模型統(tǒng)計(jì)量表從中可以看出模型的決定系數(shù)為0.995,說明擬合模型可以解釋原序列99.5%的信息量,正態(tài)化的BIC值也比較小,說明模型的擬合效果是很好的,另外還給出了擬合統(tǒng)計(jì)量及Ljung-Box統(tǒng)計(jì)情況。此外,所有數(shù)據(jù)中沒有離群值(孤立點(diǎn))。指數(shù)平滑法擬合的模型參數(shù)表模型預(yù)測變量數(shù)模型擬合統(tǒng)計(jì)量Ljung-BoxQ(18)離群值數(shù)R方正態(tài)化的
BIC統(tǒng)計(jì)量DFSig.年末人口數(shù)-模型_10.9953.3865.87116.9890模型估計(jì)SEtSig.年末人口數(shù)-模型_1無轉(zhuǎn)換Alpha(水平)1.000.1576.351.000Gamma(趨勢).799.3002.659.01311.2指數(shù)平滑法預(yù)測表表中給出了2005~2009年“年末人口”變量的預(yù)測值、上區(qū)間和下區(qū)間值。模型20052006200720082009年末人口數(shù)-模型_1預(yù)測1362.361372.341382.311392.281402.26UCL1372.271392.731415.151439.301465.02LCL1352.451351.941349.471345.261339.49對(duì)于每個(gè)模型,預(yù)測都在請(qǐng)求的預(yù)測時(shí)間段范圍內(nèi)的最后一個(gè)非缺失值之后開始,在所有預(yù)測值的非缺失值都可用的最后一個(gè)時(shí)間段或請(qǐng)求預(yù)測時(shí)間段的結(jié)束日期(以較早者為準(zhǔn))結(jié)束。觀測值與預(yù)測值的時(shí)序圖11.2指數(shù)平滑法數(shù)據(jù)文件中保存情況主要內(nèi)容11.1時(shí)間序列的建立和平穩(wěn)化11.2指數(shù)平滑法11.3ARIMA模型11.4時(shí)序序列的季節(jié)性分解11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理(1)基本概念
在預(yù)測中,對(duì)于平穩(wěn)的時(shí)間序列,可用自回歸移動(dòng)平均(AutoRegres-siveMovingAverage,ARMA)模型及特殊情況的自回歸(AutoRegressive,AR)模型、移動(dòng)平均(MovingAverage,MA)模型等來擬合,預(yù)測該時(shí)間序列的未來值,但在實(shí)際的經(jīng)濟(jì)預(yù)測中,隨機(jī)數(shù)據(jù)序列往往都是非平穩(wěn)的,此時(shí)就需要對(duì)該隨機(jī)數(shù)據(jù)序列進(jìn)行差分運(yùn)算,進(jìn)而得到ARMA模型的推廣——ARIMA模型。
ARIMA模型全稱綜合自回歸移動(dòng)平均(AutoRegressiveIntegratedMovingAverage)模型,簡記為ARIMA(p,d,q)模型,其中AR是自回歸,p為自回歸階數(shù);MA為移動(dòng)平均,q為移動(dòng)平均階數(shù);d為時(shí)間序列成為平穩(wěn)時(shí)間序列時(shí)所做的差分次數(shù)。ARIMA(p,d,q)模型的實(shí)質(zhì)就是差分運(yùn)算與ARMA(p,q)模型的組合,即ARMA(p,q)模型經(jīng)d次差分后,便為ARIMA(p,d,q)。11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理(2)統(tǒng)計(jì)原理
ARMA過程
則ARMA(p,q)模型簡記為或11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理(2)統(tǒng)計(jì)原理
ARMA模型的識(shí)別
設(shè)ACF代表{xt}的自相關(guān)函數(shù),PACF代表{xt}的偏自相關(guān)函數(shù)。根據(jù)Box-Jenkins提出的方法,用樣本的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)的截尾性來初步識(shí)別ARMA模型的階數(shù)。具體如下表所示。模
型自相關(guān)函數(shù)(ACF)偏自相關(guān)函數(shù)(PACF)AR(p)拖尾p階截尾MA(q)q階截尾拖尾ARMA(p,q)拖尾拖尾11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理說明:所謂拖尾是自相關(guān)系數(shù)或偏相關(guān)系數(shù)逐步趨向于0,這個(gè)趨向過程有不同的表現(xiàn)形式,有幾何型的衰減,有正弦波式的衰減;而所謂截尾是指從某階后自相關(guān)或偏相關(guān)系數(shù)為0。11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理(2)統(tǒng)計(jì)原理
非平穩(wěn)時(shí)間序列——ARIMA過程
11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理(2)統(tǒng)計(jì)原理
季節(jié)ARIMA模型時(shí)間序列常呈周期性變化,或稱為季節(jié)性趨勢。用變通的ARIMA模型處理這種季節(jié)性趨勢會(huì)導(dǎo)致參數(shù)過多,模型復(fù)雜。季節(jié)性乘積模型可以得到參數(shù)簡約的模型。季節(jié)性乘積模型表示為ARIMA(p,d,q,sp,sd,sq)(或ARIMA(p,d,q)×(sp,sd,sq)k)。其中,sp表示季節(jié)模型的自回歸系數(shù);sd表示季節(jié)差分的階數(shù),通常為一階季節(jié)差分;sq表示季節(jié)模型的移動(dòng)平均參數(shù)。如是月度資料,要描述年度特征,則sd=12;如是日志資料,要描述每周特征,則sd=7。11.3ARIMA模型11.3.1基本概念及統(tǒng)計(jì)原理(3)ARIMA建模步驟
ARIMA建模實(shí)際上包括3個(gè)階段,即模型識(shí)別階段、參數(shù)估計(jì)和檢驗(yàn)階段、預(yù)測應(yīng)用階段。其中前兩個(gè)階段可能需要反復(fù)進(jìn)行。ARIMA模型的識(shí)別就是判斷p,d,q,sp,sd,sq的階,主要依靠自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)圖來初步判斷和估計(jì)。一個(gè)識(shí)別良好的模型應(yīng)該有兩個(gè)要素:一是模型的殘差為白噪聲序列,需要通過殘差白噪聲檢驗(yàn),二是模型參數(shù)的簡約性和擬合優(yōu)度指標(biāo)的優(yōu)良性(如對(duì)數(shù)似然值較大,AIC和BIC較小)方面取得平衡,還有一點(diǎn)需要注意的是,模型的形式應(yīng)該易于理解。11.3ARIMA模型11.3.2SPSS實(shí)例分析【例11-5】表是某加油站55天的燃油剩余數(shù)據(jù),其中正值表示燃油有剩余,負(fù)值表示燃油不足,要求對(duì)此序列擬合時(shí)間序列模型并進(jìn)行分析。天12345678910111213141516171819燃油數(shù)據(jù)92-858012103-1-20-90100-40-22078-98-97565天20212223242526272829303132333435363738燃油數(shù)據(jù)80-20-8501150-100135-70-60-5030-103-65108-1010天3940414243444546474849505152535455
燃油數(shù)據(jù)-2590-30-321520159015-10-88025-12070-10
11.3ARIMA模型第1步數(shù)據(jù)組織:將數(shù)據(jù)組織成兩列,一列是“天數(shù)”,另一列是“燃油量”,輸入數(shù)據(jù)并保存,并以“天數(shù)”定義日期變量。第2步觀察數(shù)據(jù)序列的性質(zhì):先作時(shí)序圖,觀察數(shù)據(jù)序列的特點(diǎn)。按“分析→預(yù)測→序列圖”的順序打開“序列圖”對(duì)話框,將“油料量”設(shè)置為變量,并將所生成的日期新變量“DATE_”設(shè)為時(shí)間標(biāo)簽軸,生成如下圖所示的時(shí)序圖。可以看出數(shù)據(jù)序列在0上下振蕩,且無規(guī)律,可能是平穩(wěn)的時(shí)間序列。11.3ARIMA模型再做自相關(guān)圖和偏自相關(guān)圖進(jìn)一步分析。按“分析→預(yù)測→自相關(guān)”順序打開“自相關(guān)”對(duì)話框,并在“輸出”選項(xiàng)組中將“自相關(guān)”和“偏自相關(guān)”同時(shí)選上,輸出結(jié)果如下面兩圖所示。從上左圖可以看出,自相關(guān)函數(shù)呈現(xiàn)出比較典型的拖尾性,說明數(shù)據(jù)自相關(guān)性隨時(shí)間間隔下降。從上右圖可以看出,除了延遲1階的偏自相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍之外,其他除數(shù)的偏自相關(guān)系數(shù)都在2倍標(biāo)準(zhǔn)差范圍內(nèi)波動(dòng)。根據(jù)這個(gè)特點(diǎn)可以判斷該序列具有短期相關(guān)性,進(jìn)一步確定序列平穩(wěn)。同時(shí),可以認(rèn)為該序列偏自相關(guān)函數(shù)1階截尾。綜合該序列自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的性質(zhì),根據(jù)前表的模型識(shí)別規(guī)則,可以擬合模型為AR(1),即ARIMA(1,0,0)。11.3ARIMA模型第3步模型擬合:
按“分析→預(yù)測→創(chuàng)建模型”順序打開“時(shí)間序列建模器”對(duì)話框,將“燃油量”選入“因變量”框。設(shè)置過程與圖11-7類似,并選擇“方法”下的“ARIMA”模型?!皸l件”對(duì)話框設(shè)置。單擊“方法”右邊的“條件(C)…”按鈕,打開“時(shí)間序列建模器:ARIMA條件”對(duì)話框,并按如下圖所示進(jìn)行設(shè)置。在“ARIMA階數(shù)”框中需設(shè)置“非季節(jié)性”參數(shù):自回歸的階p、差分的階d和移動(dòng)平均數(shù)q。如果時(shí)間序列有季節(jié)性因素,還需設(shè)置“季節(jié)性”參數(shù)sp,sd和sq。由于經(jīng)過前面的分析,此例是ARIMA(1,0,0)模型,且無季節(jié)性影響,則只需將自回歸的階數(shù)設(shè)為1,其余均為0。11.3ARIMA模型
“統(tǒng)計(jì)量”選項(xiàng)卡的設(shè)置:“統(tǒng)計(jì)量”選項(xiàng)卡如圖11-9所示,將“按模型顯示擬合度量、Ljung-Box統(tǒng)計(jì)量和離群值的數(shù)量”、“R方”、“標(biāo)準(zhǔn)化的BIC”、“擬合優(yōu)度”、“參數(shù)估計(jì)”勾上?!皥D表”選項(xiàng)卡的設(shè)置:在其中將“序列”、“殘差自相關(guān)函數(shù)”、“殘差偏自相關(guān)函數(shù)”、“觀測值”和“預(yù)測值”這些選項(xiàng)選上。其他選項(xiàng)卡的設(shè)置讀者可參照例11-4進(jìn)行。第4步主要結(jié)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025山西長治市人民醫(yī)院招聘碩士以上專業(yè)技術(shù)工作人員50人模擬筆試試題及答案解析
- 2025江蘇紫金信通人才科技有限公司招聘7人備考筆試試題及答案解析
- 2025中國中信金融資產(chǎn)國際控股有限公司社會(huì)招聘參考筆試題庫附答案解析
- 深度解析(2026)《GBT 26088-2010造船 推進(jìn)用水冷四沖程柴油機(jī)》(2026年)深度解析
- 深度解析(2026)《GBT 25964-2010石油和液體石油產(chǎn)品 采用混合式油罐測量系統(tǒng)測量立式圓筒形油罐內(nèi)油品體積、密度和質(zhì)量的方法》
- 2025江西吉安市泰和縣新睿人力資源服務(wù)有限公司面向社會(huì)招聘項(xiàng)目制人員5人備考筆試題庫及答案解析
- 深度解析(2026)《GBT 25890.9-2010軌道交通 地面裝置 直流開關(guān)設(shè)備 第7-3部分:直流牽引供電系統(tǒng)專用測量、控制和保護(hù)裝置 隔離電壓變送器和其他電壓測量設(shè)備》(2026年)深度解析
- 2025年大慶高新區(qū)公益性崗位招聘10人備考考試試題及答案解析
- 深度解析(2026)《GBT 25782-2010 1-萘酚》(2026年)深度解析
- 2026廣西桂林醫(yī)科大學(xué)人才招聘118人(第一批)考試備考題庫及答案解析
- 口服抗栓藥物相關(guān)消化道損傷防治專家共識(shí)(2021)解讀
- 敬老服務(wù)前臺(tái)工作總結(jié)
- 統(tǒng)編版(2024新版)七年級(jí)下冊歷史教材習(xí)題答案
- 《如何理解「銷售」》課件
- UL2239標(biāo)準(zhǔn)中文版-2019支持導(dǎo)管油管和電纜的硬件UL中文版標(biāo)準(zhǔn)
- 【初中道法】擁有積極的人生態(tài)度(課件)-2024-2025學(xué)年七年級(jí)道德與法治上冊(統(tǒng)編版2024)
- 六層住宅樓框架結(jié)構(gòu)施工方案
- TGDNAS 049-2024 脊髓神經(jīng)功能評(píng)估技術(shù)
- 地理主題10-1 影響工業(yè)區(qū)位的因素
- 2022年北京海淀初二(上)期末語文試卷及答案
- 國開電大可編程控制器應(yīng)用課程實(shí)驗(yàn)參考答案
評(píng)論
0/150
提交評(píng)論