版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章
統(tǒng)計(jì)分析方法第三章
統(tǒng)計(jì)分析方法1§1地理要素間的相關(guān)分析§2地理要素間的回歸分析§3時(shí)間序列分析法§4系統(tǒng)聚類分析方法§5主成分分析方法§6馬爾可夫預(yù)測(cè)方法§7地理系統(tǒng)的空間趨勢(shì)面分析§1地理要素間的相關(guān)分析2§2地理要素間的回歸分析地理回歸分析的意義和作用一元地理回歸模型的建立多元地理回歸模型的建立§2地理要素間的回歸分析地理回歸分析的意義和作用3一、地理回歸分析的意義和作用相關(guān)分析揭示了地理要素之間相互關(guān)系的密切程度。若能在某些難測(cè)難控的要素與其他易測(cè)易控的要素之間建立一種近似的函數(shù)表達(dá)式,可以比較容易地通過(guò)那些易測(cè)易控要素的變化情況,了解那些難測(cè)難控要素的變化情況回歸分析方法,是研究要素之間具體的數(shù)量關(guān)系的強(qiáng)有力的工具,運(yùn)用這種方法能夠建立反映地理要素之間具體的數(shù)量關(guān)系的數(shù)學(xué)模型,即回歸模型一、地理回歸分析的意義和作用相關(guān)分析揭示了地理要素之間相互關(guān)4回歸分析就是對(duì)具有相互聯(lián)系的要素,根據(jù)其聯(lián)系的形態(tài),選擇一個(gè)合適的數(shù)學(xué)模式,用來(lái)近似地表達(dá)要素間平均變化關(guān)系。這個(gè)數(shù)學(xué)模式稱為回歸模型(回歸方程)回歸分析5回歸分析與相關(guān)分析的區(qū)別與聯(lián)系研究對(duì)象和內(nèi)容上:a.相關(guān)分析主要是研究要素(變量)之間是否存在關(guān)系和關(guān)系的密切程度,沒(méi)有自變量與因變量之分b.回歸分析主要是研究要素之間聯(lián)系的形態(tài)、確定要素之間關(guān)系的方程式,即回歸方程,可用于對(duì)未來(lái)進(jìn)行預(yù)測(cè),對(duì)某些要素進(jìn)行控制。回歸分析有自變量與因變量之分。回歸分析尚有地理預(yù)測(cè)的性質(zhì)從相關(guān)可以獲得回歸的一些重要信息,反之從回歸也能獲得相關(guān)的一些重要信息。故它們之間是緊密相連的兩個(gè)概念回歸分析與相關(guān)分析的區(qū)別與聯(lián)系6回歸分析的主要內(nèi)容從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)間的定量數(shù)學(xué)表達(dá)式,即回歸模型根據(jù)一個(gè)或幾個(gè)要素(自變量)的值來(lái)預(yù)測(cè)或控制另一個(gè)要素(因變量)的取值從某一地理過(guò)程中的許多要素中,找出哪些要素(變量)是主要的,哪些要素是次要的,這些要素之間又有些什么關(guān)系回歸分析的分類一元地理回歸模型和多元地理回歸模型回歸分析的主要內(nèi)容7二、一元地理回歸模型的建立(一)一元地理回歸模型類型的判斷方法作圖法差分法曲度法計(jì)算器法等二、一元地理回歸模型的建立(一)一元地理回歸模型類型的判斷方8作圖法若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在普通方格紙上,散點(diǎn)圖呈直線,則一元地理回歸模型為直線型作圖法若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在普通方格紙上,散點(diǎn)圖9若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在雙對(duì)數(shù)格紙上,散點(diǎn)圖呈直線,則一元地理回歸模型為冪函數(shù)型若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在雙對(duì)數(shù)格紙上,散點(diǎn)圖呈直線10計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件11若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)取對(duì)數(shù)分格,其縱坐標(biāo)為普通分格時(shí)呈直線,則一元地理回歸模型為對(duì)數(shù)函數(shù)型若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)取12若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)為普通分格,其縱坐標(biāo)取對(duì)數(shù)分格時(shí)呈直線,則一元地理回歸模型為指數(shù)函數(shù)型若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)為13(二)一元線性地理回歸模型的建立假設(shè)有兩個(gè)地理要素(變量)x和y,x為自變量,y為因變量。則一元線性回歸模型的基本結(jié)構(gòu)形式為:A、B為選定參數(shù)α=1,2,…,n為n組觀測(cè)數(shù)據(jù)(x1,y1),(x2,y2),…(xn,yn)εα為隨機(jī)變量(二)一元線性地理回歸模型的建立假設(shè)有兩個(gè)地理要素(變量)x14設(shè)a、b分別為參數(shù)A和B的最小二乘估計(jì)值,于是便得到一元線性回歸模型。它是代表x與y之間關(guān)系的最佳擬合直線,通常稱為回歸直線a為常數(shù),它就是y的截距b為回歸系數(shù),也就是直線的斜率,它表示在x中變更一個(gè)單位則在y中變更b個(gè)單位b>0,表示要素一齊增加或一齊減小b<0,表示一個(gè)要素增加而另一個(gè)則要減小b值的大小,反映了變化率的大小是y的估計(jì)值,亦稱回歸值。設(shè)a、b分別為參數(shù)A和B的最小二乘估計(jì)值,于是便得到一元線性151、參數(shù)a和b的最小二乘估計(jì)實(shí)際觀測(cè)值yi與回歸值^yi之差ei=yi-^yi,刻畫了yi與^yi的偏離程度,即表示實(shí)測(cè)值與回歸估計(jì)值之間的誤差大小。參數(shù)a與b的最小二乘擬合原則要求yi與^yi的誤差ei的平方和達(dá)到最小,即1、參數(shù)a和b的最小二乘估計(jì)實(shí)際觀測(cè)值yi與回歸值^yi之差16根據(jù)取極值的必要條件,要使Q取最小值,必須使Q對(duì)a、b的一階偏導(dǎo)數(shù)分別等于零,即根據(jù)取極值的必要條件,要使Q取最小值,必須使Q對(duì)a、b的一階17整理后可得整理后可得18此方程通常稱為正規(guī)方程組。又可寫成矩陣形式此方程通常稱為正規(guī)方程組。又可寫成矩陣形式19解此方程組,即可得到解此方程組,即可得到20計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件212、一元線性回歸模型的具體建立方法與步驟月份氣溫(x)地溫(y)xyx2y21-4.7-3.616.9222.0912.962-2.3-1.43.225.291.9634.45.122.4419.3626.01413.214.5191.40174.24210.25520.222.3450.46408.04497.29624.226.9650.98585.64723.61726.028.2733.20676.00795.24824.626.5651.90605.16702.25919.521.1411.45380.25445.211012.513.4167.50156.25179.56114.04.618.4016.0021.1612-2.8-1.95.327.843.61總和138.8155.73323.193056.163619.11平均值11.5712.982、一元線性回歸模型的具體建立方法與步驟月份氣溫(x)地溫(22將計(jì)算表中的相應(yīng)數(shù)值代入?yún)?shù)計(jì)算公式得到a、b將計(jì)算表中的相應(yīng)數(shù)值代入?yún)?shù)計(jì)算公式得到a、b23計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件243、一元線性地理回歸模型的效果檢驗(yàn)回歸模型的估計(jì)誤差回歸模型的顯著性檢驗(yàn)3、一元線性地理回歸模型的效果檢驗(yàn)回歸模型的估計(jì)誤差25(1)回歸模型的估計(jì)誤差標(biāo)準(zhǔn)估計(jì)誤差是一個(gè)非常重要的量,由于它的單位和y的單位相同,所以在實(shí)際地理問(wèn)題中便于比較和檢驗(yàn),只要比較S與允許的偏差就行了,因此,它是檢驗(yàn)回歸效果的極其重要的標(biāo)志,同時(shí)也是衡量地理預(yù)測(cè)精度的指標(biāo)(1)回歸模型的估計(jì)誤差標(biāo)準(zhǔn)估計(jì)誤差是一個(gè)非常重要的量,由于26(2)回歸模型的顯著性檢驗(yàn)(F檢驗(yàn)法)在回歸分析中,y的n次觀測(cè)值y1,y2,…,yn之間的差異,可以用觀測(cè)值yi與其算術(shù)平均值的離差平方和來(lái)表示,它稱為總的離差平方和(2)回歸模型的顯著性檢驗(yàn)(F檢驗(yàn)法)在回歸分析中,y的n次27
Q是所有觀測(cè)點(diǎn)yi離回歸直線的殘差平方和,它表示除x對(duì)y的線性影響以外的一切因素對(duì)y的變異影響,故稱為剩余平方和(殘差平方和)U反映了在y的總變差中由x與y的線性關(guān)系而引起y的變化部分,稱為回歸平方和Q是所有觀測(cè)點(diǎn)yi離回歸直線的殘差平方和,它表示除x對(duì)y的28一個(gè)回歸效果的好壞取決于U和Q的大小,或者說(shuō)取決于U在總平方和lyy中所占的比例U/lyy的大小,這個(gè)比值越大,回歸效果越好;反之,則回歸效果越不好一個(gè)回歸效果的好壞取決于U和Q的大小,或者說(shuō)取決于U在總平方29計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件30統(tǒng)計(jì)量F
F越大,模型的效果越佳。統(tǒng)計(jì)量F~F(1,n-2)。在顯著水平α下,若F>Fα,則認(rèn)為回歸方程效果在此水平下顯著。一般地,當(dāng)F<F0.10(1,n-2)時(shí),則認(rèn)為方程效果不明顯。統(tǒng)計(jì)量F31方差分析表
(以北京市氣溫與地溫關(guān)系為例)變差來(lái)源平方和自由度方差F檢驗(yàn)顯著性水平回歸(因素x)U=blxy1SU2=U/1=1597.34F=U/(Q/N-2)=10292.4>F1,100.01=10.04α=0.01**剩余(隨機(jī)因素)Q=lyy-blxyN-2=10SQ2=Q/(N-2)=0.157總計(jì)lyy=∑y2-(∑y)2/NN-1=11方差分析表
(以北京市氣溫與地溫關(guān)系為例)變差來(lái)源平方和自由32(三)一元非線性回歸模型的建立選配曲線的方法根據(jù)理論分析、過(guò)去的經(jīng)驗(yàn)或觀測(cè)數(shù)據(jù)的分布趨勢(shì)與特點(diǎn),來(lái)確定兩個(gè)要素之間的曲線類型及其函數(shù)形式,從而求非線性地理回歸模型的過(guò)程及其方法叫做曲線選配(三)一元非線性回歸模型的建立選配曲線的方法33地理上常見(jiàn)的非線性回歸模型的建立方法冪函數(shù)型y=axb對(duì)上式兩邊取常用對(duì)數(shù)或自然對(duì)數(shù)Lny=Lna+bLnx或Y=A+bX地理上常見(jiàn)的非線性回歸模型的建立方法34指數(shù)函數(shù)型兩個(gè)地理要素(變量)之間的指數(shù)函數(shù)表達(dá)式為Y=aebx或y=ae-bx,y=abx兩邊取常用對(duì)數(shù)或自然對(duì)數(shù),則得Lny=Lna+bx或Y=A+bx指數(shù)函數(shù)型35對(duì)數(shù)函數(shù)型y=a+bLnx則y=a+bX對(duì)數(shù)函數(shù)型36非線性關(guān)系線性化的幾種情況對(duì)于指數(shù)曲線,令,可以將其轉(zhuǎn)化為直線形式:,其中,;
對(duì)于對(duì)數(shù)曲線,令,,可以將其轉(zhuǎn)化為直線形式:;對(duì)于冪函數(shù)曲線,令,,可以將其轉(zhuǎn)化為直線形式:其中,;非線性回歸模型
非線性關(guān)系線性化的幾種情況非線性回歸模型37對(duì)于雙曲線,令,轉(zhuǎn)化為直線形式:;對(duì)于S型曲線,可轉(zhuǎn)化為直線形式:;對(duì)于冪乘積,只要令,就可以將其轉(zhuǎn)化為線性形式其中,;對(duì)于雙曲線,令38對(duì)于對(duì)數(shù)函數(shù)和只要令,就可以將其化為線性形式
例:表3.2.1給出了某地區(qū)林地景觀斑塊面積(area)與周長(zhǎng)(perimeter)的數(shù)據(jù)。下面我們建立林地景觀斑塊面積A與周長(zhǎng)P之間的非線性回歸模型。對(duì)于對(duì)數(shù)函數(shù)和39
序號(hào)面積A周長(zhǎng)P序號(hào)面積A周長(zhǎng)P110447.370625.39242232844.3004282.043215974.730612.286434054.660289.307330976.770775.7124430833.840895.98049442.902530.202451823.355205.131510858.9201906.1034626270.300968.060621532.9101297.9624713573.9601045.07276891.680417.0584865590.0802250.43583695.195243.90749157270.4002407.54992260.180197.239502086.426266.54110334.33299.729513109.070261.8181111749.080558.921522038.617320.396122372.105199.667533432.137253.335138390.633592.893541600.391230.030146003.719459.467553867.586419.406表3.2.1某地區(qū)各個(gè)林地景觀斑塊面積(m2)與周長(zhǎng)(m)
序號(hào)面積A周長(zhǎng)P序號(hào)面積A周長(zhǎng)P110447.370624015527620.2006545.291561946.184198.66116179686.2002960.4755777.30556.9021714196.460597.993587977.719715.7521822809.1801103.0705919271.8201011.1271971195.9401154.118608263.480680.710203064.242245.0496114697.1301234.11421469416.7008226.009624519.867326.317225738.953498.6566313157.6601172.916238359.465415.151646617.270609.801246205.016414.790654064.137437.3552560619.0201549.871665645.820432.3552614517.740791.943676993.355503.7842731020.1001700.965684304.281267.9512826447.1601246.977696336.383347.136297985.926918.312702651.414292.23515527620.2006545.291561946.41303638.766399.725712656.824298.47331585425.10011474.770721846.988179.8663235220.6401877.476731616.684172.8083310067.820497.394741730.563172.1433427422.5701934.5967511303.970881.0423543071.5501171.4137614019.790638.1763657585.9402275.389779277.172862.0883728254.1301322.7957813684.750712.78738497261.0009581.298791949.164228.4033924255.030994.906804846.016324.481401837.699229.40181521457.4007393.938411608.625225.84282564370.80012212.410303638.766399.725712656.824242解:(1)作變量替換,令:,,將表3.2.1中的原始數(shù)據(jù)進(jìn)行對(duì)數(shù)變換,變換后得到的各新變量對(duì)應(yīng)的觀測(cè)數(shù)據(jù)如表3.2.2所示。
序號(hào)y=lnAx=LnP序號(hào)y=lnAx=LnP19.2541066.4383794212.358138.36218629.6787636.4172438.3076225.667487310.340996.6537824410.336376.79791849.1530196.273258457.5084335.3236559.2927427.5528164610.176196.87529469.9773387.168551479.5159096.95184178.838076.0332264811.091187.71887988.2147895.4967894911.965727.78636497.72325.284414507.6432085.585528105.8121354.602457518.0420795.567651119.371536.326008527.6200275.769558表3.2.2經(jīng)對(duì)數(shù)變換后的數(shù)據(jù)解:(1)作變量替換,令:,,43127.7715335.296653538.1409385.534711139.0348716.385013547.3780035.438211148.7001346.130066558.2603866.0388391513.176138.786501567.5736265.2915971612.098977.993105574.3477554.041328179.5607486.393579588.9844086.5733341810.034927.005852599.8663996.9188211911.173197.051092609.0196016.523136208.0275565.501457619.5954087.1181092113.059259.015056628.4162385.787871228.6550326.211917639.4847597.067248239.031156.028643648.7974386.413133248.7331136.027773658.3099576.0807442511.012367.345927668.6386716.069247269.5831276.67449678.8527166.222147127.7715335.296653538342397.438951688.3673655.5908062810.18297.128478698.7540635.849717298.9854366.822537707.8828485.67756308.19945.990776717.8848875.6986783113.280099.347906727.5213115.1922133210.469397.537684737.3881325.152181339.2170996.209381747.4562025.1483263410.219127.567654759.3329096.7811053510.670627.065966769.5482256.4586143610.961037.729906779.1353126.7593583710.248997.187502789.5240376.5691823813.116879.167568797.5751565.4311123910.096386.902648808.4859125.782227407.516275.4354718113.164388.908416417.3831355.4198378213.243479.4102082710.342397.438951688.3673645
(2)
以x為橫坐標(biāo)、y為縱坐標(biāo),在平面直角坐標(biāo)系中作出散點(diǎn)圖。很明顯,y與x呈線性關(guān)系。圖3.2.2林地景觀斑塊面積(A)與周長(zhǎng)(P)之間的雙對(duì)數(shù)關(guān)系(2)以x為橫坐標(biāo)、y為縱坐標(biāo),在平面直角坐標(biāo)系46(3)根據(jù)所得表中的數(shù)據(jù),運(yùn)用建立線性回歸模型的方法,建立y與x之間的線性回歸模型,得到
對(duì)應(yīng)于(3.2.19)式,x與y的相關(guān)系數(shù)高達(dá)=0.9665。
(4)將(3.2.19)還原成雙對(duì)數(shù)曲線,即
(3.2.19)(3.2.20)(3)根據(jù)所得表中的數(shù)據(jù),運(yùn)用建立線性回歸模型的方47一元非線性回歸模型的效果檢驗(yàn)相關(guān)指數(shù)R2Q是剩余平方和,lyy是總平方和相關(guān)指數(shù)的平方根也可稱為相關(guān)系數(shù)相關(guān)指數(shù)越大,表明選配的回歸曲線效果越好,剩余標(biāo)準(zhǔn)差越小,其回歸模型的預(yù)測(cè)精度就越高一元非線性回歸模型的效果檢驗(yàn)相關(guān)指數(shù)R248一元線性回歸模型內(nèi)容復(fù)習(xí)模型的基本形式模型參數(shù)的確定效果檢驗(yàn)一元線性回歸模型內(nèi)容復(fù)習(xí)模型的基本形式49三、多元地理回歸模型的建立(一)多要素線性地理回歸模型的建立1、方法設(shè)某一要素y受k個(gè)要素x1,x2,…,xk的影響,其內(nèi)在聯(lián)系是線性關(guān)系,通過(guò)N組觀測(cè),得到一組地理數(shù)據(jù)為(y;xα1,xα2,…,xαn),α=1,2,…,n。設(shè)其數(shù)學(xué)結(jié)構(gòu)模型為β0,β1,…,βk為待定參數(shù),εα為隨機(jī)變量三、多元地理回歸模型的建立(一)多要素線性地理回歸模型的建立50為了估計(jì)β,仍采用最小二乘法,則得回歸模型為式中,b0為常數(shù)項(xiàng),b1,b2,…,bk為偏回歸系數(shù)為了估計(jì)β,仍采用最小二乘法,則得回歸模型為51參數(shù)的確定過(guò)程依最小二乘法原理參數(shù)的確定過(guò)程依最小二乘法原理52將上式分別對(duì)b0,b1,…,bk求偏導(dǎo)數(shù),并令其等于零將上式分別對(duì)b0,b1,…,bk求偏導(dǎo)數(shù),并令其等于零53方程組(3.2.15)式稱為正規(guī)方程組。
引入矩陣(3.2.15)
方程組(3.2.15)式稱為正規(guī)方程組。(3.2.154計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件55計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件56則正規(guī)方程組(3.2.15)式可以進(jìn)一步寫成矩陣形式則正規(guī)方程組(3.2.15)式可以進(jìn)一步寫成57求解得引入記號(hào)(3.2.16)
求解得(3.2.16)58正規(guī)方程組也可以寫成正規(guī)方程組也可以寫成59例如,某一國(guó)家某一經(jīng)濟(jì)區(qū)內(nèi)木材生產(chǎn)指數(shù)y(以1955年為100)受該區(qū)森林蓄積量指數(shù)x1、木材價(jià)格指數(shù)x2和運(yùn)輸距離指數(shù)x3的影響,如表5-10所示,試建立三元線性回歸模型,并檢驗(yàn)其有無(wú)實(shí)際意義例如,某一國(guó)家某一經(jīng)濟(jì)區(qū)內(nèi)木材生產(chǎn)指數(shù)y(以1955年為1060原始數(shù)據(jù)表編號(hào)1234567年份1952195319541955195619571958x195.5102.197.7100.0105.2101.599.3x284.7103.7110.9100.0100.6114.7113.9x330.462.082.1100.0114.0125.2140.2Y88.499.795.4100.0107.9108.7105.5原始數(shù)據(jù)表編號(hào)1234567年份1952195319541961設(shè)所求的線性回歸模型為設(shè)所求的線性回歸模型為62其正規(guī)方程組可寫成及其正規(guī)方程組可寫成63根據(jù)原始數(shù)據(jù)計(jì)算后得到正規(guī)方程組解此方程得出參數(shù)值,從而得到趨勢(shì)面方程根據(jù)原始數(shù)據(jù)計(jì)算后得到正規(guī)方程組642、回歸模型的顯著性檢驗(yàn)
①回歸平方和U與剩余平方和Q:②回歸平方和③剩余平方和為④
F統(tǒng)計(jì)量為計(jì)算出來(lái)F之后,可以查F分布表對(duì)模型進(jìn)行顯著性檢驗(yàn)。2、回歸模型的顯著性檢驗(yàn)①回歸平方和U與剩余平方和Q:652、多元線性回歸模型的顯著性檢驗(yàn)2、多元線性回歸模型的顯著性檢驗(yàn)66若F0.10(k,n-k-1)≤F≤F0.05(k,n-k-1),則反映線性回歸在0.10水平上顯著,并在F值右上角打上一個(gè)星號(hào)“(*)”若F<F0.10(k,n-k-1),則稱線性回歸不顯著,它表示y與k個(gè)自變量的線性關(guān)系不密切若F0.10(k,n-k-1)≤F≤F0.05(k,n-k67第三章
統(tǒng)計(jì)分析方法第三章
統(tǒng)計(jì)分析方法68§1地理要素間的相關(guān)分析§2地理要素間的回歸分析§3時(shí)間序列分析法§4系統(tǒng)聚類分析方法§5主成分分析方法§6馬爾可夫預(yù)測(cè)方法§7地理系統(tǒng)的空間趨勢(shì)面分析§1地理要素間的相關(guān)分析69§2地理要素間的回歸分析地理回歸分析的意義和作用一元地理回歸模型的建立多元地理回歸模型的建立§2地理要素間的回歸分析地理回歸分析的意義和作用70一、地理回歸分析的意義和作用相關(guān)分析揭示了地理要素之間相互關(guān)系的密切程度。若能在某些難測(cè)難控的要素與其他易測(cè)易控的要素之間建立一種近似的函數(shù)表達(dá)式,可以比較容易地通過(guò)那些易測(cè)易控要素的變化情況,了解那些難測(cè)難控要素的變化情況回歸分析方法,是研究要素之間具體的數(shù)量關(guān)系的強(qiáng)有力的工具,運(yùn)用這種方法能夠建立反映地理要素之間具體的數(shù)量關(guān)系的數(shù)學(xué)模型,即回歸模型一、地理回歸分析的意義和作用相關(guān)分析揭示了地理要素之間相互關(guān)71回歸分析就是對(duì)具有相互聯(lián)系的要素,根據(jù)其聯(lián)系的形態(tài),選擇一個(gè)合適的數(shù)學(xué)模式,用來(lái)近似地表達(dá)要素間平均變化關(guān)系。這個(gè)數(shù)學(xué)模式稱為回歸模型(回歸方程)回歸分析72回歸分析與相關(guān)分析的區(qū)別與聯(lián)系研究對(duì)象和內(nèi)容上:a.相關(guān)分析主要是研究要素(變量)之間是否存在關(guān)系和關(guān)系的密切程度,沒(méi)有自變量與因變量之分b.回歸分析主要是研究要素之間聯(lián)系的形態(tài)、確定要素之間關(guān)系的方程式,即回歸方程,可用于對(duì)未來(lái)進(jìn)行預(yù)測(cè),對(duì)某些要素進(jìn)行控制。回歸分析有自變量與因變量之分。回歸分析尚有地理預(yù)測(cè)的性質(zhì)從相關(guān)可以獲得回歸的一些重要信息,反之從回歸也能獲得相關(guān)的一些重要信息。故它們之間是緊密相連的兩個(gè)概念回歸分析與相關(guān)分析的區(qū)別與聯(lián)系73回歸分析的主要內(nèi)容從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)間的定量數(shù)學(xué)表達(dá)式,即回歸模型根據(jù)一個(gè)或幾個(gè)要素(自變量)的值來(lái)預(yù)測(cè)或控制另一個(gè)要素(因變量)的取值從某一地理過(guò)程中的許多要素中,找出哪些要素(變量)是主要的,哪些要素是次要的,這些要素之間又有些什么關(guān)系回歸分析的分類一元地理回歸模型和多元地理回歸模型回歸分析的主要內(nèi)容74二、一元地理回歸模型的建立(一)一元地理回歸模型類型的判斷方法作圖法差分法曲度法計(jì)算器法等二、一元地理回歸模型的建立(一)一元地理回歸模型類型的判斷方75作圖法若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在普通方格紙上,散點(diǎn)圖呈直線,則一元地理回歸模型為直線型作圖法若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在普通方格紙上,散點(diǎn)圖76若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在雙對(duì)數(shù)格紙上,散點(diǎn)圖呈直線,則一元地理回歸模型為冪函數(shù)型若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在雙對(duì)數(shù)格紙上,散點(diǎn)圖呈直線77計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件78若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)取對(duì)數(shù)分格,其縱坐標(biāo)為普通分格時(shí)呈直線,則一元地理回歸模型為對(duì)數(shù)函數(shù)型若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)取79若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)為普通分格,其縱坐標(biāo)取對(duì)數(shù)分格時(shí)呈直線,則一元地理回歸模型為指數(shù)函數(shù)型若將地理要素(x,y)的數(shù)據(jù)點(diǎn)繪在單對(duì)數(shù)格紙上,而其橫坐標(biāo)為80(二)一元線性地理回歸模型的建立假設(shè)有兩個(gè)地理要素(變量)x和y,x為自變量,y為因變量。則一元線性回歸模型的基本結(jié)構(gòu)形式為:A、B為選定參數(shù)α=1,2,…,n為n組觀測(cè)數(shù)據(jù)(x1,y1),(x2,y2),…(xn,yn)εα為隨機(jī)變量(二)一元線性地理回歸模型的建立假設(shè)有兩個(gè)地理要素(變量)x81設(shè)a、b分別為參數(shù)A和B的最小二乘估計(jì)值,于是便得到一元線性回歸模型。它是代表x與y之間關(guān)系的最佳擬合直線,通常稱為回歸直線a為常數(shù),它就是y的截距b為回歸系數(shù),也就是直線的斜率,它表示在x中變更一個(gè)單位則在y中變更b個(gè)單位b>0,表示要素一齊增加或一齊減小b<0,表示一個(gè)要素增加而另一個(gè)則要減小b值的大小,反映了變化率的大小是y的估計(jì)值,亦稱回歸值。設(shè)a、b分別為參數(shù)A和B的最小二乘估計(jì)值,于是便得到一元線性821、參數(shù)a和b的最小二乘估計(jì)實(shí)際觀測(cè)值yi與回歸值^yi之差ei=yi-^yi,刻畫了yi與^yi的偏離程度,即表示實(shí)測(cè)值與回歸估計(jì)值之間的誤差大小。參數(shù)a與b的最小二乘擬合原則要求yi與^yi的誤差ei的平方和達(dá)到最小,即1、參數(shù)a和b的最小二乘估計(jì)實(shí)際觀測(cè)值yi與回歸值^yi之差83根據(jù)取極值的必要條件,要使Q取最小值,必須使Q對(duì)a、b的一階偏導(dǎo)數(shù)分別等于零,即根據(jù)取極值的必要條件,要使Q取最小值,必須使Q對(duì)a、b的一階84整理后可得整理后可得85此方程通常稱為正規(guī)方程組。又可寫成矩陣形式此方程通常稱為正規(guī)方程組。又可寫成矩陣形式86解此方程組,即可得到解此方程組,即可得到87計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件882、一元線性回歸模型的具體建立方法與步驟月份氣溫(x)地溫(y)xyx2y21-4.7-3.616.9222.0912.962-2.3-1.43.225.291.9634.45.122.4419.3626.01413.214.5191.40174.24210.25520.222.3450.46408.04497.29624.226.9650.98585.64723.61726.028.2733.20676.00795.24824.626.5651.90605.16702.25919.521.1411.45380.25445.211012.513.4167.50156.25179.56114.04.618.4016.0021.1612-2.8-1.95.327.843.61總和138.8155.73323.193056.163619.11平均值11.5712.982、一元線性回歸模型的具體建立方法與步驟月份氣溫(x)地溫(89將計(jì)算表中的相應(yīng)數(shù)值代入?yún)?shù)計(jì)算公式得到a、b將計(jì)算表中的相應(yīng)數(shù)值代入?yún)?shù)計(jì)算公式得到a、b90計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件913、一元線性地理回歸模型的效果檢驗(yàn)回歸模型的估計(jì)誤差回歸模型的顯著性檢驗(yàn)3、一元線性地理回歸模型的效果檢驗(yàn)回歸模型的估計(jì)誤差92(1)回歸模型的估計(jì)誤差標(biāo)準(zhǔn)估計(jì)誤差是一個(gè)非常重要的量,由于它的單位和y的單位相同,所以在實(shí)際地理問(wèn)題中便于比較和檢驗(yàn),只要比較S與允許的偏差就行了,因此,它是檢驗(yàn)回歸效果的極其重要的標(biāo)志,同時(shí)也是衡量地理預(yù)測(cè)精度的指標(biāo)(1)回歸模型的估計(jì)誤差標(biāo)準(zhǔn)估計(jì)誤差是一個(gè)非常重要的量,由于93(2)回歸模型的顯著性檢驗(yàn)(F檢驗(yàn)法)在回歸分析中,y的n次觀測(cè)值y1,y2,…,yn之間的差異,可以用觀測(cè)值yi與其算術(shù)平均值的離差平方和來(lái)表示,它稱為總的離差平方和(2)回歸模型的顯著性檢驗(yàn)(F檢驗(yàn)法)在回歸分析中,y的n次94
Q是所有觀測(cè)點(diǎn)yi離回歸直線的殘差平方和,它表示除x對(duì)y的線性影響以外的一切因素對(duì)y的變異影響,故稱為剩余平方和(殘差平方和)U反映了在y的總變差中由x與y的線性關(guān)系而引起y的變化部分,稱為回歸平方和Q是所有觀測(cè)點(diǎn)yi離回歸直線的殘差平方和,它表示除x對(duì)y的95一個(gè)回歸效果的好壞取決于U和Q的大小,或者說(shuō)取決于U在總平方和lyy中所占的比例U/lyy的大小,這個(gè)比值越大,回歸效果越好;反之,則回歸效果越不好一個(gè)回歸效果的好壞取決于U和Q的大小,或者說(shuō)取決于U在總平方96計(jì)量地理學(xué)第三章統(tǒng)計(jì)分析方法2回歸分析課件97統(tǒng)計(jì)量F
F越大,模型的效果越佳。統(tǒng)計(jì)量F~F(1,n-2)。在顯著水平α下,若F>Fα,則認(rèn)為回歸方程效果在此水平下顯著。一般地,當(dāng)F<F0.10(1,n-2)時(shí),則認(rèn)為方程效果不明顯。統(tǒng)計(jì)量F98方差分析表
(以北京市氣溫與地溫關(guān)系為例)變差來(lái)源平方和自由度方差F檢驗(yàn)顯著性水平回歸(因素x)U=blxy1SU2=U/1=1597.34F=U/(Q/N-2)=10292.4>F1,100.01=10.04α=0.01**剩余(隨機(jī)因素)Q=lyy-blxyN-2=10SQ2=Q/(N-2)=0.157總計(jì)lyy=∑y2-(∑y)2/NN-1=11方差分析表
(以北京市氣溫與地溫關(guān)系為例)變差來(lái)源平方和自由99(三)一元非線性回歸模型的建立選配曲線的方法根據(jù)理論分析、過(guò)去的經(jīng)驗(yàn)或觀測(cè)數(shù)據(jù)的分布趨勢(shì)與特點(diǎn),來(lái)確定兩個(gè)要素之間的曲線類型及其函數(shù)形式,從而求非線性地理回歸模型的過(guò)程及其方法叫做曲線選配(三)一元非線性回歸模型的建立選配曲線的方法100地理上常見(jiàn)的非線性回歸模型的建立方法冪函數(shù)型y=axb對(duì)上式兩邊取常用對(duì)數(shù)或自然對(duì)數(shù)Lny=Lna+bLnx或Y=A+bX地理上常見(jiàn)的非線性回歸模型的建立方法101指數(shù)函數(shù)型兩個(gè)地理要素(變量)之間的指數(shù)函數(shù)表達(dá)式為Y=aebx或y=ae-bx,y=abx兩邊取常用對(duì)數(shù)或自然對(duì)數(shù),則得Lny=Lna+bx或Y=A+bx指數(shù)函數(shù)型102對(duì)數(shù)函數(shù)型y=a+bLnx則y=a+bX對(duì)數(shù)函數(shù)型103非線性關(guān)系線性化的幾種情況對(duì)于指數(shù)曲線,令,可以將其轉(zhuǎn)化為直線形式:,其中,;
對(duì)于對(duì)數(shù)曲線,令,,可以將其轉(zhuǎn)化為直線形式:;對(duì)于冪函數(shù)曲線,令,,可以將其轉(zhuǎn)化為直線形式:其中,;非線性回歸模型
非線性關(guān)系線性化的幾種情況非線性回歸模型104對(duì)于雙曲線,令,轉(zhuǎn)化為直線形式:;對(duì)于S型曲線,可轉(zhuǎn)化為直線形式:;對(duì)于冪乘積,只要令,就可以將其轉(zhuǎn)化為線性形式其中,;對(duì)于雙曲線,令105對(duì)于對(duì)數(shù)函數(shù)和只要令,就可以將其化為線性形式
例:表3.2.1給出了某地區(qū)林地景觀斑塊面積(area)與周長(zhǎng)(perimeter)的數(shù)據(jù)。下面我們建立林地景觀斑塊面積A與周長(zhǎng)P之間的非線性回歸模型。對(duì)于對(duì)數(shù)函數(shù)和106
序號(hào)面積A周長(zhǎng)P序號(hào)面積A周長(zhǎng)P110447.370625.39242232844.3004282.043215974.730612.286434054.660289.307330976.770775.7124430833.840895.98049442.902530.202451823.355205.131510858.9201906.1034626270.300968.060621532.9101297.9624713573.9601045.07276891.680417.0584865590.0802250.43583695.195243.90749157270.4002407.54992260.180197.239502086.426266.54110334.33299.729513109.070261.8181111749.080558.921522038.617320.396122372.105199.667533432.137253.335138390.633592.893541600.391230.030146003.719459.467553867.586419.406表3.2.1某地區(qū)各個(gè)林地景觀斑塊面積(m2)與周長(zhǎng)(m)
序號(hào)面積A周長(zhǎng)P序號(hào)面積A周長(zhǎng)P110447.3706210715527620.2006545.291561946.184198.66116179686.2002960.4755777.30556.9021714196.460597.993587977.719715.7521822809.1801103.0705919271.8201011.1271971195.9401154.118608263.480680.710203064.242245.0496114697.1301234.11421469416.7008226.009624519.867326.317225738.953498.6566313157.6601172.916238359.465415.151646617.270609.801246205.016414.790654064.137437.3552560619.0201549.871665645.820432.3552614517.740791.943676993.355503.7842731020.1001700.965684304.281267.9512826447.1601246.977696336.383347.136297985.926918.312702651.414292.23515527620.2006545.291561946.108303638.766399.725712656.824298.47331585425.10011474.770721846.988179.8663235220.6401877.476731616.684172.8083310067.820497.394741730.563172.1433427422.5701934.5967511303.970881.0423543071.5501171.4137614019.790638.1763657585.9402275.389779277.172862.0883728254.1301322.7957813684.750712.78738497261.0009581.298791949.164228.4033924255.030994.906804846.016324.481401837.699229.40181521457.4007393.938411608.625225.84282564370.80012212.410303638.766399.725712656.8242109解:(1)作變量替換,令:,,將表3.2.1中的原始數(shù)據(jù)進(jìn)行對(duì)數(shù)變換,變換后得到的各新變量對(duì)應(yīng)的觀測(cè)數(shù)據(jù)如表3.2.2所示。
序號(hào)y=lnAx=LnP序號(hào)y=lnAx=LnP19.2541066.4383794212.358138.36218629.6787636.4172438.3076225.667487310.340996.6537824410.336376.79791849.1530196.273258457.5084335.3236559.2927427.5528164610.176196.87529469.9773387.168551479.5159096.95184178.838076.0332264811.091187.71887988.2147895.4967894911.965727.78636497.72325.284414507.6432085.585528105.8121354.602457518.0420795.567651119.371536.326008527.6200275.769558表3.2.2經(jīng)對(duì)數(shù)變換后的數(shù)據(jù)解:(1)作變量替換,令:,,110127.7715335.296653538.1409385.534711139.0348716.385013547.3780035.438211148.7001346.130066558.2603866.0388391513.176138.786501567.5736265.2915971612.098977.993105574.3477554.041328179.5607486.393579588.9844086.5733341810.034927.005852599.8663996.9188211911.173197.051092609.0196016.523136208.0275565.501457619.5954087.1181092113.059259.015056628.4162385.787871228.6550326.211917639.4847597.067248239.031156.028643648.7974386.413133248.7331136.027773658.3099576.0807442511.012367.345927668.6386716.069247269.5831276.67449678.8527166.222147127.7715335.296653538.140931112710.342397.438951688.3673655.5908062810.18297.128478698.7540635.849717298.9854366.822537707.8828485.67756308.19945.990776717.8848875.6986783113.280099.347906727.5213115.1922133210.469397.537684737.3881325.152181339.2170996.209381747.4562025.1483263410.219127.567654759.3329096.7811053510.670627.065966769.5482256.4586143610.961037.729906779.1353126.7593583710.248997.187502789.5240376.5691823813.116879.167568
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職(道路橋梁工程技術(shù))橋梁設(shè)計(jì)試題及答案
- 2026年醫(yī)學(xué)檢驗(yàn)綜合(多項(xiàng)目檢測(cè))試題及答案
- 2025年中職汽車運(yùn)用與維修(節(jié)能汽車基礎(chǔ))試題及答案
- 教堂介紹教學(xué)課件
- 中國(guó)科學(xué)技術(shù)大學(xué)素材
- 養(yǎng)老院老人生活照料規(guī)范制度
- 養(yǎng)老院老人健康監(jiān)測(cè)制度
- 養(yǎng)老院定期體檢制度
- 養(yǎng)老院健康講座制度
- 2024年湖北省中考數(shù)學(xué)真題及答案解析
- 授信合同與借款合同(標(biāo)準(zhǔn)版)
- 2024-2025學(xué)年四川省綿陽(yáng)市七年級(jí)(上)期末數(shù)學(xué)試卷
- 道路清掃保潔、垃圾收運(yùn)及綠化服務(wù)方案投標(biāo)文件(技術(shù)標(biāo))
- 合成藥物催化技術(shù)
- 【語(yǔ)文】福建省福州市烏山小學(xué)小學(xué)三年級(jí)上冊(cè)期末試題(含答案)
- 建立鄉(xiāng)鎮(zhèn)衛(wèi)生院孕情第一時(shí)間發(fā)現(xiàn)制度或流程
- 2025年中級(jí)衛(wèi)生職稱-主治醫(yī)師-放射醫(yī)學(xué)(中級(jí))代碼:344歷年參考題庫(kù)含答案解析(5卷)
- 2025年中國(guó)民航科學(xué)技術(shù)研究院招聘考試筆試試題(含答案)
- eol物料管理辦法
- 總公司對(duì)子公司管理制度
- 臨沂公車租賃管理辦法
評(píng)論
0/150
提交評(píng)論