地理信息系統(tǒng)原理第五章-空間分析與建模5.2_第1頁
地理信息系統(tǒng)原理第五章-空間分析與建模5.2_第2頁
地理信息系統(tǒng)原理第五章-空間分析與建模5.2_第3頁
地理信息系統(tǒng)原理第五章-空間分析與建模5.2_第4頁
地理信息系統(tǒng)原理第五章-空間分析與建模5.2_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五章空間分析與建模Spatialanalysisandmodeling§5.2空間統(tǒng)計(jì)分析空間統(tǒng)計(jì)分析主要用于空間和非空間數(shù)據(jù)的分類、統(tǒng)計(jì)、分析和綜合評價??臻g統(tǒng)計(jì)分析的方法有很多,包括統(tǒng)計(jì)圖表分析、描述統(tǒng)計(jì)分析、空間自相關(guān)分析、回歸分析、空間信息分類。為什么要用空間統(tǒng)計(jì)分析?空間統(tǒng)計(jì)分析,其核心就是認(rèn)識與地理位置相關(guān)的數(shù)據(jù)間的空間依賴、空間關(guān)聯(lián)或空間自相關(guān),通過空間位置建立數(shù)據(jù)間的統(tǒng)計(jì)關(guān)系??臻g統(tǒng)計(jì)分析的任務(wù),就是運(yùn)用有關(guān)統(tǒng)計(jì)方法,建立空間統(tǒng)計(jì)模型,從凌亂的數(shù)據(jù)中挖掘空間自相關(guān)與空間變異規(guī)律。為什么要用空間統(tǒng)計(jì)分析?空間數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計(jì)分析主要有兩大差異:空間數(shù)據(jù)間并非獨(dú)立,而是在多維空間中具有某種空間相關(guān)性,且在不同的空間分辨率下呈現(xiàn)不同之相關(guān)程度;地球只有一個,大多數(shù)空間問題僅有一組(空間分布不規(guī)則的)觀測值,而無重復(fù)觀測數(shù)據(jù)。因此,空間現(xiàn)象的了解與描述是極為復(fù)雜的,而傳統(tǒng)方法,尤其是建立在獨(dú)立樣本上的統(tǒng)計(jì)方法,不適合分析空間數(shù)據(jù)。經(jīng)典統(tǒng)計(jì):獨(dú)立性、隨機(jī)性假設(shè)空間統(tǒng)計(jì):自相關(guān)(結(jié)構(gòu)性)、依賴性、異質(zhì)性地理學(xué)第一定律(FLG):everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings(Tobler,1970).空間統(tǒng)計(jì)的基本思想:WaldoTobler(bornin1930)receivingaplaqueforhiscontributionstogeography.OntheeventofhisNovember2000birthday./wiki/Waldo_R._Tobler

Tobler,

W.R.(1970)."AcomputermoviesimulatingurbangrowthintheDetroitregion".EconomicGeography,

46(2):234-240.FLG的一般性:自然地理、人文地理、社會經(jīng)濟(jì)空間自相關(guān)是普遍存在的,否則地理分析便沒有多大意義。(空間模式、空間格局、空間變化規(guī)律)

經(jīng)典統(tǒng)計(jì):獨(dú)立

空間自相關(guān)的存在,使得經(jīng)典統(tǒng)計(jì)學(xué)所要求的樣本獨(dú)立性假設(shè)不滿足。如果地理學(xué)從根本上值得研究,必然是因?yàn)榈乩憩F(xiàn)象在空間上的變化不是隨機(jī)的。

經(jīng)典統(tǒng)計(jì):隨機(jī)霍亂病死者居住分布圖(JohnSnow,

1854)1854年8月到9月英國倫敦霍亂流行時,當(dāng)局始終找不到發(fā)病的原因,后來醫(yī)生約翰·斯諾(JohnSnow)參與調(diào)查。他在繪有霍亂流行地區(qū)所有道路、房屋、飲用水機(jī)井等內(nèi)容的1:6500比例尺地圖上,標(biāo)出了每個霍亂病死者的居住位置,得到了霍亂病死者居住分布圖。斯諾博士分析了這張分布圖,馬上明白了霍亂病源之所在,死者住家都集中于飲用“布洛多斯托”井水的地方及周圍。1.統(tǒng)計(jì)圖表分析2.描述統(tǒng)計(jì)分析—基本統(tǒng)計(jì)量2.描述統(tǒng)計(jì)分析3.空間自相關(guān)分析

通常定義一個二元對稱空間權(quán)重矩陣W,來表達(dá)n個位置的空間區(qū)域的鄰近關(guān)系,其形式如下式中:wij表示區(qū)域i與j的鄰近關(guān)系,它可以根據(jù)鄰接標(biāo)準(zhǔn)或距離標(biāo)準(zhǔn)來度量。

基本原理與方法

空間權(quán)重矩陣

①簡單的二進(jìn)制鄰接矩陣②基于距離的二進(jìn)制空間權(quán)重矩陣兩種最常用的確定空間權(quán)重矩陣的規(guī)則

全局空間自相關(guān)

Moran指數(shù)反映的是空間鄰接或空間鄰近的區(qū)域單元屬性值的相似程度。

Geary系數(shù)與Moran指數(shù)存在負(fù)相關(guān)關(guān)系。

PatrickA.P.Moran(1917-1988)

Moran指數(shù)和Geary系數(shù)是兩個用來度量空間自相關(guān)的全局指標(biāo)。全局空間自相關(guān)概括了在一個總的空間范圍內(nèi)空間依賴的程度。

如果x是位置(區(qū)域)的觀測值,則該變量的全局Moran指數(shù)I,用如下公式計(jì)算式中:I為Moran指數(shù);

;。Geary系數(shù)C計(jì)算公式如下

式中:C為Geary系數(shù);其他變量同上式。如果引入記號

Moran指數(shù)I的取值一般在[-1,1]之間,小于0表示負(fù)相關(guān),等于0表示不相關(guān),大于0表示正相關(guān);

Geary系數(shù)C的取值一般在[0,2]之間,大于1表示負(fù)相關(guān),等于1表示不相關(guān),而小于1表示正相關(guān)。

局部空間自相關(guān)(擴(kuò)展)描述一個空間單元與其鄰域的相似程度,能夠表示每個局部單元服從全局總趨勢的程度(包括方向和量級),反映了空間異質(zhì)性,說明空間依賴是如何隨位置變化的。局部空間自相關(guān)分析方法包括3種:

空間聯(lián)系的局部指標(biāo)(LISA);

G統(tǒng)計(jì)量;

Moran散點(diǎn)圖空間聯(lián)系的局部指標(biāo)(LISA)

空間聯(lián)系的局部指標(biāo)(localindicatorsofspatialassociation,縮寫為LISA)滿足下列兩個條件:(1)每個區(qū)域單元的LISA,是描述該區(qū)域單元周圍顯著的相似值區(qū)域單元之間空間集聚程度的指標(biāo);(2)所有區(qū)域單元LISA的總和與全局的空間聯(lián)系指標(biāo)成比例。LISA包括局部Moran指數(shù)(localMoranindex)和局部Geary指數(shù)(localGearyindex),下面重點(diǎn)介紹和討論局部Moran指數(shù)。局部Moran指數(shù)被定義為可進(jìn)一步寫成

式中:和是經(jīng)過標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化的觀測值。局部Moran指數(shù)檢驗(yàn)的標(biāo)準(zhǔn)化統(tǒng)計(jì)量為

G統(tǒng)計(jì)量全局G統(tǒng)計(jì)量的計(jì)算公式為對每一個區(qū)域單元的統(tǒng)計(jì)量為

探測區(qū)域單元是屬于高值集聚還是低值集聚的空間分布模式.對統(tǒng)計(jì)量的檢驗(yàn)與局部Moran指數(shù)相似,其檢驗(yàn)值為

顯著的正值表示在該區(qū)域單元周圍,高觀測值的區(qū)域單元趨于空間集聚,而顯著的負(fù)值表示低觀測值的區(qū)域單元趨于空間集聚,與Moran指數(shù)只能發(fā)現(xiàn)相似值(正關(guān)聯(lián))或非相似性觀測值(負(fù)關(guān)聯(lián))的空間集聚模式相比,具有能夠探測出區(qū)域單元屬于高值集聚還是低值集聚的空間分布模式。

Moran散點(diǎn)圖

以(Wz,z)為坐標(biāo)點(diǎn)的Moran散點(diǎn)圖,常來研究局部的空間不穩(wěn)定性,它對空間滯后因子Wz(即該觀測值周圍鄰居的加權(quán)平均)和z數(shù)據(jù)對進(jìn)行了可視化的二維圖示。全局Moran指數(shù),可以看作是Wz對于z的線性回歸系數(shù),對界外值以及對Moran指數(shù)具有強(qiáng)烈影響的區(qū)域單元,可通過標(biāo)準(zhǔn)回歸來診斷出。由于數(shù)據(jù)對(Wz,z)經(jīng)過了標(biāo)準(zhǔn)化,因此界外值可易由2-sigma規(guī)則可視化地識別出來。Moran散點(diǎn)圖的4個象限,分別對應(yīng)于區(qū)域單元與其鄰居之間4種類型的局部空間聯(lián)系形式:第1象限代表了高觀測值的區(qū)域單元被高值的區(qū)域所包圍的空間聯(lián)系形式;第2象限代表了低觀測值的區(qū)域單元被高值的區(qū)域所包圍的空間聯(lián)系形式;HHLHLLHL

第3象限代表了低觀測值的區(qū)域單元被低值的區(qū)域所包圍的空間聯(lián)系形式;第4象限代表了高觀測值的區(qū)域單元被低值的區(qū)域所包圍的空間聯(lián)系形式。HHLHLLHL2.應(yīng)用實(shí)例

中國大陸30個省級行政區(qū)人均GDP的空間關(guān)聯(lián)分析。根據(jù)各?。ㄖ陛犑?、自治區(qū))之間的鄰接關(guān)系,采用二進(jìn)制鄰接權(quán)重矩陣,選取各?。ㄖ陛犑?、自治區(qū))1998—2002年人均GDP的自然對數(shù),依照公式計(jì)算全局Moran指數(shù)I,計(jì)算其檢驗(yàn)的標(biāo)準(zhǔn)化統(tǒng)計(jì)量Z(I),結(jié)果如下表所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000

從表中可以看出,在1998—2002年期間,中國大陸30個省級行政區(qū)人均GDP的全局Moran指數(shù)均為正值;在正態(tài)分布假設(shè)之上,對Moran指數(shù)檢驗(yàn)的結(jié)果也高度顯著。這就是說,在1998—2002年期間,中國大陸30個省級行政區(qū)人均GDP存在著顯著的、正的空間自相關(guān),也就是說各省級行政區(qū)人均GDP水平的空間分布表現(xiàn)出相似值之間的空間集聚,其空間聯(lián)系的特征是:較高人均GDP水平的省級行政區(qū)相對地趨于和較高人均GDP水平的省級行政區(qū)相鄰,或者較低人均GDP水平的省級行政區(qū)相對地趨于和較低人均GDP水平的省級行政區(qū)相鄰。

選取2001年我國30個省級行政區(qū)人均GDP數(shù)據(jù),計(jì)算局部Gi統(tǒng)計(jì)量和局部Gi統(tǒng)計(jì)量的檢驗(yàn)值Z(Gi),并繪制統(tǒng)計(jì)地圖如下。

檢驗(yàn)結(jié)果表明,貴州、四川、云南西部3省的Z值在0.05的顯著性水平下顯著,重慶的Z值在0.1的顯著性水平下顯著,該4省市在空間上相連成片分布,而且從統(tǒng)計(jì)學(xué)意義上來說,與該區(qū)域相鄰的省區(qū),其人均GDP趨于為同樣是人均GDP低值的省區(qū)所包圍。由此形成人均GDP低值與低值的空間集聚,據(jù)此可認(rèn)識到西部落后省區(qū)趨于空間集聚的分布特征。

東部的江蘇、上海、浙江三省市的Z值在0.05的顯著性水平下顯著,天津的Z值在0.1的顯著性水平下顯著。而東部上海、江浙等發(fā)達(dá)省市趨于為一些相鄰經(jīng)濟(jì)發(fā)展水平相對較高的省份所包圍,東部發(fā)達(dá)地區(qū)的空間集聚分布特征也顯現(xiàn)出來。

以(Wz,z)為坐標(biāo),進(jìn)一步繪制Moran散點(diǎn)圖可以發(fā)現(xiàn),多數(shù)省(直轄市、自治區(qū))位于第1和第3象限內(nèi),為正的空間聯(lián)系,屬于低低集聚和高高集聚類型,而且位于第3象限內(nèi)的低低集聚類型的?。ㄖ陛犑小⒆灾螀^(qū))比位于第1象限內(nèi)的高高集聚類型的?。ㄖ陛犑?、自治區(qū))更多一些。

上圖進(jìn)一步顯示了30個省級行政區(qū)人均GDP局部集聚的空間結(jié)構(gòu)??梢钥闯觯瑥娜司鵊DP水平相對地來看:高值被高值包圍的高高集聚?。ㄖ陛犑校┯校罕本?、天津、河南、安徽、湖北、江西、海南、廣東、福建、浙江、山東、上海、江蘇;低值被低值包圍的低低集聚?。ㄗ灾螀^(qū))有:黑龍江、內(nèi)蒙古、新疆、吉林、甘肅、山西、陜西、青海、西藏、四川、云南、遼寧、貴州;被低值包圍的高值?。ㄖ陛犑校┯校褐貞c、廣西、河北;被高值包圍的低值省份只有湖南。4.回歸分析回歸分析用于分析兩組或多組變量之間的相關(guān)關(guān)系,常見回歸分析方程有線性回歸、指數(shù)回歸、對數(shù)回歸、多元回歸等。線性回歸Logistic回歸Poisson回歸負(fù)二項(xiàng)回歸Weibull回歸Cox回歸分位數(shù)回歸Tobit回歸…………回歸分析工作的基本原理在實(shí)際工作中,我們可能會遇到以下類似的問題

在我們國家是否有持續(xù)發(fā)生年輕人早逝的地方?

哪里為犯罪或火災(zāi)的高發(fā)地點(diǎn)?

城市中哪里的交通事故發(fā)生率比預(yù)期的要高?

……回歸分析工作的基本原理在實(shí)際工作中,我們可能會遇到以下類似的問題

在我們國家是否有持續(xù)發(fā)生年輕人早逝的地方?

哪里為犯罪或火災(zāi)的高發(fā)地點(diǎn)?

城市中哪里的交通事故發(fā)生率比預(yù)期的要高?

……119緊急呼叫數(shù)據(jù)的

分析結(jié)果,顯示了

呼叫熱點(diǎn)(紅色)、呼叫冷點(diǎn)(藍(lán)色)以及負(fù)責(zé)事故處理的消防和警察分隊(duì)的位置(綠色十字)可以通過熱點(diǎn)分析的方法弄清以上問題對于上面的每一個問題都詢問了“where”,但是我們自然會想到“why”為什么國家會存在持續(xù)發(fā)生年輕人早逝的地方?是什么導(dǎo)致了這種情況?我們能否對犯罪、119呼叫或火災(zāi)頻發(fā)地區(qū)的特征進(jìn)行建模,

以幫助減少這些事件的發(fā)生?導(dǎo)致交通事故發(fā)生率比預(yù)期要高的因素有哪些,有沒有相關(guān)政策或者措施來減少整個城市或特定事故高發(fā)區(qū)的交通事故?使用回歸分析的主要原因1.對某一現(xiàn)象建模,測量一個或多個變量的變化對另一變量變化的影響程度。2.對某種現(xiàn)象建模以預(yù)測其他地點(diǎn)或其他時間的數(shù)值,構(gòu)建一個持續(xù)準(zhǔn)確的預(yù)測模型。3.深入探索某些假設(shè)情況。

假設(shè)您正在對住宅區(qū)的犯罪活動進(jìn)行建模,以更好的了解犯罪活動并希望實(shí)施可能阻止犯罪活動的策略,開始分析時,就會有很多問題或想要檢驗(yàn)的假設(shè)情況:

1)“破窗理論”表明公共財(cái)產(chǎn)的破壞(涂鴉、被毀壞的建筑物等)可招致其他犯罪行為,破壞財(cái)產(chǎn)行為與入世盜竊之間是

否存在正關(guān)系?

2)非法使用毒品與盜竊行為之間存在某種關(guān)系嗎(吸毒成癮的人又可能通過偷取財(cái)物來維持他們吸毒的習(xí)慣嗎)?r2

=

r=

1Se=

0.0Sy

=

2b=

2perfectpositiver =

0.94

r

=.97Se=

0.32r =

0.51

r

=.71Se=

1.1b=

1.12Very

strongstrongr2

=

0.26

r

=.51Se=

1.3b=

0.8r2

=

0.07Se=

1.8b=

0.1r2

=

r=

0.00Se=

Sy

=2moderateweaknoneRegressionline

inblueAsthecoefficient

of

determination

gets

smaller,

theslope

of

theregression

line(b)

gets

closer

to

zero.Asthecoefficient

of

determination

gets

smaller,

thestandard

error

getslarger,

and

closer

to

the

standard

deviation

of

the

dependent

variable

(Y)(Sy

=2)Coefficient

of

determination

(r2

),

correlation

coefficinet

(r),regression

coefficient

(b),

and

standard

error (Se)b=

0(Values

are

hypothetical

andfor

illustration

of

relative

change

only)注意判定系數(shù)、相關(guān)系數(shù)、回歸系數(shù)的意義與不同Sample

Statistics,Population

Parameters

andStatistical

SignificancetestsYi =

a

+bXi

+

iYi

α

βXi

εia

andb

are

sample

statisticswhich

are

estimates

ofpopulation

parameters

α

and

βTestStatisticsin

SimpleRegressionTest

statistic

for

b

is

distributed

according

to

the

Student’s

tT檢驗(yàn)是針對單個變量的系數(shù)進(jìn)行顯著性檢驗(yàn)F檢驗(yàn)是針對整個回歸方程做顯著性檢驗(yàn)( Y –

Y?

)2

/

n

2i i

Distribution

(similar

to

normal):where

se is

the

variance

of

the

estimate,with degrees

of

freedom

=n

2iA

test

can

also

be

conducted

on

the

coefficient

ofdetermination

(r2

)to

test

if

it

is

significantly

greater

than

zero,

using

the

F

frequencydistribution.- Y)2

/

1

( Y?Regression

S.S./d.f.Residual

S.S./d.f.i

F

(

X

X

)2SE(b)s2t

eb b2一般OLS回歸方程Anscombe,

Francis

J.

(1973).

"Graphs

in

statistical

analysis".

The

AmericanStatistician

27:

17–21.Alwayslook

at

your

dataDon’t

justrely

onthe

statistics!Anscombe's

quartetSummary

statistics

are

thesamefor

all

four

data

sets:mean (7.5),standard

deviation

(4.12),correlation (0.816)regression

line(y

=3

+

0.5x).注:不僅要注意回歸方程,還要看數(shù)據(jù)本身的散點(diǎn)圖?。。aiting

timebetween

eruptions

and

the

duration

ofthe

eruption

for

the

OldFaithful

Geyser

in

Yellowstone

National

Park,

Wyoming,

USA.

This

chartsuggests

there

are

generally

two"types"

of

eruptions:

short-wait-short-duration,

andlong-wait-long-duration.Source:

Wikipedia注:不僅要注意回歸方程,還要看數(shù)據(jù)本身的散點(diǎn)圖!?。】赡苄枰纸M回歸 Real

data

is

almostalways

more

complexthanthe

simple,

straight

linerelationship

assumed

inregression.Spuriousrelationships12000100008000600040002000014000050001000015000200002500030000 35000Ice

Cream

sales

relatedto

DrowningsEating

ice

creaminhibits

swimmingability.--eat

too

much,

youcannot

swimOmitted

variableproblem--both

are

related

to

athird

variable

notincluded

inthe

analysisSummer

temperatures:--morepeople

swim(and

some

drown)--moreice

cream

issoldHelp!注:回歸要注意屬性間的邏輯,要有意義,否則可能出現(xiàn)虛假關(guān)系!Regression

does

not

prove

directionorcause!Income

and

IlliteracyProvinces

with

higher

incomes

can

affordto

spend

more

on

education,

so

illiteracy

islowerHigher

Income>>>>Less

IlliteracyThe

higher

the

level

of

literacy

(and

thusthe

lower

the

level

of

illiteracy)

the

morehigh

income

jobs.Less

Illiteracy>>>>Higher

IncomeRegression

will

not

decide!IncomeIlliteracyIncomeIlliteracy回歸模型中常見的問題1.遺漏自變量2.非線性關(guān)系

3.數(shù)據(jù)異常值4.不穩(wěn)定性5.多重共線性。6.殘差的方差不一致

7.空間自相關(guān)殘差8.正態(tài)分布偏差模型評估(1)評估模型性能。(2)評估模型中的每一個解釋變量(3)評估模型是否具有顯著性(4)評估穩(wěn)定性(5)評估模型偏差(6)評估殘差空間自相關(guān)

在空間分析(Spatial

analysis)中,變量的觀測值(數(shù)據(jù))一般都是按照某給定的地理單位為抽樣單位得到的,隨著地理位置的變化,變量間的關(guān)系或者結(jié)構(gòu)會發(fā)生變化,這種因地理位置的變化而引起的變量間關(guān)系或結(jié)構(gòu)的變化稱之為空間非平穩(wěn)性(spatialnonstationarity)。

這種空間非平穩(wěn)性普遍存在于空間數(shù)據(jù)中,如果采用通常的線性回歸模型或某一特定形式的非線性回歸函數(shù)來分析空間數(shù)據(jù),一般很難得到滿意的結(jié)果,因?yàn)槿帜P停╣lobal

model)在分析之前就假定了變量間的關(guān)系具有同質(zhì)性(homogeneity),從而掩蓋了變量間關(guān)系的局部特性,所得結(jié)果也只有研究區(qū)域內(nèi)的某種“平均”,因此需要對傳統(tǒng)的分析方法進(jìn)行改進(jìn)。GeographicallyWeighted

RegressionThe

idea

of

LocalIndicators can

also

be

applied

toregressionIts

called

geographically

weighted

regressionIt

calculates

a

separate

regression

for

each

polygon

and

its

neighbors,then

maps

the

parameters

from

the

model,

such

as

the

regression

coefficient

(b)

and/or

its

significance

valueMathematically,

this

is

done

by

applying

the

spatial

weights

matrix

(Wij)to

the

standard

formulae

for

regressionXi注:GWR考慮局部,建議閱讀參考文獻(xiàn)Problems

with

Geographically

WeightedRegressionEach

regression

is

based

on few

observationsthe

estimates

of

the

regression

parameters

(b)

are

unreliableNeedto

use

more

observations

than

just

those

with

sharedborder,

buthow

far

out

do

we

go?How

far

out

is

the

“l(fā)ocal

effect”?Need

strong

theory

to

explain

why

the

regressionparameters

are

different

at

different

placesSerious

questions

about

validity

of

statistical

inferencetests

since

observations

not

independent49Xi趨勢上有劇烈變化5.趨勢分析6.空間信息分類(1)主成分分析(PrincipalComponentAnalysis,PCA)主成分分析就是把原有的多個指標(biāo)轉(zhuǎn)化成少數(shù)幾個代表性較好的綜合指標(biāo),這少數(shù)幾個指標(biāo)能夠反映原來指標(biāo)大部分的信息(85%以上),并且各個指標(biāo)之間保持獨(dú)立,避免出現(xiàn)重疊信息。主成分分析主要起著降維和簡化數(shù)據(jù)結(jié)構(gòu)的作用。

假設(shè)我們所討論的實(shí)際問題中,有p個指標(biāo),我們把這p個指標(biāo)看作p個隨機(jī)變量,記為X1,X2,…,Xp,主成分分析就是要把這p個指標(biāo)的問題,轉(zhuǎn)變?yōu)橛懻搈個新的指標(biāo)F1,F(xiàn)2,…,F(xiàn)m(m<p),按照保留主要信息量的原則充分反映原指標(biāo)的信息,并且相互獨(dú)立。其中主成分分析通常的做法是,尋求原指標(biāo)的線性組合Fi。滿足如下的條件:主成分之間相互獨(dú)立,即無重疊的信息。即主成分的方差依次遞減,重要性依次遞減,即每個主成分的系數(shù)平方和為1。即??????????????????????????????????????(2)層次分析法日常生活中有許多決策問題。決策是指在面臨多種方案時需要依據(jù)一定的標(biāo)準(zhǔn)選擇某一種方案。例

擇業(yè)面臨畢業(yè),可能有高校、科研單位、企業(yè)等單位可以去選擇,一般依據(jù)工作環(huán)境、工資待遇、發(fā)展前途、住房條件等因素?fù)駱I(yè)。層次分析法(AnalyticHierarchyProcess,

AHP)是一種定性和定量相結(jié)合的、系統(tǒng)化的、層次化的分析方法。研究自然和社會現(xiàn)象主要的主要方法有機(jī)理分析法,用經(jīng)典的數(shù)學(xué)工具分析現(xiàn)象的因果關(guān)系統(tǒng)計(jì)分析法,以隨機(jī)數(shù)學(xué)為工具,通過大量的觀察數(shù)據(jù)尋求統(tǒng)計(jì)規(guī)律。近年發(fā)展的系統(tǒng)分析是又一種方法,而層次分析法是系統(tǒng)分析的數(shù)學(xué)工具之一。層次分析法的基本思路:與人們對某一復(fù)雜決策問題的思維、判斷過程大體一致。選擇鋼筆質(zhì)量、顏色、價格、外形、實(shí)用鋼筆1、鋼筆2、鋼筆3、鋼筆4將各個鋼筆的質(zhì)量、顏色、價格、外形、實(shí)用進(jìn)行排序經(jīng)綜合分析決定買哪支鋼筆層次分析法的基本步驟買鋼筆質(zhì)量顏色價格外形實(shí)用可供選擇的筆建立層次結(jié)構(gòu)模型(1)將決策問題分為三層,最上面為目標(biāo)層,最下面為方案層,中間是準(zhǔn)則層或指標(biāo)層;(2)通過相互比較確定各準(zhǔn)則對于目標(biāo)的權(quán)重,及各方案對于每一準(zhǔn)則的權(quán)重;(3)將方案層對準(zhǔn)則層的權(quán)重及準(zhǔn)則層對目標(biāo)層的權(quán)重進(jìn)行綜合,最終確定方案層對目標(biāo)層的權(quán)重。例

選擇鋼筆的層次結(jié)構(gòu)

準(zhǔn)則層

方案層目標(biāo)層選擇旅游地景色費(fèi)用居住飲食旅途蘇杭、北戴河、桂林例

選擇旅游地的層次結(jié)構(gòu)

準(zhǔn)則層A

方案層B目標(biāo)層Z

人們在決策的時候憑自己的經(jīng)驗(yàn)和知識進(jìn)行判斷,當(dāng)因素較多時給出的結(jié)果往往是不全面和不準(zhǔn)確的,如果只是定性的結(jié)果,則常常不被別人接受。Saaty等人的做法,一是不把所有因素放在一起比較,而是兩兩相互對比;二是對比時采用相對尺度,以盡可能地減少性質(zhì)不同的諸因素相互比較的困難,提高準(zhǔn)確度。設(shè)某層有個因素,構(gòu)造成對比較矩陣要比較它們對上一層某一準(zhǔn)則(或目標(biāo))的影響程度,確定在該層中相對于某一準(zhǔn)則所占的比重。(即把個因素對上層某一目標(biāo)的影響程度排序)用表示第個因素相對于第個因素的比較結(jié)果,則則稱為成對比較矩陣。上述比較是兩兩因素之間進(jìn)行的比較,比較時取1~9尺度。13579尺度第個因素與第個因素的影響相同第個因素比第個因素的影響稍強(qiáng)第個因素比第個因素的影響強(qiáng)第個因素比第個因素的影響明顯強(qiáng)第個因素比第個因素的影響絕對地強(qiáng)含義比較尺度:(1~9尺度的含義)2,4,6,8表示第i個因素相對于第j個因素的影響介于上述兩個相鄰等級之間。不難定義以上各尺度倒數(shù)的含義,根據(jù)。由上述定義知,成對比較矩陣則稱為正互反陣。比如,在旅游問題中,某人給出第二層A的各因素對目標(biāo)層Z的影響兩兩比較結(jié)果如下:滿足以下性質(zhì):

ZA1A2A3A4A5A1A2A3A4A511/2433217551/41/711/21/31/31/52111/31/5311分別表示景色、費(fèi)用、居住、飲食、旅途。由上表,可得成對比較矩陣

表示景色與費(fèi)用之比為1:2,表示景色居住條件之比為4:1,…,可以看出,此人在選擇旅游地時,費(fèi)用因素最重要,景色次之,居住條件再次。旅游問題的成對比較矩陣共有6個(一個5階,5個3階)。問題:兩兩進(jìn)行比較后,怎樣才能知道,下層各因素對上層某因素的影響程度的排序結(jié)果呢?既然與之比為1:2,與之比為4:1,那么應(yīng)該有:,而不是7:1,才能說明成對比較是一致的。但是,n個因素要作n(n-1)/2次成對比較,全部一致的要求是太苛刻了!因此,Saaty等人給出了在成對比較不一致的情況下計(jì)算各因素對因素z的權(quán)重的方法,并且確定了這種不一致的容許范圍,為了說明這一點(diǎn),我們先看成對比較完全一致的情況。層次單排序及一致性檢驗(yàn)層次單排序:確定下層各因素對上層某因素影響程度的過程。由線性代數(shù)的相關(guān)知識,有以下幾個結(jié)論:

階互反陣的最大特征根,當(dāng)且僅當(dāng)

時,為一致陣。由于連續(xù)的依賴于,則比大的越多,的不一致性越嚴(yán)重。用最大特征值對應(yīng)的特征向量作為被比較因素對上層某因素影響程度的權(quán)向量,其不一致程度越大,引起的判斷誤差越大。因而可以用數(shù)值的大小來衡量的不一致程度。定義一致性指標(biāo)CI=0時,A為一致陣;CI越大A的不一致程度越嚴(yán)重。注意到A的n個特征根之和恰好為n,所以CI相當(dāng)于除λ外其余的特征根的平均值。則可得一致性指標(biāo)定義隨機(jī)一致性指標(biāo)隨機(jī)構(gòu)造500個成對比較矩陣隨機(jī)一致性指標(biāo)RI的數(shù)值:n1234567891011RI000.580.901.121.241.321.411.451.491.51一致性檢驗(yàn):利用一致性指標(biāo)和一致性比率<0.1及隨機(jī)一致性指標(biāo)的數(shù)值表,對進(jìn)行檢驗(yàn)的過程。

一般,當(dāng)一致性比率的不一致程度在容許范圍之內(nèi),可用其歸一化特征向量作為權(quán)向量,否則要重新構(gòu)造成對比較矩陣,對加以調(diào)整。時,認(rèn)為層次單排序:確定下層各因素對上層某因素影響程度的過程。用權(quán)值表示影響程度,先從一個簡單的例子看如何確定權(quán)值。例如一塊石頭重量記為1,打碎分成各小塊,各塊的重量分別記為:則可得成對比較矩陣由右面矩陣可以看出,即,但在例2的成對比較矩陣中,在正互反矩陣中,若,則稱為一致陣。一致陣的性質(zhì):5.的任一列(行)都是對應(yīng)于特征根的特征向量。1.和法(近似計(jì)算)2.根法(近似計(jì)算)無論是和法還是根法,作為權(quán)重,應(yīng)再將W歸一化1,2中判斷矩陣A的最大特征值可由下面的公式得到:3.迭代法(MATLAB軟件計(jì)算)4層次總排序及其一致性檢驗(yàn)

確定某層所有因素對于總目標(biāo)相對重要性的排序權(quán)值過程,稱為層次總排序

從最高層到最低層逐層進(jìn)行。設(shè):對總目標(biāo)Z

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論