版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025/8/151系統(tǒng)模型與模型化
2025/8/152目錄
第一節(jié)概述
第二節(jié)系統(tǒng)結(jié)構(gòu)模型化技術(shù)
第三節(jié)主成分分析及聚類分析
第四節(jié)狀態(tài)空間模型
第五節(jié)系統(tǒng)工程模型技術(shù)的新進(jìn)2025/8/153第一節(jié)概述一切客觀存在的事物及其運(yùn)動(dòng)形態(tài)稱為“實(shí)體”(即原型)。為便于實(shí)驗(yàn)、分析和預(yù)測(cè),總是先把所需研究的系統(tǒng)結(jié)構(gòu)型態(tài)或運(yùn)動(dòng)形態(tài)變成易于考察的形式,即轉(zhuǎn)化為“模型”。一、系統(tǒng)模型定義1.定義:系統(tǒng)模型是對(duì)現(xiàn)實(shí)系統(tǒng)(實(shí)體)的特征及其變化規(guī)律的一種模仿、抽象或描述。2025/8/154系統(tǒng)的屬性是多方面的,系統(tǒng)模型只是系統(tǒng)某一方面本質(zhì)屬性的描述,所以同一系統(tǒng)或試題,模型不是唯一的;模型建立是以模型與原型之間的相似性為基礎(chǔ)的,這里的相似可以是外表的相似,內(nèi)部結(jié)構(gòu)的相似或僅為功能的相似。模型可以是定量的,也可以是定性的,或是兩者的結(jié)合模型。
2.系統(tǒng)模型的特征它是現(xiàn)實(shí)系統(tǒng)的抽象或模仿;它是由反映系統(tǒng)本質(zhì)或特征的主要因素構(gòu)成;它集中體現(xiàn)這些主要因素之間的關(guān)系。說(shuō)明:2025/8/1553.使用系統(tǒng)模型的必要性系統(tǒng)開(kāi)發(fā)的需要。在開(kāi)發(fā)一個(gè)新系統(tǒng)時(shí),系統(tǒng)尚未建立,無(wú)法直接實(shí)驗(yàn);經(jīng)濟(jì)性考慮。大型復(fù)雜系統(tǒng)直接實(shí)驗(yàn)價(jià)格昂貴;安全性考慮。有些系統(tǒng)直接實(shí)驗(yàn)是很危險(xiǎn)的,有時(shí)根本不允許;時(shí)間上考慮。社會(huì)、經(jīng)濟(jì)、生態(tài)系統(tǒng),慣性大,反應(yīng)周期長(zhǎng);系統(tǒng)模型易操作,分析結(jié)果易于理解。2025/8/156二、模型化的本質(zhì)、作用及地位(見(jiàn)下頁(yè)圖)
1.本質(zhì):利用模型與原型之間某方面的相思關(guān)系,在研究過(guò)程中用模型來(lái)代替原型,通過(guò)對(duì)于模型的研究得到關(guān)于原型的一些信息。
2.作用:①模型本身是人們對(duì)客體系統(tǒng)一定程度研究結(jié)果的表達(dá)。這種表達(dá)是簡(jiǎn)潔的、形式化的。②模型提供了脫離具體內(nèi)容的邏輯演繹和計(jì)算的基礎(chǔ),這會(huì)導(dǎo)致對(duì)科學(xué)規(guī)律、理論、原理的發(fā)現(xiàn)。③利用模型可以進(jìn)行“思想”試驗(yàn)。
3.地位:模型的本質(zhì)決定了它的作用的局限性。它不能代替以客觀系統(tǒng)內(nèi)容的研究,只有在和對(duì)客體系統(tǒng)相配合時(shí),模型的作用才能充分發(fā)揮。2025/8/157實(shí)際系統(tǒng)結(jié)論模型現(xiàn)實(shí)意義模型化實(shí)驗(yàn)、分析解釋比較系統(tǒng)模型(化)的作用與地位2025/8/158(一)按與實(shí)體的關(guān)系系統(tǒng)模型可分為:
1形象模型(實(shí)體與比例模型)這種模型保留著實(shí)體的外形特征,僅在尺度上成比例的改變。
2模擬模型根據(jù)相似系統(tǒng)原理,利用一種系統(tǒng)代替或近似描述另一種系統(tǒng),前者為后者的模擬模型。
3數(shù)學(xué)模型用各種數(shù)學(xué)符號(hào)、數(shù)值描述工程、技術(shù)、管理、經(jīng)濟(jì)等有關(guān)因素及它們之間數(shù)量關(guān)系的模型。包括網(wǎng)絡(luò)模型、圖表模型、邏輯模型和解析模型。三、系統(tǒng)模型分類2025/8/1592025/8/1510現(xiàn)實(shí)系統(tǒng)形象模型模擬模型文字模型網(wǎng)絡(luò)模型圖表模型邏輯模型解析模型物理模型數(shù)學(xué)模型研究的速度變化方便性抽象性現(xiàn)實(shí)性建模費(fèi)用建模時(shí)間增加減少系統(tǒng)模型的分類及特征比較2025/8/1511產(chǎn)品商品編號(hào)商品名價(jià)格內(nèi)容類別被瀏覽數(shù)用戶訂購(gòu)mn用戶編號(hào)用戶名密碼性別住址E-mail郵編密碼提示問(wèn)題問(wèn)題答案真名訂單號(hào)訂購(gòu)數(shù)量訂購(gòu)時(shí)間訂購(gòu)價(jià)格購(gòu)物車號(hào)帳戶余額被瀏覽數(shù)概念數(shù)據(jù)模型(1):前臺(tái)E-R模型(實(shí)體-聯(lián)系模型)例如:基于.NET的網(wǎng)上商店Web程序設(shè)計(jì)和實(shí)例開(kāi)發(fā)2025/8/1512管理員管理產(chǎn)品信息用戶信息管理員編號(hào)登錄名密碼角色mnn管理內(nèi)容管理發(fā)生時(shí)間概念數(shù)據(jù)模型(2):后臺(tái)E-R模型(實(shí)體-聯(lián)系模型)2025/8/1513四、構(gòu)造模型的一般原則
1.建立方框圖
2.考慮信息相關(guān)性
3.考慮準(zhǔn)確性
4.考慮結(jié)集性五、建模的基本步驟
①明確建模的目的和要求以便使模型滿足實(shí)際要求,不致產(chǎn)生太大偏差;
②對(duì)系統(tǒng)進(jìn)行一般語(yǔ)言描述因?yàn)橄到y(tǒng)的語(yǔ)言描述是進(jìn)一步確定模型結(jié)構(gòu)的基礎(chǔ);2025/8/1514③弄清系統(tǒng)中的主要因素(變量)及其相互關(guān)系(結(jié)構(gòu)關(guān)系和函數(shù)關(guān)系)以便使模型準(zhǔn)確表示現(xiàn)實(shí)系統(tǒng);④確定模型的結(jié)構(gòu)這一步?jīng)Q定了模型定量方面的內(nèi)容;⑤估計(jì)模型的參數(shù)用數(shù)量來(lái)表示系統(tǒng)中的因果關(guān)系;⑥實(shí)驗(yàn)研究對(duì)模型進(jìn)行實(shí)驗(yàn)研究,進(jìn)行真實(shí)性檢驗(yàn),以檢驗(yàn)?zāi)P团c實(shí)際系統(tǒng)的符合性;⑦必要修改根據(jù)實(shí)驗(yàn)結(jié)果,對(duì)模型作必要的修改。2025/8/1515六、模型化的基本方法
1.分析方法;
2.實(shí)驗(yàn)方法-通過(guò)實(shí)驗(yàn)結(jié)果觀察和分析,利用邏輯歸納法導(dǎo)出系統(tǒng)模型。數(shù)理模型方法是典型代表。
3.綜合法;
4.老手法;
5.辯證法;七、模型的簡(jiǎn)化
①減少變量,減去次要變量;
②改變變量性質(zhì);
③合并變量(集結(jié));
④改變函數(shù)關(guān)系;
⑤改變約束條件;2025/8/1516第二節(jié)系統(tǒng)結(jié)構(gòu)模型化技術(shù)
系統(tǒng)是由許多具有一定功能的要素(如設(shè)備、事件、子系統(tǒng)等)所組成的,而各個(gè)要素之間總是存在相互支持或相互制約的邏輯關(guān)系。在這些關(guān)系中,又可分為直接關(guān)系和間接關(guān)系等。因此我們?cè)陂_(kāi)發(fā)或改造一個(gè)系統(tǒng)的時(shí)候,首先要了解系統(tǒng)中各要素間存在怎樣的關(guān)系,是直接的還是間接的關(guān)系等。只有這樣,才能更好的完成開(kāi)發(fā)或改造系統(tǒng)的任務(wù)。要了解系統(tǒng)中各要素之間的關(guān)系,也就是要了解和掌握系統(tǒng)的結(jié)構(gòu),或者說(shuō)要建立系統(tǒng)的結(jié)構(gòu)模型。
2025/8/1517一、系統(tǒng)結(jié)構(gòu)模型化基礎(chǔ)
(一)結(jié)構(gòu)分析的概念和意義
結(jié)構(gòu)→結(jié)構(gòu)模型→結(jié)構(gòu)模型化→結(jié)構(gòu)分析
結(jié)構(gòu)分析是一個(gè)實(shí)現(xiàn)系統(tǒng)結(jié)構(gòu)模型化并加以解釋的過(guò)程。結(jié)構(gòu)分析是系統(tǒng)分析的重要內(nèi)容,是系統(tǒng)優(yōu)化分析、設(shè)計(jì)與管理的基礎(chǔ)。2025/8/1518(二)系統(tǒng)結(jié)構(gòu)的基本表達(dá)方式系統(tǒng)的要素及其關(guān)系形成系統(tǒng)的特定結(jié)構(gòu)。在通常情況下,可采用集合、有向圖和矩陣等三種相互對(duì)應(yīng)的方式來(lái)表達(dá)系統(tǒng)的某種結(jié)構(gòu)。1.系統(tǒng)結(jié)構(gòu)的集合表達(dá)設(shè)系統(tǒng)由n(n≥2)個(gè)要素(S1,S2,…,Sn)所組成,其集合為S,則有:S={S1,S2,…,Sn}系統(tǒng)的諸多要素有機(jī)地聯(lián)系在一起,并且一般都是以兩個(gè)要素之間的二元關(guān)系為基礎(chǔ)的。所謂二元關(guān)系是根據(jù)系統(tǒng)的性質(zhì)和研究的目的所約定的一種需要討論的、存在于系統(tǒng)中的兩個(gè)要素(Si、Sj)之間的關(guān)系Rij(簡(jiǎn)記為R)。通常有影響關(guān)系、因果關(guān)系、包含關(guān)系、隸屬關(guān)系以及各種可以比較的關(guān)系(如大小、先后、輕重、優(yōu)劣等)。2025/8/1519二元關(guān)系是結(jié)構(gòu)分析中所要討論的系統(tǒng)構(gòu)成要素間的基本關(guān)系,一般有以下三種情形:Si與Sj間有某種二元關(guān)系R,即SiRSj;Si與Sj間無(wú)某種二元關(guān)系R,即SiSj;Si與Sj間的某種二元關(guān)系R不明,即SiRSj。例3—1某系統(tǒng)由七個(gè)要素(S1、S2、…S7)組成。經(jīng)過(guò)兩兩判斷認(rèn)為:S2影響S1、S3影響S4、S4影響S5、S7影響S2、S4和S6相互影響。這樣,該系統(tǒng)的基本結(jié)構(gòu)可用要素集合S和二元關(guān)系集合Rb來(lái)表達(dá),其中:S={S1,S2,S3,S4,S5,S6,S7}Rb={(S2,S1),(S3,S4),(S4,S5),(S7,S2),(S4,S6),(S6,S4)}2025/8/15202.系統(tǒng)結(jié)構(gòu)的有向圖表達(dá):應(yīng)用有向連接圖來(lái)描述各個(gè)要素之間的關(guān)系,以表示作為一個(gè)要素集合體的系統(tǒng)的模型。
S4S2S3S1S5\S4S2S3S7S6S5S1節(jié)點(diǎn):系統(tǒng)的要素。有向邊:要素之間的相互關(guān)系。可理解為“影響”、“取決于”、“先于”、“需要”、“導(dǎo)致”或其它含義。2025/8/15213.系統(tǒng)結(jié)構(gòu)的矩陣表達(dá)(1)鄰接矩陣(2)可達(dá)矩陣(3)其他矩陣縮減矩陣骨架矩陣2025/8/1522J.華費(fèi)爾特(1974):結(jié)構(gòu)模型是“在仔細(xì)定義的模式中,使用圖形和文字來(lái)描述一個(gè)復(fù)雜事件(系統(tǒng)或領(lǐng)域)的結(jié)構(gòu)的一種方法論?!盡.麥克林和P.西菲德(1976):“結(jié)構(gòu)模型意味著什么呢?‘結(jié)構(gòu)’這個(gè)詞的定義是:‘復(fù)雜整體的組成部分相互關(guān)聯(lián)的方式’,從這個(gè)意義上講,結(jié)構(gòu)是任何數(shù)學(xué)模型的固有性質(zhì)。所有這樣的模型都是由相互間具有特定的相互作用的部分組成的。所以,結(jié)構(gòu)模型法的實(shí)質(zhì)僅僅是一種強(qiáng)調(diào)而已。也就是說(shuō),一個(gè)結(jié)構(gòu)模型著重于一個(gè)模型組成部分的選擇和清楚地表達(dá)出個(gè)組成部分間的相互作用?!盌.希爾勞克(1977):結(jié)構(gòu)模型所強(qiáng)調(diào)的是“確定變量之間是否具有聯(lián)系以及聯(lián)系的相對(duì)重要性,而不是建立嚴(yán)格的數(shù)學(xué)關(guān)系以及精確地定義其系數(shù)。這樣,在確定系統(tǒng)變量的連接關(guān)系時(shí),可使用預(yù)先選好的簡(jiǎn)單的函數(shù)形式。所以,結(jié)構(gòu)模型法關(guān)心的是趨勢(shì)及平衡狀態(tài)下的辨識(shí),而不是量的精確性?!?025/8/1523
結(jié)構(gòu)模型的基本性質(zhì):
1結(jié)構(gòu)模型是一種幾何圖形。
2結(jié)構(gòu)是一種以定性分析為主的模型。
3結(jié)構(gòu)模型除了可用有向連接圖描述外,還可以用矩陣形式描述。
4結(jié)構(gòu)模型作為對(duì)系統(tǒng)進(jìn)行描述的一種形式,正好處在自然科學(xué)領(lǐng)域所用的數(shù)學(xué)模型形式和社會(huì)科學(xué)領(lǐng)域所用的以文章表現(xiàn)的邏輯分析形式之間。2025/8/1524結(jié)構(gòu)模型適用范圍結(jié)構(gòu)模型作為對(duì)系統(tǒng)描述的一種形式,正好處在自然科學(xué)領(lǐng)域所用的數(shù)學(xué)模型形式和社會(huì)科學(xué)領(lǐng)域所用的以文章表現(xiàn)的邏輯分析形式之間。因此,它適合用來(lái)處理處于社會(huì)科學(xué)為對(duì)象的復(fù)雜系統(tǒng)和比較簡(jiǎn)單的以自然科學(xué)為對(duì)象的系統(tǒng)中存在的問(wèn)題。是一種以定性分析為主的模型,可以分析系統(tǒng)中的要素選擇的是否合理,還可以分析系統(tǒng)要素及其相互關(guān)系變化時(shí)對(duì)系統(tǒng)的總體影響等問(wèn)題。2025/8/1525(三)常用結(jié)構(gòu)模型化技術(shù)結(jié)構(gòu)模型化技術(shù)問(wèn)題發(fā)掘技術(shù)結(jié)構(gòu)決定技術(shù)腳本法專家調(diào)查法發(fā)想法集團(tuán)啟發(fā)法靜態(tài)結(jié)構(gòu)化技術(shù)動(dòng)態(tài)結(jié)構(gòu)化技術(shù)關(guān)聯(lián)樹(shù)法解釋結(jié)構(gòu)模型決策試驗(yàn)與評(píng)價(jià)試驗(yàn)室系統(tǒng)開(kāi)發(fā)計(jì)劃程序工作設(shè)計(jì)交叉影響分析凱能仿真模型快速仿真模型系統(tǒng)動(dòng)力學(xué)2025/8/1526解釋結(jié)構(gòu)模型(ISM)工作程序1成立組織實(shí)施ISM的小組;2設(shè)定問(wèn)題;3選擇構(gòu)成系統(tǒng)的要素,并與相關(guān)人員進(jìn)行討論,形成意識(shí)模型,4進(jìn)一步明確定義各要素,判斷各要素之間的二元關(guān)系,并建立鄰接矩陣和可達(dá)矩陣;5對(duì)可達(dá)矩陣進(jìn)行分解,建立結(jié)構(gòu)模型;6建立解釋結(jié)構(gòu)模型.2025/8/1527ISM工作原理圖意識(shí)模型要素及其關(guān)系集合可達(dá)矩陣骨干矩陣遞階結(jié)構(gòu)模型(多級(jí)遞階有向圖)要素及其關(guān)系集合SiRSj分析報(bào)告修正計(jì)算機(jī)人解釋作圖分檢推斷2025/8/1528二、建立遞階結(jié)構(gòu)模型的規(guī)范方法(一)
圖的基本概念
1有向連接圖:就是指由若干節(jié)點(diǎn)和有向邊聯(lián)接而成的圖象。
2回路:在有向連接圖的兩個(gè)節(jié)點(diǎn)之間的邊多于一條時(shí),則該兩個(gè)節(jié)點(diǎn)的邊就構(gòu)成了回路。
3環(huán):一個(gè)節(jié)點(diǎn)的有向邊若直接與該節(jié)點(diǎn)相連,則構(gòu)成了一個(gè)環(huán)。
4樹(shù):只有一個(gè)源點(diǎn)或只有一個(gè)匯點(diǎn)的圖叫做樹(shù)?;蛘邿o(wú)環(huán)或回路的連通圖。
2025/8/1529
5關(guān)聯(lián)樹(shù):指在節(jié)點(diǎn)上帶有加權(quán)值,而在邊上有關(guān)聯(lián)值的樹(shù)稱為關(guān)聯(lián)樹(shù)。W=0.3W=0.7r=0.4r=0.6r=0.5r=0.5W=0.3×0.4W=0.3×0.6W=0.7×0.5W=0.7×0.52025/8/1530(二)圖的矩陣表示法
1SiRSj,R表示Si與Sj有關(guān)系。
aij=
0SiRSj,R表示Si與Sj沒(méi)有關(guān)系。S2S4S1S6S5S300000001000110000001011100000100000S1S2S3S4S5S6S1S2S3S4S5S6A=[aij]6×6=1鄰接矩陣。圖的基本矩陣表達(dá)方式,用來(lái)描述圖中各節(jié)點(diǎn)兩兩之間的關(guān)系。2025/8/1531
鄰接矩陣有如下特征:
a矩陣A的元素全為0的行所對(duì)應(yīng)的節(jié)點(diǎn)稱作匯點(diǎn),即只有有向邊進(jìn)入而沒(méi)有離開(kāi)該節(jié)點(diǎn)。
b矩陣A的元素全為0的列所對(duì)應(yīng)的節(jié)點(diǎn)稱作源點(diǎn),即只有有向邊離開(kāi)而沒(méi)有進(jìn)入該節(jié)點(diǎn).c對(duì)應(yīng)每一節(jié)點(diǎn)的行中,其元素值為1的數(shù)量,就是離開(kāi)該節(jié)點(diǎn)的有向邊數(shù)。
d對(duì)應(yīng)每一節(jié)點(diǎn)的列中,其元素值為1的數(shù)量,就是進(jìn)入該節(jié)點(diǎn)的有向邊數(shù)。
2025/8/15322可達(dá)矩陣。指用矩陣形式來(lái)描述有向連結(jié)圖各節(jié)點(diǎn)之間,經(jīng)過(guò)一定長(zhǎng)度的通路后可以達(dá)到的程度。推移定律:當(dāng)Si經(jīng)過(guò)長(zhǎng)度為1的通路直接到達(dá)Sj,而Sj經(jīng)過(guò)長(zhǎng)度為1的通路直接到達(dá)Sk,那么,Si經(jīng)過(guò)長(zhǎng)度為2的通路必可以到達(dá)Sk??蛇_(dá)矩陣可以用鄰接矩陣A加上單位矩陣I,并經(jīng)過(guò)一定運(yùn)算求得。00000101011110000001011100000100000A1=[A+I]=+00000010000001000000100000010000001=000000110001110000011111000101000012025/8/1533矩陣A1描述了各節(jié)點(diǎn)之間經(jīng)過(guò)長(zhǎng)度不大于1的通路后的可達(dá)程度。
A2=[A+I]2=A12
A3=[A+I]3Ar-1=[A+I]r-1=R(可達(dá)矩陣)
R成為可達(dá)矩陣,它表明各節(jié)點(diǎn)之間經(jīng)過(guò)長(zhǎng)度不大于(n-1)的通路可以到達(dá)的程度。注意:
1可達(dá)矩陣不是A2或A3,而是An-1,n是節(jié)點(diǎn)個(gè)數(shù)。
2
運(yùn)用布爾代數(shù)運(yùn)算規(guī)則:0+0=0,0+1=1,1+0=1,1+1=1,0×0=0,0×1=0,1×0=0,1×1=1。
3如果Ar-1=Ar,則R=Ar-1,不用計(jì)算An-1。
2025/8/15343縮減矩陣100000111000111000111111100010100001S1S2S3S4S5S6S1S2S3S4S5S6A2=100000111000111000111111100010100001S1S2S3S4S5S6S1S2S3S4S5S6A3=1000011000111111001010001S1S3S4S5S6S1S3S4S5S6R’
=2025/8/1535三、解釋結(jié)構(gòu)模型法建模步驟46523170000001000000001000000110000000000010000100000S1S2S3S4S5S6S7
S1S2S3S4S5S6S7A=(一)有關(guān)專家與系統(tǒng)分析人員一起討論,選擇確定有關(guān)元素,建立鄰接矩陣。2025/8/1536
方法一:用鄰接矩陣加上單位矩陣,經(jīng)過(guò)(n-1)次運(yùn)算后得到可達(dá)矩陣。
(二)建立可達(dá)矩陣10000001100000011110001110000010000011101100001S1S2S3S4S5S6S7
S1S2S3S4S5S6S7R=0000001000000001000000110000000000010000100000S1S2S3S4S5S6S7
S1S2S3S4S5S6S7A=2025/8/1537(三)劃分10000001100000011110001110000010000011101100001S1S2S3S4S5S6S7
S1S2S3S4S5S6S7R=要素R(ni)1121,233,4,5,644,5,65564,5,671,2,7可達(dá)集合(Reach):系統(tǒng)要素Si的可達(dá)集是可達(dá)矩陣或有向圖中由Si可到達(dá)的諸要素所構(gòu)成的集合。
R(ni)={nj∈N︱mij=1}R(ni)是由可達(dá)矩陣中第ni行所有矩陣元素為1的列所對(duì)應(yīng)的要素集合而成;N為所有節(jié)點(diǎn)的集合。
2025/8/1538先行集合(Ahead):系統(tǒng)要素Si的先行集合是可達(dá)矩陣或有向圖中可以到達(dá)Si的諸要素所構(gòu)成的集合。
A(ni)={nj∈N︱mji=1}R(ni)是由可達(dá)矩陣中第ni列所有矩陣元素為1的行所對(duì)應(yīng)的要素集合而成;N為所有節(jié)點(diǎn)的集合。
要素A(ni)11,2,722,73343,4,63,4,5,6563,4,67710000001100000011110001110000010000011101100001S1S2S3S4S5S6S7
S1S2S3S4S5S6S7R=2025/8/1539共同集合:系統(tǒng)要素Si的共同集合是Si在可達(dá)集和先行集合的共同部分,即交集。
T={ni∈N︱R(ni)∩A(ni)=A(ni)
}要素A(ni)R(ni)R(ni)∩A(ni)111,2,7121,22,7233,4,5,63344,5,63,4,64,6553,4,5,6564,5,63,4,64,671,2,777要素A(ni)11,2,722,73343,4,63,4,5,6563,4,677要素R(ni)1121,233,4,5,644,5,65564,5,671,2,72025/8/1540起始集合和終止集合起始集合:在系統(tǒng)要素中只影響其他要素(到達(dá))而不受其他要素影響(不被其他要素到達(dá))的要素所構(gòu)成的集合。其定義為:SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合B(Si)—起始集合111,2,7121,22,7233,4,5,633344,5,63,4,64,6553,4,5,6564,5,63,4,64,671,2,77772025/8/1541終止集合終止集合:最高級(jí)要素ni的先行集A(ni)也只能由ni本身和結(jié)構(gòu)中的下一級(jí)可能達(dá)到的要素以及ni的強(qiáng)連結(jié)要素構(gòu)成。
如果要滿足以上兩個(gè)條件,則它必須滿足下述條件:SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合E(Si)—終止集合111,2,71121,22,7233,4,5,63344,5,63,4,64,6553,4,5,65564,5,63,4,64,671,2,7772025/8/1542a計(jì)算A(ni)與R(ni),并計(jì)算R(ni)∩A(ni);
b求出共同集合;
c確定起始集合;
d對(duì)起始集合內(nèi)的要素進(jìn)行區(qū)域劃分;R(ni)∩R(nj)≠?,則屬于同一區(qū)域;
e劃分連通域。
1區(qū)域劃分(∏1)SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合B(Si)—起始集合111,2,7121,22,7233,4,5,633344,5,63,4,64,6553,4,5,6564,5,63,4,64,671,2,77772025/8/1543SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合B(Si)—起始集合111,2,7121,22,7233,4,5,633344,5,63,4,64,6553,4,5,6564,5,63,4,64,671,2,7777因?yàn)椋篟(3)∩R(7)=?所以:要素3、4、5、6為一個(gè)連通域;1、2、7為一個(gè)連通域。2025/8/15442級(jí)間劃分(∏2)
由可達(dá)集合和先行集合的定義,可以得到這樣一個(gè)事實(shí):
1)在一個(gè)多級(jí)結(jié)構(gòu)中,它的最上級(jí)的要素ni的可行集
R(ni),只能由ni本身和ni的強(qiáng)連結(jié)要素組成。2025/8/1545
2)最高級(jí)要素ni的先行集A(ni)也只能由ni本身和結(jié)構(gòu)中的下一級(jí)可能達(dá)到的要素以及ni的強(qiáng)連結(jié)要素構(gòu)成。
如果要滿足以上兩個(gè)條件,則它必須滿足下述條件:R(ni)∩A(ni)=R(ni)
若用L1,L2,·········,LK表示從上到下的級(jí)次,則有k個(gè)級(jí)次的系統(tǒng):Lk={ni∈N-L0-L1,L2,·····,LK-1|RK-1(ni)=RK-1(ni)∩AK-1(ni)}
L0=?
Rj-1(ni)={nj∈N-L0-L1,L2,·····,Lj-1|mij=1)}
Aj-1(ni)={nj∈N-L0-L1,L2,·····,Lj-1|mji=1)}2025/8/1546要素集合SiR(Si)A(Si)T(Si)C(Si)=R(Si)∏(Pi)P1-L033,4,5,633L1={s5}44,5,63,4,64,6553,4,5,65√64,5,63,4,64,6P1-L0-L133,4,633L2={s4,s6}44,63,4,64,6√54,63,4,64,6√P1-L0-L1-L23333√L3={s3}要素A(ni)R(ni)R(ni)∩A(ni)111,2,7121,22,7233,4,5,63344,5,63,4,64,6553,4,5,6564,5,63,4,64,671,2,7772025/8/1547要素A(ni)R(ni)R(ni)∩A(ni)111,2,7121,22,7233,4,5,63344,5,63,4,64,6553,4,5,6564,5,63,4,64,671,2,777要素集合SiR(Si)A(Si)T(Si)C(Si)=R(Si)∏(Pi)P1-L0111,2,71√L1={s1}21,22,7271,2,777P1-L0-L1222,72√L2={s2}72,777P1-L0-L1-L27777√L3={s7}2025/8/1548SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合T(Si)=R(Si)111,2,711√L1={S1,S5}21,22,7233,4,5,63344,5,63,4,64,6553,4,5,655√64,5,63,4,64,671,2,777不劃分連通域直接分級(jí)2025/8/1549SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合T(Si)=R(Si)33333√L3={S2,S4,S6}77777√SiR(Si)—可達(dá)集合A(Si)—先行集合T(Si)—共同集合T(Si)=R(Si)222,722√L2={S2,S4,S6}33,4,63344,63,4,64,64√64,63,4,64,66√72,7772025/8/15503強(qiáng)連通塊劃分(∏3)
10000001100000011110001110000010000011101100001S1S2S3S4S5S6S7
S1S2S3S4S5S6S7R=0000001110000111000011110000000100000011000001115
4
6
3
1
275463127L1L2L3L3L2L1000001100001110000001000001100001115
4
3
1
27543127L1L2L3L3L2L12025/8/1551(四)提取骨架矩陣骨架矩陣:對(duì)于給定系統(tǒng),鄰接矩陣的可達(dá)矩陣是唯一的,但實(shí)現(xiàn)某一可達(dá)矩陣的鄰接矩陣可具有多個(gè)。我們把實(shí)現(xiàn)某一可達(dá)矩陣M、具有最小二元關(guān)系個(gè)數(shù)(“1”元素最少)的鄰接矩陣叫做M的最小實(shí)現(xiàn)二元關(guān)系矩陣,或者稱之為骨架矩陣。000001100001110000001000001100001115
4
3
1
27543127L1L2L3L3L2L1骨架矩陣?2025/8/1552第一步檢查各層次中的強(qiáng)連接要素,建立可達(dá)矩陣M(L)的縮減矩陣M’(L);第二步去掉M’中已具有鄰接二元關(guān)系的要素間的越級(jí)二元關(guān)系,得到進(jìn)一步簡(jiǎn)化后的新矩陣M’’(L).第三步進(jìn)一步去掉M’’(L)中自身到達(dá)的二元關(guān)系,即減去單位矩陣。得到經(jīng)簡(jiǎn)化后具有最少二元關(guān)系個(gè)數(shù)的骨架矩陣。000001100001110000001000001100001115
4
3
1
27543127L1L2L3L3L2L1000001100000110000001000001100000115
4
3
1
27543127L1L2L3L3L2L10000001000000100000000000001000000105
4
3
1
27543127L1L2L3L3L2L12025/8/1553方法二:求出最少邊可達(dá)矩陣(骨架矩陣)1先從系統(tǒng)元素的第一級(jí)和第二級(jí)之間的關(guān)系,從M’’中可以得到m21=1,即說(shuō)明節(jié)點(diǎn)2和1之間有n2到n1的關(guān)系;劃去1節(jié)點(diǎn)的行和列。
2在剩余的矩陣?yán)铮匀粡淖罡咭患?jí)開(kāi)始找,m45=1,即說(shuō)明節(jié)點(diǎn)4和5之間有n4到n5的關(guān)系;劃去5節(jié)點(diǎn)的行和列。
3以此類推,得到m21=1,m45=1,m34=1,m72=1。將其作為結(jié)構(gòu)矩陣元素,可得骨干矩陣。000000000001000000100000001001010001
5
2
4
37152437M’’=M’-I=000000000001000000100000001000010001
5
2
4
37152437S=2025/8/1554
(六)做出遞階有向8/1555
(七)得出解釋結(jié)構(gòu)模型在結(jié)構(gòu)模型的要素上,填入相應(yīng)的要素名稱,即為解釋結(jié)構(gòu)模型。2025/8/1556
(一)有關(guān)專家與系統(tǒng)分析人員一起討論,選擇確定有關(guān)元素,建立鄰接矩陣。(二)建立可達(dá)矩陣(三)劃分
1區(qū)域劃分(∏1):
計(jì)算A(ni)與R(ni),并計(jì)算R(ni)∩A(ni);
求出共同集合;對(duì)共同集合內(nèi)的要素進(jìn)行區(qū)域劃分;R(ni)∩R(nj)≠?,則屬于同一區(qū)域;d進(jìn)行連通域劃分。
2級(jí)間劃分(∏2)
3強(qiáng)連通塊劃分(∏3)
(四)求縮減可達(dá)矩陣M’。(五)求出最少邊可達(dá)矩陣(骨架矩陣)。(六)做出遞階有向圖。(七)得出解釋結(jié)構(gòu)模型。4652317
解釋結(jié)構(gòu)模型法建模舉例2025/8/1557四、解釋結(jié)構(gòu)模型實(shí)用方法方法二:用可達(dá)矩陣的推移律特性,直接得出可達(dá)矩陣。
(1)A(Si)—沒(méi)有回路的上位集,指Si與A(Si)中的要素有關(guān),而A(Si)中的要素與Si無(wú)關(guān),即存在著從Si到A(Si)的單向關(guān)系。
(2)B(Si)—有回路的上位集,指Si與B(Si)中的要素具有回路的要素集合。
(3)C(Si)—無(wú)關(guān)集,指既不屬于A(Si),也不屬于B(Si)的要素集合;
(4)D(Si)—下位集,指D(Si)的要素與Si
有關(guān),反之則無(wú)關(guān)。2025/8/1558B(Si)D(Si)A(Si)SiC(Si)2025/8/1559A(Si)B(Si)SiC(Si)D(Si)A(Si)(0)00000(0)(0)B(Si)(1)(1)11111(0)(0)Si11111111110000000000C(Si)(0)0000(0)D(Si)(1)(1)1112025/8/1560對(duì)可達(dá)矩陣的縮減矩陣的層次化處理465231710000001100000011110001110000010000011101100001S1S2S3S4S5S6S7
S1S2S3S4S5S6S7R=1000001100000111000110000100110001S1S2S3S4S5S7
S1S2S3S4S5S7R=12321310000001000010100010100101010010101S1S5S2S4S7S3
S1S5S2S4S7S3R=2025/8/15611000001100000111000110000100110001S1S2S3S4S5S7
S1S2S3S4S5S7R’=123213100000010000101000
1
01001010100101
01S1S5S2S4S7S3
S1S5S2S4S7S3R’’=
將縮減矩陣按每行“1”元素的多少,由少到多順次排列,調(diào)整縮減矩陣的行和列,得到R’’,最后在R’’中,從左上角到右下角,依次分解出最大階數(shù)的單位矩陣,并加上方框,每個(gè)方框表示一個(gè)層次。把R’’中單位矩陣交匯處的“1”元素,畫出表征不同層次要素間直接聯(lián)系的有向弧,形成多級(jí)遞階有向圖。2025/8/1562五、
解釋結(jié)構(gòu)模型的應(yīng)用
例一
改革開(kāi)發(fā)以來(lái),由于社會(huì)保障與保健制度的完善,人民健康有很大的提高,使得人們的平均壽命有了提高,這樣,死亡率就相應(yīng)降低了。同時(shí)由于國(guó)民收入的不斷增加,生活水平的不斷提高等,導(dǎo)致生育率有所提高。因此種種因素導(dǎo)致了我國(guó)人口的迅速增加。2025/8/1563
影響人口增長(zhǎng)的因素很多,經(jīng)過(guò)小組成員討論認(rèn)為,主要因素有:
(1)社會(huì)保障
(8)社會(huì)思想習(xí)慣
(2)老年服務(wù)
(9)營(yíng)養(yǎng)水平
(3)生育欲望
(10)污染
(4)平均壽命
(11)國(guó)民收入
(5)醫(yī)療保健水平
(12)出生率
(6)生育能力
(13)死亡率
(7)計(jì)劃生育政策
(14)總?cè)丝?/p>
2025/8/1564S12S13S3S6S7S4S2S1S8S5S10S9S11S142025/8/1565
解釋結(jié)構(gòu)模型總?cè)丝诔錾仕劳雎势骄鶋勖?jì)生政策生育能力生育欲望社會(huì)保障老年服務(wù)社會(huì)思想習(xí)慣營(yíng)養(yǎng)污染保健國(guó)民收入2025/8/1566方法技術(shù)專家;(掌握建模方法)協(xié)調(diào)人;(具有激勵(lì)機(jī)制知識(shí),能引導(dǎo)參與者增進(jìn)理解、調(diào)查和交流,屬于——合劑或催化劑)參與者。(掌握有關(guān)的信息知識(shí),是模型法實(shí)施的受益者)二實(shí)施結(jié)構(gòu)模型法的人員組成2025/8/1567三種角色相互關(guān)系示意圖方法技術(shù)專家協(xié)調(diào)人參與者角色1角色2角色32025/8/1568
結(jié)構(gòu)模型的缺陷1從理論角度來(lái)說(shuō),應(yīng)用ISM時(shí),最大的問(wèn)題是推移率的假定。假定推移定律,意味著各級(jí)要素只是一種遞階關(guān)系,即階與階之間不存在反饋回路。但在實(shí)際問(wèn)題中,各級(jí)要素之間往往存在反饋關(guān)系。
2通過(guò)鄰接矩陣建立可達(dá)矩陣或直接建立可達(dá)矩陣來(lái)確定系統(tǒng)各要素間的邏輯關(guān)系,在一定程度上還要以來(lái)人們的經(jīng)驗(yàn)。關(guān)系是一個(gè)比較模糊的概念,有無(wú)關(guān)系的判斷是比較主觀的。
3在實(shí)施結(jié)構(gòu)模型是,需要三種角色的的人參加,其中由以協(xié)調(diào)人的角色最為重要,較難找到勝任這三種角色的人。
2025/8/1569總?cè)丝诔錾士側(cè)丝诔錾剩蚬P(guān)系反饋關(guān)系2025/8/1570匯報(bào)什么?假定你是一個(gè)公司的財(cái)務(wù)經(jīng)理,掌握了公司的所有數(shù)據(jù),比如固定資產(chǎn)、流動(dòng)資金、每一筆借貸的數(shù)額和期限、各種稅費(fèi)、工資支出、原料消耗、產(chǎn)值、利潤(rùn)、折舊、職工人數(shù)、職工的分工和教育程度等等。如果讓你向上面介紹公司狀況,你能夠把這些指標(biāo)和數(shù)字都原封不動(dòng)地?cái)[出去嗎?
當(dāng)然不能。你必須要把各個(gè)方面作出高度概括,用一兩個(gè)指標(biāo)簡(jiǎn)單明了地把情況說(shuō)清楚。
第三節(jié)主成分分析及聚類分析2025/8/1571一、主成分分析每個(gè)人都會(huì)遇到有很多變量的數(shù)據(jù)。比如全國(guó)或各個(gè)地區(qū)的帶有許多經(jīng)濟(jì)和社會(huì)變量的數(shù)據(jù);各個(gè)學(xué)校的研究、教學(xué)等各種變量的數(shù)據(jù)等等。這些數(shù)據(jù)的共同特點(diǎn)是變量很多,在如此多的變量之中,有很多是相關(guān)的。人們希望能夠找出它們的少數(shù)“代表”來(lái)對(duì)它們進(jìn)行描述。把變量維數(shù)降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。實(shí)際上主成分分析可以說(shuō)是因子分析的一個(gè)特例。在引進(jìn)主成分分析之前,先看下面的例子。2025/8/1572成績(jī)數(shù)據(jù)(student.sav)100個(gè)學(xué)生的數(shù)學(xué)、物理、化學(xué)、語(yǔ)文、歷史、英語(yǔ)的成績(jī)?nèi)缦卤恚ú糠郑?025/8/1573從本例可能提出的問(wèn)題目前的問(wèn)題是,能不能把這個(gè)數(shù)據(jù)的6個(gè)變量用一兩個(gè)綜合變量來(lái)表示呢?這一兩個(gè)綜合變量包含有多少原來(lái)的信息呢?能不能利用找到的綜合變量來(lái)對(duì)學(xué)生排序呢?這一類數(shù)據(jù)所涉及的問(wèn)題可以推廣到對(duì)企業(yè),對(duì)學(xué)校進(jìn)行分析、排序、判別和分類等問(wèn)題。2025/8/1574主成分分析例中的的數(shù)據(jù)點(diǎn)是六維的;也就是說(shuō),每個(gè)觀測(cè)值是6維空間中的一個(gè)點(diǎn)。我們希望把6維空間用低維空間表示。先假定只有二維,即只有兩個(gè)變量,它們由橫坐標(biāo)和縱坐標(biāo)所代表;因此每個(gè)觀測(cè)值都有相應(yīng)于這兩個(gè)坐標(biāo)軸的兩個(gè)坐標(biāo)值;如果這些數(shù)據(jù)形成一個(gè)橢圓形狀的點(diǎn)陣(這在變量的二維正態(tài)的假定下是可能的)那么這個(gè)橢圓有一個(gè)長(zhǎng)軸和一個(gè)短軸。在短軸方向上,數(shù)據(jù)變化很少;在極端的情況,短軸如果退化成一點(diǎn),那只有在長(zhǎng)軸的方向才能夠解釋這些點(diǎn)的變化了;這樣,由二維到一維的降維就自然完成了。2025/8/1575主成分分析當(dāng)坐標(biāo)軸和橢圓的長(zhǎng)短軸平行,那么代表長(zhǎng)軸的變量就描述了數(shù)據(jù)的主要變化,而代表短軸的變量就描述了數(shù)據(jù)的次要變化。但是,坐標(biāo)軸通常并不和橢圓的長(zhǎng)短軸平行。因此,需要尋找橢圓的長(zhǎng)短軸,并進(jìn)行變換,使得新變量和橢圓的長(zhǎng)短軸平行。如果長(zhǎng)軸變量代表了數(shù)據(jù)包含的大部分信息,就用該變量代替原先的兩個(gè)變量(舍去次要的一維),降維就完成了。橢圓(球)的長(zhǎng)短軸相差得越大,降維也越有道理。2025/8/15762025/8/1577主成分分析對(duì)于多維變量的情況和二維類似,也有高維的橢球,只不過(guò)無(wú)法直觀地看見(jiàn)罷了。首先把高維橢球的主軸找出來(lái),再用代表大多數(shù)數(shù)據(jù)信息的最長(zhǎng)的幾個(gè)軸作為新變量;這樣,主成分分析就基本完成了。注意,和二維情況類似,高維橢球的主軸也是互相垂直的。這些互相正交的新變量是原先變量的線性組合,叫做主成分(principalcomponent)。
2025/8/1578主成分分析正如二維橢圓有兩個(gè)主軸,三維橢球有三個(gè)主軸一樣,有幾個(gè)變量,就有幾個(gè)主成分。選擇越少的主成分,降維就越好。什么是標(biāo)準(zhǔn)呢?那就是這些被選的主成分所代表的主軸的長(zhǎng)度之和占了主軸長(zhǎng)度總和的大部分。有些文獻(xiàn)建議,所選的主軸總長(zhǎng)度占所有主軸長(zhǎng)度之和的大約85%即可,其實(shí),這只是一個(gè)大體的說(shuō)法;具體選幾個(gè),要看實(shí)際情況而定。2025/8/1579對(duì)于我們的數(shù)據(jù),SPSS輸出為這里的InitialEigenvalues就是這里的六個(gè)主軸長(zhǎng)度,又稱特征值(數(shù)據(jù)相關(guān)陣的特征值)。頭兩個(gè)成分特征值累積占了總方差的81.142%。后面的特征值的貢獻(xiàn)越來(lái)越少。2025/8/1580特征值的貢獻(xiàn)還可以從SPSS的所謂碎石圖看出2025/8/1581怎么解釋這兩個(gè)主成分。前面說(shuō)過(guò)主成分是原始六個(gè)變量的線性組合。是怎么樣的組合呢?SPSS可以輸出下面的表。
這里每一列代表一個(gè)主成分作為原來(lái)變量線性組合的系數(shù)(比例)。比如第一主成分作為數(shù)學(xué)、物理、化學(xué)、語(yǔ)文、歷史、英語(yǔ)這六個(gè)原先變量的線性組合,系數(shù)(比例)為-0.806,-0.674,-0.675,0.893,0.825,0.836。2025/8/1582如用x1,x2,x3,x4,x5,x6分別表示原先的六個(gè)變量,而用y1,y2,y3,y4,y5,y6表示新的主成分,那么,原先六個(gè)變量x1,x2,x3,x4,x5,x6與第一和第二主成分y1,y2的關(guān)系為:X1=-0.806y1+0.353y2X2=-0.674y1+0.531y2X3=-0.675y1+0.513y2X4=0.893y1+0.306y2x5=0.825y1+0.435y2x6=0.836y1+0.425y2這些系數(shù)稱為主成分載荷(loading),它表示主成分和相應(yīng)的原先變量的相關(guān)系數(shù)。比如x1表示式中y1的系數(shù)為-0.806,這就是說(shuō)第一主成分和數(shù)學(xué)變量的相關(guān)系數(shù)為-0.806。相關(guān)系數(shù)(絕對(duì)值)越大,主成分對(duì)該變量的代表性也越大??梢钥吹贸觯谝恢鞒煞謱?duì)各個(gè)變量解釋得都很充分。而最后的幾個(gè)主成分和原先的變量就不那么相關(guān)了。2025/8/1583可以把第一和第二主成分的載荷點(diǎn)出一個(gè)二維圖以直觀地顯示它們?nèi)绾谓忉屧瓉?lái)的變量的。這個(gè)圖叫做載荷圖。2025/8/1584該圖左面三個(gè)點(diǎn)是數(shù)學(xué)、物理、化學(xué)三科,右邊三個(gè)點(diǎn)是語(yǔ)文、歷史、外語(yǔ)三科。圖中的六個(gè)點(diǎn)由于比較擠,不易分清,但只要認(rèn)識(shí)到這些點(diǎn)的坐標(biāo)是前面的第一二主成分載荷,坐標(biāo)是前面表中第一二列中的數(shù)目,還是可以識(shí)別的。2025/8/1585因子分析主成分分析從原理上是尋找橢球的所有主軸。因此,原先有幾個(gè)變量,就有幾個(gè)主成分。而因子分析是事先確定要找?guī)讉€(gè)成分,這里叫因子(factor)(比如兩個(gè)),那就找兩個(gè)。這使得在數(shù)學(xué)模型上,因子分析和主成分分析有不少區(qū)別。而且因子分析的計(jì)算也復(fù)雜得多。根據(jù)因子分析模型的特點(diǎn),它還多一道工序:因子旋轉(zhuǎn)(factorrotation);這個(gè)步驟可以使結(jié)果更好。當(dāng)然,對(duì)于計(jì)算機(jī)來(lái)說(shuō),因子分析并不比主成分分析多費(fèi)多少時(shí)間。從輸出的結(jié)果來(lái)看,因子分析也有因子載荷(factorloading)的概念,代表了因子和原先變量的相關(guān)系數(shù)。但是在輸出中的因子和原來(lái)變量相關(guān)系數(shù)的公式中的系數(shù)不是因子載荷,也給出了二維圖;該圖雖然不是載荷圖,但解釋和主成分分析的載荷圖類似。2025/8/1586主成分分析與因子分析的公式上的區(qū)別主成分分析因子分析(m<p)因子得分2025/8/1587對(duì)于我們的數(shù)據(jù),SPSS因子分析輸出為這里,第一個(gè)因子主要和語(yǔ)文、歷史、英語(yǔ)三科有很強(qiáng)的正相關(guān);而第二個(gè)因子主要和數(shù)學(xué)、物理、化學(xué)三科有很強(qiáng)的正相關(guān)。因此可以給第一個(gè)因子起名為“文科因子”,而給第二個(gè)因子起名為“理科因子”。從這個(gè)例子可以看出,因子分析的結(jié)果比主成分分析解釋性更強(qiáng)。2025/8/1588這兩個(gè)因子的系數(shù)所形成的散點(diǎn)圖(雖然不是載荷,在SPSS中也稱載荷圖可以直觀看出每個(gè)因子代表了一類學(xué)科
2025/8/1589計(jì)算因子得分可以根據(jù)前面的因子得分公式(因子得分系數(shù)和原始變量的標(biāo)準(zhǔn)化值的乘積之和),算出每個(gè)學(xué)生的第一個(gè)因子和第二個(gè)因子的大小,即算出每個(gè)學(xué)生的因子得分f1和f2。人們可以根據(jù)這兩套因子得分對(duì)學(xué)生分別按照文科和理科排序。當(dāng)然得到因子得分只是SPSS軟件的一個(gè)選項(xiàng)(可將因子得分存為新變量、顯示因子得分系數(shù)矩陣)2025/8/1590因子分析和主成分分析的一些注意事項(xiàng)
可以看出,因子分析和主成分分析都依賴于原始變量,也只能反映原始變量的信息。所以原始變量的選擇很重要。另外,如果原始變量都本質(zhì)上獨(dú)立,那么降維就可能失敗,這是因?yàn)楹茈y把很多獨(dú)立變量用少數(shù)綜合的變量概括。數(shù)據(jù)越相關(guān),降維效果就越好。在得到分析的結(jié)果時(shí),并不一定會(huì)都得到如我們例子那樣清楚的結(jié)果。這與問(wèn)題的性質(zhì),選取的原始變量以及數(shù)據(jù)的質(zhì)量等都有關(guān)系在用因子得分進(jìn)行排序時(shí)要特別小心,特別是對(duì)于敏感問(wèn)題。由于原始變量不同,因子的選取不同,排序可以很不一樣。2025/8/1591SPSS實(shí)現(xiàn)(因子分析與主成分分析)拿student.sav為例,選Analyze-DataReduction-Factor進(jìn)入主對(duì)話框;把math、phys、chem、literat、history、english選入Variables,然后點(diǎn)擊Extraction,在Method選擇一個(gè)方法(如果是主成分分析,則選PrincipalComponents),下面的選項(xiàng)可以隨意,比如要畫碎石圖就選Screeplot,另外在Extract選項(xiàng)可以按照特征值的大小選主成分(或因子),也可以選定因子的數(shù)目;之后回到主對(duì)話框(用Continue)。然后點(diǎn)擊Rotation,再在該對(duì)話框中的Method選擇一個(gè)旋轉(zhuǎn)方法(如果是主成分分析就選None),在Display選Rotatedsolution(以輸出和旋轉(zhuǎn)有關(guān)的結(jié)果)和Loadingplot(以輸出載荷圖);之后回到主對(duì)話框(用Continue)。如果要計(jì)算因子得分就要點(diǎn)擊Scores,再選擇Saveasvariables(因子得分就會(huì)作為變量存在數(shù)據(jù)中的附加列上)和計(jì)算因子得分的方法(比如Regression);之后回到主對(duì)話框(用Continue)。這時(shí)點(diǎn)OK即可。2025/8/1592二、聚類分析聚類(Clustering)就是將數(shù)據(jù)分組成為多個(gè)類(Cluster)。在同一個(gè)類內(nèi)對(duì)象之間具有較高的相似度,不同類之間的對(duì)象差別較大。早在孩提時(shí)代,人就通過(guò)不斷改進(jìn)下意識(shí)中的聚類模式來(lái)學(xué)會(huì)如何區(qū)分貓和狗,動(dòng)物和植物2025/8/1593聚類分析無(wú)處不在誰(shuí)經(jīng)常光顧商店,誰(shuí)買什么東西,買多少?按忠誠(chéng)卡記錄的光臨次數(shù)、光臨時(shí)間、性別、年齡、職業(yè)、購(gòu)物種類、金額等變量分類這樣商店可以….識(shí)別顧客購(gòu)買模式(如喜歡一大早來(lái)買酸奶和鮮肉,習(xí)慣周末時(shí)一次性大采購(gòu))刻畫不同的客戶群的特征(用變量來(lái)刻畫,就象刻畫貓和狗的特征一樣)2025/8/1594什么情況下需要聚類為什么這樣分類?因?yàn)槊恳粋€(gè)類別里面的人消費(fèi)方式都不一樣,需要針對(duì)不同的人群,制定不同的關(guān)系管理方式,以提高客戶對(duì)公司商業(yè)活動(dòng)的相應(yīng)率。2025/8/1595聚類分析無(wú)處不在挖掘有價(jià)值的客戶,并制定相應(yīng)的促銷策略:如,對(duì)經(jīng)常購(gòu)買酸奶的客戶對(duì)累計(jì)消費(fèi)達(dá)到12個(gè)月的老客戶針對(duì)潛在客戶派發(fā)廣告,比在大街上亂發(fā)傳單命中率更高,成本更低!2025/8/1596聚類分析無(wú)處不在誰(shuí)是銀行信用卡的黃金客戶?利用儲(chǔ)蓄額、刷卡消費(fèi)金額、誠(chéng)信度等變量對(duì)客戶分類,找出“黃金客戶”!這樣銀行可以……制定更吸引的服務(wù),留住客戶!比如:一定額度和期限的免息透資服務(wù)!百盛的貴賓打折卡!在他或她生日的時(shí)候送上一個(gè)小蛋糕!2025/8/1597聚類的應(yīng)用領(lǐng)域經(jīng)濟(jì)領(lǐng)域:幫助市場(chǎng)分析人員從客戶數(shù)據(jù)庫(kù)中發(fā)現(xiàn)不同的客戶群,并且用購(gòu)買模式來(lái)刻畫不同的客戶群的特征。誰(shuí)喜歡打國(guó)際長(zhǎng)途,在什么時(shí)間,打到那里?對(duì)住宅區(qū)進(jìn)行聚類,確定自動(dòng)提款機(jī)ATM的安放位置股票市場(chǎng)板塊分析,找出最具活力的板塊龍頭股企業(yè)信用等級(jí)分類……生物學(xué)領(lǐng)域推導(dǎo)植物和動(dòng)物的分類;對(duì)基因分類,獲得對(duì)種群的認(rèn)識(shí)數(shù)據(jù)挖掘領(lǐng)域作為其他數(shù)學(xué)算法的預(yù)處理步驟,獲得數(shù)據(jù)分布狀況,集中對(duì)特定的類做進(jìn)一步的研究2025/8/1598有貢獻(xiàn)的研究領(lǐng)域數(shù)據(jù)挖掘聚類可伸縮性、各種各種復(fù)雜形狀類的識(shí)別,高維聚類等統(tǒng)計(jì)學(xué)主要集中在基于距離的聚類分析,發(fā)現(xiàn)球狀類機(jī)器學(xué)習(xí)無(wú)指導(dǎo)學(xué)習(xí)(聚類不依賴預(yù)先定義的類,不等同于分類)空間數(shù)據(jù)技術(shù)生物學(xué)市場(chǎng)營(yíng)銷學(xué)2025/8/1599什么情況下需要聚類以上分析,沒(méi)有大量的數(shù)據(jù)去支持,DataMining就什么都挖不出來(lái)。大量的數(shù)據(jù)不等于大量的垃圾,我們需要針對(duì)客戶市場(chǎng)細(xì)分所需要的資料。如需要知道白金持卡人和金卡持卡人的流動(dòng)率,各自平均消費(fèi)水平有多少,等;聚類分析可以輔助企業(yè)進(jìn)行客戶細(xì)分,但是Datamining的客戶細(xì)分不等同于商業(yè)領(lǐng)域的細(xì)分,看不懂結(jié)果,也可能造成企業(yè)管理層無(wú)法對(duì)結(jié)果善加利用。2025/8/15100聚類分析原理介紹聚類分析中“類”的特征:聚類所說(shuō)的類不是事先給定的,而是根據(jù)數(shù)據(jù)的相似性和距離來(lái)劃分聚類的數(shù)目和結(jié)構(gòu)都沒(méi)有事先假定聚類分析的基本思想是認(rèn)為我們所研究的樣本或指標(biāo)(變量)之間存在著程度不同的相似性(親疏關(guān)系)。于是根據(jù)一批樣本的多個(gè)觀測(cè)指標(biāo),具體找出一些彼此之間相似程度較大的樣本(或指標(biāo))聚合為一類,把另外一些彼此之間相似程度較大的樣本(或指標(biāo))又聚合為另一類,關(guān)系密切的聚合到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)大的分類單位,直到把所有樣本(或指標(biāo))都聚合完畢,把不同的類型一一劃分出來(lái),形成一個(gè)由小到大的分類系統(tǒng)。最后把整個(gè)分類系統(tǒng)畫成一張譜系圖,用它把所有樣本(或指標(biāo))間的親疏關(guān)系表示出來(lái)。這種方法是最常用的、最基本的一種,稱為系統(tǒng)聚類分析。2025/8/15101聚類分析原理介紹聚類方法的目的是尋找數(shù)據(jù)中:潛在的自然分組結(jié)構(gòu)astructureof“natural”grouping感興趣的關(guān)系relationship什么是自然分組結(jié)構(gòu)Naturalgrouping?我們看看以下的例子:有16張牌如何將他們分為一組一組的牌呢?AKQJ2025/8/15102聚類分析原理介紹分成四組每組里花色相同組與組之間花色相異AKQJ花色相同的牌為一副Individualsuits2025/8/15103聚類分析原理介紹分成四組符號(hào)相同的牌為一組AKQJ符號(hào)相同的的牌Likefacecards2025/8/15104聚類分析原理介紹分成兩組顏色相同的牌為一組AKQJ顏色相同的配對(duì)Blackandredsuits2025/8/15105聚類分析原理介紹分成兩組大小程度相近的牌分到一組AKQJ大配對(duì)和小配對(duì)Majorandminorsuits2025/8/15106聚類分析原理介紹這個(gè)例子告訴我們,分組的意義在于我們?cè)趺炊x并度量“相似性”Similar因此衍生出一系列度量相似性的算法AKQJ大配對(duì)和小配對(duì)Majorandminorsuits2025/8/15107聚類分析原理介紹相似性Similar的度量(統(tǒng)計(jì)學(xué)角度)距離Q型聚類(主要討論)主要用于對(duì)樣本分類常用的距離有(只適用于具有間隔尺度變量的聚類):明考夫斯基距離(包括:絕對(duì)距離、歐式距離、切比雪夫距離)蘭氏距離馬氏距離斜交空間距離此不詳述,有興趣可參考《應(yīng)用多元分析》(第二版)王學(xué)民相似系數(shù)R型聚類用于對(duì)變量分類,可以用變量之間的相似系數(shù)的變形如1-rij定義距離這里不詳細(xì)介紹這種聚類度量方法2025/8/15108聚類分析原理介紹變量按測(cè)量尺度(MeasurementLevel)分類間隔(Interval)尺度變量連續(xù)變量,如長(zhǎng)度、重量、速度、溫度等有序(Ordinal)尺度變量等級(jí)變量,不可加,但可比,如一等、二等、三等獎(jiǎng)學(xué)金名義(Nominal)尺度
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院健康檢查與疾病預(yù)防制度
- 公共交通服務(wù)質(zhì)量投訴處理制度
- 2026年中級(jí)電工實(shí)操技能筆試模擬題
- 2026年?duì)I銷知識(shí)考點(diǎn)指南及題目
- 2026年新聞傳播專業(yè)研究生入學(xué)考試模擬題
- 2026年旅游規(guī)劃目的地管理考試題
- 2026年康復(fù)輔助器具租賃合同
- 2025年呂梁職業(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(奪冠)
- 古代茶人介紹課件
- 2025 小學(xué)六年級(jí)科學(xué)上冊(cè)科學(xué)精神名言賞析課件
- 村衛(wèi)生室安全管理制度
- 2026臺(tái)州三門金鱗招商服務(wù)有限公司公開(kāi)選聘市場(chǎng)化工作人員5人筆試模擬試題及答案解析
- 中國(guó)化學(xué)工程集團(tuán)有限公司行測(cè)筆試題庫(kù)2026
- 2026貴州遵義融媒傳媒(集團(tuán))有限公司招聘19人筆試參考題庫(kù)及答案解析
- 北森人才測(cè)評(píng)試題及答案
- 2026年中國(guó)航空傳媒有限責(zé)任公司市場(chǎng)化人才招聘?jìng)淇碱}庫(kù)及完整答案詳解1套
- 泥水平衡頂管施工安全措施
- 煤礦安全操作規(guī)程課件
- 醫(yī)院紀(jì)檢干部培訓(xùn)課件
- 二尖瓣狹窄的護(hù)理
- 山地造林施工設(shè)計(jì)方案經(jīng)典
評(píng)論
0/150
提交評(píng)論