版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
記錄學復習資料第一章數(shù)據(jù)系統(tǒng)一、數(shù)據(jù)類型1、定性數(shù)據(jù)2、定量數(shù)據(jù)定量數(shù)據(jù)(scale):可以得到詳細數(shù)值,一般尚有測量單位。定距變量:如溫度、年齡……定比變量:如收入……定距數(shù)據(jù)(Scale):一般指諸如身高、體重、血壓等的持續(xù)型數(shù)據(jù),也包括諸如人數(shù)、商品件數(shù)等離散型數(shù)據(jù)。定序數(shù)據(jù)(ordinal):是具有內(nèi)在固定大小或高下次序的數(shù)值或字符,如文化程度、職稱,等。定類數(shù)據(jù)(nominal):沒有內(nèi)在固定大小或高下次序,一般以數(shù)值或字符表達的分類數(shù)據(jù),如性別、民族,等。二、數(shù)據(jù)來源1、野外調(diào)查2、定位或半定位觀測3、室內(nèi)試驗4、判圖5、記錄資料和文獻二、數(shù)據(jù)的整頓1、檢查資料、記錄分組與圖表繪制保證資料的可靠性、完整性和精確性記錄分組是按照一定標志和規(guī)定,把數(shù)據(jù)提成不一樣的組,為后續(xù)的記錄研究打下基礎。記錄分組可分為:按質(zhì)量標志分組和按數(shù)量標志分組。按質(zhì)量標志分組,多用于人文-經(jīng)濟地理領域,其組數(shù)取決于社會經(jīng)濟現(xiàn)象的基本類型和其在研究中的意義,并且不分組距。如:在人口地理研究中,將人口按性別、民族、職業(yè)進行分組。按數(shù)量標志分組,是先依其變量類型不一樣,分為離散型變量和持續(xù)型變量,然后再根據(jù)其特性的不一樣進行分組。離散型變量可采用單項式(每個變量為一組)和組距式(整個變量提成幾種區(qū)間,每個區(qū)間為一組)處理。持續(xù)型變量只能采用組距式分組。又可分為等距和不等距分組兩種。組距分組:第一步,求變量的全距RR=Xmax-Xmin第二步,確定組數(shù)nn=1+3.32lgN(N為樣本總量)第三步,計算組距:h=R/n第四步,確定每組的上、下限2、數(shù)據(jù)的合并與分割3、數(shù)據(jù)的函數(shù)變換4、數(shù)據(jù)的其他變換數(shù)據(jù)的函數(shù)變換是將原始數(shù)據(jù)的每一種數(shù)值通過特定的運算方式變換成新的數(shù)值。在原有數(shù)據(jù)基本上,計算產(chǎn)生某些具有更豐富信息的新數(shù)據(jù)。使數(shù)據(jù)更直觀、更有效。常見的數(shù)據(jù)變換有:對數(shù)或多項式變換;時間序列的平穩(wěn)化處理;運用區(qū)間變換壓縮數(shù)據(jù)取值X圍和原則化處理等。包括算術體現(xiàn)式、條件體現(xiàn)式和函數(shù)三大部分。第二節(jié)數(shù)據(jù)的分布特性數(shù)據(jù)通過整頓后,得出了頻數(shù)分布的大體狀況。但為了確切地表達地理數(shù)據(jù)的分布性質(zhì)和在數(shù)量上的特性,需要深入定量計算其特性值。在數(shù)據(jù)的分布性質(zhì)中,最重要的兩個性質(zhì)是集中性和分散性。反應數(shù)據(jù)集中性的特性值有:平均值(均數(shù))、中位數(shù)、眾數(shù)等。反應數(shù)據(jù)分散性的特性值有:絕對離差度(離差、離差平方和、原則差、方差等)和相對離差度(變異系數(shù))1、平均數(shù)(均數(shù),Mean)可代表數(shù)據(jù)的一般水平,并可作為對比分析的指標。重要包括算術平均數(shù)和幾何平均數(shù)。(1)簡樸算術平均數(shù):(2)加權算術平均數(shù):3)幾何平均數(shù)一般用來分析和研究國民經(jīng)濟、企業(yè)生產(chǎn)或人口等方面的平均發(fā)展速度和平均增長速度2、中位數(shù)(Median)也稱中央值,它是數(shù)據(jù)按大小排序后位居中間的那個數(shù)值。當一種數(shù)據(jù)變量值分布很偏時,以中位數(shù)表達集中趨勢比算術平均數(shù)更合理。如收入、分數(shù)的分布。對于未分組的數(shù)據(jù):3、眾數(shù)(Mode)是數(shù)據(jù)中出現(xiàn)頻數(shù)最多的那個數(shù)。對于未分組的數(shù)據(jù),可以根據(jù)每一種數(shù)據(jù)出現(xiàn)的頻數(shù)大小直接確定眾數(shù)。對于分組數(shù)據(jù),按如下公式計算眾數(shù):三、數(shù)據(jù)的分布形態(tài)1、偏度(Skewness):反應頻數(shù)分布偏態(tài)方向和程度的測度偏度值不小于0,表達正偏差值大,稱為右偏或正偏;偏度值不不小于0,表達負偏差值大,為負偏或左偏。(2)峰度(Kurtosis):指頻數(shù)分布曲線高峰的形態(tài),即反應分布曲線的尖峭程度的測度。當β=0時,表達分布的峰度是正態(tài)分布的峰度;當β>0時,表達分布曲線的高峰是尖頂高峰;當β<0時,表達分布曲線的高峰是平頂高峰。右面為箱圖,圖中方箱為四分位數(shù),中心粗線為中位數(shù),兩端線為最大值與最小值,之外的圓圈代表可疑的離群值。交叉列聯(lián)表的卡方(X2)檢查在列聯(lián)表確定的狀況下,卡方記錄量觀測值的大小僅取決于觀測頻數(shù)與期望頻數(shù)的總差值。當總差值越大時,卡方值也就越大,實際分布與期望分布的差距越大,表明行列變量之間越有關。反之,當總差值越小時,卡方值也就越小,實際分布與期望分布越靠近,表明行列變量之間越獨立??ǚ綑z查成果:P=0<α(0.05),則拒絕0假設,闡明變量之間存在著明顯聯(lián)絡,即強有關性。第二章時間序列分析數(shù)據(jù)的時間序列分析:事物存在于空間和時間之中,對事物的空間分布和時間序列的描述和測度,是分析問題或現(xiàn)象研究成果的基礎。時間序列分析(TimeSeriesAnalysis)是研究事物發(fā)展變化規(guī)律的一種量化分析措施。一、數(shù)據(jù)空間分布類型1、點狀分布2、線狀分布3、面狀分布:包括離散型區(qū)域、持續(xù)型區(qū)域兩種。離散型區(qū)域是一種不持續(xù)的面狀分布,兩個相鄰區(qū)域之間為不一樣的質(zhì)量或性質(zhì)差異的數(shù)據(jù)系統(tǒng)。數(shù)據(jù)的時間序列分析時間序列分析(TimeSeriesAnalysis)是研究事物發(fā)展變化規(guī)律的一種量化分析措施。是某些有著嚴格先后次序的數(shù)據(jù),它們之間存在著某種前后相承的關系,而非互相獨立。數(shù)據(jù)的時間序列分析2、時間序列分析措施(1)時域分析:認為時間序列是過去值和某些有關變量的函數(shù),即目前的體現(xiàn)是由過去的狀態(tài)和某些外部原因決定的,通過過去和目前的序列數(shù)據(jù)可以預知未來的體現(xiàn)。(2)頻域分析:認為時間序列是由若干個具有不一樣周期的正弦波成分疊加而成,通過復雜的數(shù)學工具,對其周期成分進行識別和分解,可以認識時間序列的特性,掌握其變化規(guī)律。時間序列——時域分析措施簡樸回歸分析法:一種基于因果關系的分析措施,適合序列間的構造分析和較長期數(shù)列數(shù)據(jù)的預測。趨勢外推法:對序列的長期趨勢運用曲線進行擬合的分析措施,合用于精度規(guī)定不很高的中長期趨勢預測。自回歸(Autoregression)措施:引入了被解釋就量某些階數(shù)的滯后變量,合用于簡樸回歸分析中殘差項存在一階自有關狀況的序列。自回歸移動平均(ARMA)模型,也稱B-J措施:認為時間序列是若干白噪聲序列的某種組合(MA模型),可以由其自身的某些滯后序列進行解釋(AR模型)。常用于隨機性波動較頻繁序列的短期預測。時間序列的水平分析重要指標——發(fā)展水平、平均發(fā)展水平、增減量、平均增減量基期、匯報期(末期)序時平均數(shù):不一樣步間上的指標數(shù)值的平均數(shù)。時期數(shù)列:時點數(shù)列:增減量:匯報期與基期水平之差。平均增減量4、時間序列的速度分析發(fā)展速度:匯報期水平與基期水平之比增減速度:由增減量與基期水平對比求得平均發(fā)展速度------幾何平均法:側重于研究對象的最末期的發(fā)展水平,如生產(chǎn)能力、產(chǎn)值、人口增長等的記錄。------合計法:側重于研究對象各期發(fā)展水平的總和,如合計資產(chǎn)數(shù)、合計畢業(yè)生人數(shù)等的記錄。5、時間序列的趨勢變動分析1)長期趨勢:現(xiàn)象在相稱長的時間內(nèi)所體現(xiàn)的某一方向持續(xù)的變化。增長趨勢①線性趨勢a、移動平均法是擴大原時間序列的時間間隔,選定一定的時距項數(shù)n,采用逐次遞移的措施對原數(shù)列遞移的n項計算一系列序時平均數(shù)。由于數(shù)據(jù)在某一時間段內(nèi)的出現(xiàn)很大的波動,為了濾去數(shù)據(jù)中某些短期的不規(guī)則的變化,找出較長時間的變化規(guī)律。該措施合用來分析時間序列的長期趨勢,不適合對現(xiàn)象未來的發(fā)展趨勢進行預測。②滑動平均法由于地理數(shù)據(jù)在某一時間段內(nèi)的出現(xiàn)很大的波動,為了濾去數(shù)據(jù)中某些短期的不規(guī)則的變化,找出較長時間的變化規(guī)律,常用滑動平均法處理。常用三年、五年、十年滑動平均數(shù)③直線趨勢方程擬合3)線性擬合趨勢分析4)非線性趨勢方程擬合拋物線型指數(shù)曲線型指數(shù)平滑法:又叫指數(shù)加權移動平均法,通過對時間數(shù)列中各個數(shù)據(jù)進行加權處理,愈近的數(shù)據(jù)其權數(shù)應愈大??梢韵龝r間數(shù)列的偶爾原因所引起的變動,進而找出預測對象的數(shù)據(jù)變化特性和趨勢。一次指數(shù)平滑法6、時間序列——模型評價預測精度:誤差平方和SSE、平均絕對百分誤差MAPE、預測值的方差、擬合優(yōu)度R2等變量的有關性:F記錄量、變量系數(shù)的t記錄量等;變量因果數(shù)量關系:明顯性檢查Y=0.156*X-298.4920.156為B1,然后為常數(shù)。SPSS時間序列的預處理——數(shù)據(jù)變換重要包括序列的平穩(wěn)化處理和序列的平滑處理等。平穩(wěn)化處理的目的是使處理后的序列成為平穩(wěn)序列。一般而言,均值平穩(wěn)化采用差分(Difference)處理,方差平穩(wěn)化運用Box-Cox變換處理。第三章假設檢查與均數(shù)比較數(shù)據(jù)的記錄推斷與假設檢查1、空間類型的抽樣設計總體:又稱母體,即在數(shù)據(jù)記錄中,把準備加以觀測的一種滿足指定條件的地理要素的集合。是研究對象的某特性值的全體。樣本:從總體中抽出的一部分個體。從總體中取出部分個體的過程,稱為“抽樣”。抽樣過程必須力爭樣本對總體具有很好的代表性。這種代表性不僅與樣本容量有關,即樣本越大,抽樣誤差越小,反之,誤差越大,還受抽樣措施的制約。抽樣措施隨機抽樣法、系統(tǒng)點抽樣法、分層區(qū)域抽樣法、階梯抽樣法、橫截面(線)法3、假設檢查假設檢查的思想:首先提出假設,然后運用樣本數(shù)據(jù)來檢查假設,支持,則接受假設;不支持,則推翻假設。假設檢查的基本信條:小概率原理,即發(fā)生概率很小的隨機事件,在一次試驗中幾乎不也許發(fā)生。參數(shù):描述總體的數(shù)字特性,如總體均數(shù)。記錄量:描述樣本的數(shù)字特性,如樣本均數(shù)。置信度:樣本記錄量推斷總體特性的可靠性程度置信區(qū)間:概率保證下的總體參數(shù)的也許取值X圍,如當?shù)啬行云骄趸槟挲g有95%的也許性為25±2周歲。推斷記錄推斷記錄:由樣本數(shù)據(jù)推斷總體特性的措施。在對樣本數(shù)據(jù)描述的基礎上,以概率形式對總體的數(shù)量特性進行表述。1.總體數(shù)據(jù)無法獲得2.搜集總體數(shù)據(jù)投入較大推斷記錄包括參數(shù)估計和假設檢查兩種形式,兩者原理一致,僅體現(xiàn)形式不一樣。均數(shù)比較過程是經(jīng)典的參數(shù)檢查,參數(shù)檢查是推斷記錄的重要構成部分。假設檢查的思想:首先提出假設,然后運用樣本數(shù)據(jù)來檢查假設,支持,則接受假設;不支持,則推翻假設。假設檢查的基本信條:小概率原理,即發(fā)生概率很小的隨機事件,在一次試驗中幾乎不也許發(fā)生。假設檢查分為兩類:參數(shù)檢查:總體分布已知時(如正態(tài)分布),根據(jù)樣本數(shù)據(jù)對某些總體參數(shù)(如均值)進行推斷。非參數(shù)檢查:總體分布未知或不符合參數(shù)檢查的假定分布時。其中,卡方檢查是非參數(shù)檢查假設檢查的基本環(huán)節(jié)提出無效(零)假設(H0)。選擇檢查記錄量,給定明顯性水平α。計算檢查記錄量的發(fā)生概率。根據(jù)明顯性水平,作出記錄結論。假設檢查無效假設H0:有關總體參數(shù)的假設,必然包括等號H0:μ=某值;H0:μ≥某值;H0:μ≤某值;對立假設H1:H1:μ≠某值;H1:μ<某值;H1:μ>某值;檢查水平α:即明顯性水平,一般取0.01、0.05或0.10。假設檢查基于小概率原理:給定檢查水平α,假如零假設成立條件下出現(xiàn)既有記錄量的概率等于或不不小于α,則認為此事件也許性很小,因此就拒絕零假設。均數(shù)比較★正態(tài)分布:概率分布密度曲線呈鐘型,兩頭低中間高,左右對稱,近似于數(shù)學上的正態(tài)曲線。其性質(zhì)和特點:☆決定于均數(shù)和方差2、☆鐘形曲線、☆位置特性量均數(shù)、中位數(shù)、眾數(shù)相等☆偏度和峰度均為零均數(shù)比較的假設檢查數(shù)據(jù)類型:服從正態(tài)分布的定距型變量擬處理:某樣本均值與否來自某個已知的正態(tài)總體?兩個樣本所代表的總體均值與否相似?某樣本所代表的總體均值與否發(fā)生了數(shù)量上的變化?假如兩個樣本均數(shù)不一樣,也許存在如下兩種狀況兩個樣本所來自的總體均數(shù)相似,差異來自抽樣誤差。2、總體均數(shù)確實不一樣。均數(shù)比較的類型單個樣本均數(shù)與總體均數(shù)比較、配對樣本的均數(shù)比較、兩個樣本均數(shù)的比較兩樣本方差齊:原始資料呈正態(tài)分布時:t檢查原始資料不呈正態(tài)分布,但樣本量較大時:t檢查原始資料不呈正態(tài)分布,且樣本量較小時:非參數(shù)檢查兩樣本方差不齊:數(shù)據(jù)變換后方差齊:t檢查數(shù)據(jù)變換后方差不齊:t’檢查檢查環(huán)節(jié)與記錄量事先確定與否雙側檢查,建立無效假設H0:μ=μ0(雙);對立假設?單側檢查?確定檢查水準α=0.05選擇檢查記錄量進行檢查(υ=n-1)成果判斷與解釋P>0.05,不能拒絕H0,p<=0.05,拒絕H0。第四章:方差分析方差分析是一種從數(shù)據(jù)差異入手的分析措施,有助于人們從另一種角度發(fā)現(xiàn)事物的內(nèi)在規(guī)律性。它能處理多種均值與否相等的檢查問題。是一種實用、有效的分析措施。方差分析基本概念方差分析:從分解數(shù)據(jù)差異來源入手,檢查兩個以上總體均數(shù)與否相等或與否具有差異的措施。作用:可用于尋找關鍵性的影響原因,分析影響原因的不一樣水平與其組合是怎樣影響觀測變量的。觀測變量:方差分析的因變量,即進行差異分析的數(shù)值型變量。如農(nóng)作物產(chǎn)量、廣告效果等。控制變量:方差分析中的影響原因,分組變量、自變量。如品種、施肥量、廣告形式等。其不一樣類別,稱為控制變量的不一樣水平。如廣告形式中的電視廣告、廣播廣告等。方差分析認為導致觀測變量值變化的原因有兩類:第一類是控制原因不一樣水平所產(chǎn)生的影響;第二類是隨機原因所產(chǎn)生的影響。假如控制變量的不一樣水平對觀測變量產(chǎn)生了明顯影響,那么,它和隨機變量共同作用必然使得觀測變量值有明顯波動。假如觀測變量值在某控制變量的各個水平中沒有出現(xiàn)明顯波動,那么可以認為該控制變量沒有對觀測變量產(chǎn)生重要影響,其數(shù)據(jù)的波動是抽樣誤差導致的。方差分析常用于均數(shù)比較,研究控制原因(定性)與觀測變量(定量)間的關系。與t檢查:方差分析是檢查多種總體的均值間差異與否具有記錄意義的一種措施,比t檢查更能節(jié)省時間。與回歸分析:方差分析是回歸分析的一種特例,可以用回歸模型來表達方差分析單原因方差分析擬分析一種控制原因與否對一種觀測變量有影響。即控制原因不一樣水平下觀測變量均值與否有差異;多種總體間的均值比較問題。如:分析不一樣施肥量與否給農(nóng)作物產(chǎn)量帶來明顯影響;考察地區(qū)差異與否會影響婦女的生育率;研究學歷對工資收入的影響……前提條件:各樣本彼此獨立各總體的方差相等觀測變量各總體應服從正態(tài)分布記錄思緒:觀測變量的總方差可分解為組間方差和組內(nèi)方差,前者反應控制原因的影響,后者體現(xiàn)隨機誤差,假如前者明顯不小于后者,則可認為控制原因?qū)τ^測值有影響。分析環(huán)節(jié):明確控制原因(如:施肥量、地區(qū)、學歷)和觀測變量(如:農(nóng)作物產(chǎn)量、婦女生育率、工資收入)剖析觀測變量的離均差平方和:SST=SSA+SSE分解自由度比較組間和組內(nèi)的方差大小,根據(jù)F分布界值做出記錄結論。假設檢查基本環(huán)節(jié)提出假設H0:a1=a2=…=ak=0確定明顯性水平α構造F檢查記錄量并計算(F記錄量服務(k-1,n-k)個自由度的F分布。)記錄結論與成果解釋假如控制變量對觀測變量導致了明顯影響,觀測變量總的變差中控制變量影響所占的比例相對于隨機變量必然較大,F(xiàn)值明顯不小于1;反之,假如控制變量沒有對觀測變量導致明顯影響,觀測變量的變差應歸結為隨機變量導致的,F(xiàn)值靠近于1。方差齊性檢查:對控制變量不一樣水平下各觀測變量總體方差與否相等進行分析。采用方差同質(zhì)性(HomogeneityofVariance)的檢查措施。多重比較檢查:判斷控制原因確有作用后,深入確定控制原因不一樣水平對觀測變量的影響程度,即各水平下觀測變量的均值兩兩比較。為何不用t檢查:棄真錯誤α的概率增大多原因方差分析協(xié)方差分析在協(xié)方差分析中,作為協(xié)變量的變量一般是定距變量。協(xié)方差分析涉與到兩種類型的控制變量(品質(zhì)型和定距型)和定距型觀測變量,假如將控制變量看做解釋變量,觀測變量看作被解釋變量,那么協(xié)方差分析便是一種介于方差分析和線性回歸分析之間的分析措施。通過線性回歸求出假定協(xié)變量相等時的控制原因各水平下的觀測變量修正均數(shù);通過方差分析比較修正均數(shù)的差異。第五章:有關與回歸分析有關分析和回歸分析是研究客觀現(xiàn)象之間數(shù)量聯(lián)絡的重要記錄措施;作為推斷記錄的有關分析與回歸分析具有廣泛的應用價值;客觀現(xiàn)象總是普遍聯(lián)絡和互相依存的;客觀現(xiàn)象之間的數(shù)量聯(lián)絡,有兩種不一樣的形態(tài):函數(shù)關系和有關關系。有關關系:當一種或幾種互相聯(lián)絡的變量取一定數(shù)值時,與之相對應的另一種變量的值雖然不確定,但它仍按某種規(guī)律在一定的X圍內(nèi)變化。變量間的這種互相關系,稱為具有不確定性的有關關系。如:勞動生產(chǎn)率與工資水平、投資額與GDP、商品流通規(guī)模與商務成本之間的關系等均屬于有關關系。2、有關關系類型劃分:完全有關:當一種現(xiàn)象的數(shù)量變化完全由另一種現(xiàn)象的數(shù)量變化所確定期,稱這種現(xiàn)象間的關系為完全有關。如:在價格不變的狀況下,商品的銷售總額與其銷售量總是成正比例關系。有關系數(shù)R=1或-1不有關:當兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨立時,稱為不有關現(xiàn)象。如:股票的價格高下與氣溫高下是不有關的。有關系數(shù)R=0不完全有關:兩個現(xiàn)象之間的關系介于完全有關和不有關之間,稱為不完全有關。有關系數(shù)0<R<1或-1<R<02、有關關系類型劃分:
當一種現(xiàn)象的數(shù)量由小變大,另一種現(xiàn)象的數(shù)量也對應由小變大,這種有關稱為正有關。有關系數(shù)R>0負有關:當一種現(xiàn)象的數(shù)量由小變大,而另一種現(xiàn)象的數(shù)量相反地由大變小,這種有關稱為負有關。有關系數(shù)R<02、有關關系類型劃分:
線性有關:當兩種有關現(xiàn)象之間的關系大到展現(xiàn)為線性關系時,稱之為線性有關。非線性有關:當兩種有關現(xiàn)象之間,并不體現(xiàn)為直線的關系,而是近似于某種曲線方程的關系,為非線性有關。2、有關關系類型劃分:
單有關:兩個現(xiàn)象的有關,即一種變量對另一種變量的有關關系。如:y=ax+b復有關:當所研究的是一種變量對兩個或兩個以上其他變量有關關系時,稱為復有關。如:Z=ax+by+c偏有關:在某一現(xiàn)象與多種現(xiàn)象有關的場所,當假定其他變量不變時,其中兩個變量的有關關系稱為偏有關。如:3、有關分析與回歸分析有關分析是用一種指標來表明現(xiàn)象之間互相依存關系的親密程度?;貧w分析是有關關系的詳細形態(tài)。有關分析需要依托回歸分析來表明現(xiàn)象數(shù)量有關的詳細形式,而回歸分析則需要依托有關關系來表顯現(xiàn)象數(shù)量變化的有關程度。只有當變量之間存在著高度有關時,進行回歸分析尋求其有關的詳細形式才故意義。有關分析研究變量之間有關的方向和有關的程度,不能指出變量間互相關系的詳細形式,也無法從一種變量的變化來推測另一種變量的變化狀況?;貧w分析則是研究變量之間互相關敏捷詳細形式,它對具有有關關系的變量之間的數(shù)量聯(lián)絡進行測定,確定一種有關的數(shù)學方程式。1、回歸分析概述回歸分析:是研究變量之間數(shù)量依存關系的一種記錄分析措施,可以把握因變量受一種或多種自變量影響的程度,并可運用回歸方程進行預測和控制?;貧w分析的任務:建立回歸方程。用途:考察影響原因;預測與控制(1)有關與回歸的關系有關:反應變量間線性關系的親密程度(點的疏密)回歸:反應自變量取值大小對因變量取值的影響程度(斜率大?。?)回歸分析的一般環(huán)節(jié)確定回歸分析的自變量(解釋變量)和因變量(被解釋變量)確定回歸模型建立回歸方程對回歸方程進行檢查運用回歸方程進行預測(3)SPSS回歸分析線性回歸(Linear):簡樸線性回歸和多元線性回歸★非線性回歸:CurveEstimation和NonlinearRegression★Logistic回歸:合用于因變量為分類變量的狀況。分為二分類、多分類Logistic過程?!锲渌貧w措施:線性回歸的前提假設不滿足時的補充措施。2、線性回歸模型線性回歸分析:是描述一種因變量(dependentvariable)Y與一種或多種自變量(independentvariable)X間的線性依存關系,根據(jù)自變量數(shù)目的不一樣可分為一元線性回歸和多元線性回歸。數(shù)學模型實際擬合的線性回歸方程為第一種模型;第二個為變量個體詳細取值的模型,其中殘差滿足:E(ε)=0;var(ε)=σ2(1)前提條件線性趨勢:因變量與自變量是線性有關的。獨立性:因變量y的取值互相獨立正態(tài)性:對于自變量的每一組合,y服從正態(tài)分布方差齊性:對于自變量的每一組合,y的方差均相似樣本量規(guī)定:N≥20回歸方程的明顯性檢查:檢查應變量與所有自變量的線性關系與否明顯,F(xiàn)=回歸均方/誤差均方?;貧w系數(shù)的明顯性檢查:檢查總體偏回歸系數(shù)βi與否等于0,在一元線性回歸中,F(xiàn)=t2在多元線性回歸中,F(xiàn)ch=ti2,偏F記錄量為某個自變量引入方程后使得回歸方程F記錄量改善的程度.回歸方程的擬合優(yōu)度檢查回歸方程可以解釋的被解釋變量變異程度越高,擬合優(yōu)度越高.Cox&SnellR2記錄量=1-(L0/L)2/nNaglkerkeR2=Cox&SnellR2/(1-(L0)2/n),取值0~1回歸方程預測值與實際值之間的吻合程度,總體預測精確率越高,擬合優(yōu)度越高.錯判矩陣Hosmer-Lemeshow記錄量服從n-2個自由度的卡方分布:當自變量較多且多為持續(xù)性變量時殘差分析模型的檢查模型擬合優(yōu)度的檢查:決定系數(shù)R2,檢查樣本數(shù)據(jù)點匯集在回歸線周圍的密集程度。但其大小受模型中自變量個數(shù)的影響,可檢查一元線性回歸模型擬合的優(yōu)度調(diào)整R2:修正了模型自變量個數(shù)P對R2的影響??捎糜诙嘣€性回歸模型的擬合優(yōu)度檢查。第六章:聚類分析1、聚類分析的意義和作用(1)聚類分析是記錄學中研究“物以類聚”問題的多元記錄分析措施;(2)聚類分析是根據(jù)地理變量的屬性或特性的相似性、親疏程度,用數(shù)學的措施把它們逐漸分型劃類,最終得到一種能反應個體之間、群體之間親疏關系的分類系統(tǒng)。(3)在聚類分析中,關系親密的個體聚合到一小類,而關系疏遠的個體則聚合到一大類,直到把所有的個體都聚合完畢,最終便可根據(jù)各類之間的親疏關系,畫成一X完整的分類系統(tǒng)圖,即譜系圖。2、聚類分析的基本特點(1)無需先驗知識:即事先無需懂得分類對象的分類構造,而只需要一批地理數(shù)據(jù);(2)無需親疏程度:即事先無需知識各變量取值上的總體差異程度,只要選好分類記錄量,并按一定的措施環(huán)節(jié)進行計算;(3)能客觀地獲得一X完整的分類系統(tǒng)圖。3、聚類分析的基本類型(1)Q型聚類分析,即對地點、地區(qū)或樣品進行分類(2)R型聚類分析,即對要素、指標或變量進行分類4、聚類分析的重要措施(1)系統(tǒng)聚類法(應用最廣泛)(2)逐漸聚類法(3)逐漸分解法(4)最優(yōu)分割法5、聚類分析注意事項(1)所選擇的變量應符合聚類規(guī)定,即各變量應能體現(xiàn)聚類的特性規(guī)定。(2)各變量的變量值不應有數(shù)量級上的差異,可考慮運用原則化處理來消除數(shù)量級對聚類的影響。(3)各變量間不應有較強的線性有關關系。SPSS聚類功能常用的有兩種:迅速聚類(迭代過程):K-MeansCluster系統(tǒng)聚類:HierarchicalCluster系統(tǒng)聚類由兩種措施:分解法和凝聚法。系統(tǒng)聚類的功能:即可進行樣品的聚類,也可進行變量的聚類。系統(tǒng)聚類的原理:即我們前面簡介過的系統(tǒng)聚類措施的原理和過程。系統(tǒng)聚類的中要進行如下的選擇:數(shù)據(jù)的原則化測度措施的選擇:距離措施的選擇或相似性、關聯(lián)程度的選擇。聚類措施的選擇:即以什么措施聚類,SPSS提供了七種可供選擇的措施。(一)聚類措施1.Between-groupslinkage類間平均法兩類距離為兩類元素兩兩之間平均平方距離2.Within-groupslinkage類內(nèi)平均法兩類距離為合并后類中也許元素兩兩之間平均平方距離3.Nearestneighbor
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 黃酒發(fā)酵工崗前基礎評估考核試卷含答案
- 沖印師操作評優(yōu)考核試卷含答案
- 2025年上海第二工業(yè)大學單招(計算機)考試備考題庫附答案
- 2024年湖北生態(tài)工程職業(yè)技術學院馬克思主義基本原理概論期末考試題附答案
- 2024年鐵嶺衛(wèi)生職業(yè)學院馬克思主義基本原理概論期末考試題附答案
- 2024年長沙市直遴選筆試真題匯編附答案
- 2024年重慶工信職業(yè)學院輔導員招聘考試真題匯編附答案
- 2024年賀州市選調(diào)公務員考試真題匯編附答案
- 2024年甘德縣幼兒園教師招教考試備考題庫附答案
- 2025四川廣漢市招聘社區(qū)專職工作者(13人)備考題庫附答案
- 安全帽使用規(guī)范制度
- 2026國家電投集團蘇州審計中心選聘15人筆試模擬試題及答案解析
- 2026年桐城師范高等??茖W校單招職業(yè)技能考試題庫及答案1套
- 霧化吸入操作教學課件
- 2025年小學圖書館自查報告
- 【語文】廣東省佛山市羅行小學一年級上冊期末復習試卷
- 2025年醫(yī)療器械注冊代理協(xié)議
- 新疆三校生考試題及答案
- 2025新疆亞新煤層氣投資開發(fā)(集團)有限責任公司第三批選聘/招聘筆試歷年參考題庫附帶答案詳解
- 圍手術期心肌梗塞的護理
- 超市門口鑰匙管理制度
評論
0/150
提交評論