度量分布偏斜的程度_第1頁
度量分布偏斜的程度_第2頁
度量分布偏斜的程度_第3頁
度量分布偏斜的程度_第4頁
度量分布偏斜的程度_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章數(shù)據(jù)的描述統(tǒng)計目錄第一節(jié)集中趨勢的度量其次節(jié)離散趨勢的度量第三節(jié)偏斜度與峰度的度量第四節(jié)SPSS在描述統(tǒng)計中的運用集中趨勢(centraltendency)是指一組數(shù)據(jù)向某中心值靠攏的傾向,集中趨勢的測度事實上就是對數(shù)據(jù)一般水平代表值或中心值的測度。不同類型的數(shù)據(jù)用不同的集中趨勢測度值,選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要依據(jù)所駕馭的數(shù)據(jù)的類型來確定。集中趨勢的特征數(shù),是代表一組數(shù)據(jù)典型水平或集中趨勢的統(tǒng)計量。常用的集中趨勢的特征數(shù)包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)等。3第一節(jié)集中趨勢的度量一、算數(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticmean)簡稱為均數(shù)(mean)。樣本均數(shù)通常用表示,總體均數(shù)用希臘字母μ表示。算術(shù)平均數(shù)是集中趨勢的最主要測度值。適用于對稱分布,特殊是正態(tài)或近似正態(tài)分布的計量資料。依據(jù)所駕馭數(shù)據(jù)形式的不同,算術(shù)平均數(shù)有簡潔算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)。4第一節(jié)集中趨勢的度量(1)簡潔算術(shù)平均數(shù)(simplearithmeticmean)。未經(jīng)分組整理的原始數(shù)據(jù),其算術(shù)平均數(shù)的計算就是干脆將一組數(shù)據(jù)的各個數(shù)值相加除以數(shù)值個數(shù)。計算公式為:(2)加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)。依據(jù)分組整理的數(shù)據(jù)計算的算術(shù)平均數(shù),就要以各組變量值出現(xiàn)的次數(shù)或頻數(shù)為權(quán)數(shù)計算加權(quán)的算術(shù)平均數(shù)。計算公式為:5第一節(jié)集中趨勢的度量二、幾何平均數(shù)幾何平均數(shù)(geometricmean),是指社會經(jīng)濟現(xiàn)象的同質(zhì)總體在時間上變動速度的平均數(shù),也即統(tǒng)計總體在一段時期內(nèi)的平均發(fā)展速度。幾何平均數(shù)通常用于計算指數(shù)、百分比和增長速度的平均數(shù)。依據(jù)駕馭的數(shù)據(jù)資料不同,幾何平均數(shù)可分為簡潔幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種。6第一節(jié)集中趨勢的度量(1)簡潔幾何平均數(shù)。依據(jù)未經(jīng)分組資料計算平均數(shù)。計算公式為:(2)加權(quán)幾何平均數(shù)。當(dāng)駕馭的數(shù)據(jù)資料為分組資料,且各個變量值出現(xiàn)的次數(shù)不相同時,應(yīng)用加權(quán)方法計算幾何平均數(shù)。計算公式為:7第一節(jié)集中趨勢的度量三、中位數(shù)中位數(shù)(median)是一組按大小依次排列的視察值中位居中間的數(shù)值,通常用表示。它常用于描述偏態(tài)分布資料的集中趨勢。中位數(shù)是一個位置代表值,因此它不受極端變量值的影響,特殊是當(dāng)分布末端無確定數(shù)據(jù)不能求算術(shù)平均數(shù)和幾何平均數(shù)時,可以用中位數(shù)來表示數(shù)據(jù)分布的集中趨勢。8第一節(jié)集中趨勢的度量對于已分組的數(shù)據(jù)來說,中位數(shù)的計算公式為:其中,是到中位數(shù)組前面一組為止的向上累計頻數(shù),

則是到中位數(shù)組后面一組為止的向下累計頻數(shù);

為中位數(shù)組的頻數(shù);i為中位數(shù)組的組距。9第一節(jié)集中趨勢的度量四、眾數(shù)眾數(shù)(mode)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用表示。從變量分布的角度看,眾數(shù)是具有明顯集中趨勢點的數(shù)值,一組數(shù)據(jù)分布的最高峰點所對應(yīng)的變量值即為眾數(shù)。當(dāng)然,假如數(shù)據(jù)的分布沒有明顯的集中趨勢或最高峰點,眾數(shù)也可以不存在;假如有多個高峰點,也就有多個眾數(shù)。在統(tǒng)計實踐中,當(dāng)一組數(shù)據(jù)出現(xiàn)不同質(zhì)的狀況,或分布中出現(xiàn)極端數(shù)據(jù)時,用眾數(shù)來描述數(shù)據(jù)的集中趨勢較為合適。10第一節(jié)集中趨勢的度量設(shè)眾數(shù)組的頻數(shù)為,眾數(shù)前一組的頻數(shù)為,眾數(shù)后一組的頻數(shù)為。當(dāng)眾數(shù)相鄰兩組的頻數(shù)相等時,即=,眾數(shù)組的組中值即為眾數(shù);當(dāng)眾數(shù)組的前一組的頻數(shù)多于眾數(shù)組后一組的頻數(shù)時,即>,則眾數(shù)會向其前一組靠,眾數(shù)小于其組中值;當(dāng)眾數(shù)組后一組的頻數(shù)多于眾數(shù)組前一組的頻數(shù)時,即<,則眾數(shù)會向其后一組靠,眾數(shù)大于其組中值。基于這種思路,借助于幾何圖形而導(dǎo)出的分組數(shù)據(jù)眾數(shù)的計算公式為:其中,L表示眾數(shù)所在組的下限;U表示眾數(shù)所在組的上限。上述下限和上限公式是假定數(shù)據(jù)分布具有明顯的集中趨勢,且眾數(shù)組的頻數(shù)在該組內(nèi)是勻整分布的,若這些假定不成立,則眾數(shù)的代表性就會很差。11第一節(jié)集中趨勢的度量五、調(diào)和平均數(shù)調(diào)和平均數(shù)(reciprocalmean)也稱倒數(shù)平均數(shù),它是對變量(x)的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù)。依據(jù)駕馭的統(tǒng)計資料不同,調(diào)和平均數(shù)可以分為簡潔調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。12第一節(jié)集中趨勢的度量(1)簡潔調(diào)和平均數(shù):(2)加權(quán)調(diào)和平均數(shù):13第一節(jié)集中趨勢的度量六、集中趨勢度量的例題分析【例7-1】2010年中國南方某城鎮(zhèn)3200戶家庭的平均每一勞動力年收入的頻數(shù)分布狀況如表7-1所示,請計算其算術(shù)平均數(shù)、中位數(shù)和眾數(shù)。14第一節(jié)集中趨勢的度量年收入分組/元組中值X/元頻數(shù)f累積頻數(shù)8000-1700017000-2600026000-3500035000-4400044000-5300053000-62000125002150030500395004850057500700100080040020010070017002500290031003200總計3200解:(1)算術(shù)平均數(shù)(2)中位數(shù)(3)眾數(shù)15第一節(jié)集中趨勢的度量【例7-2】1950年我國總?cè)丝跒?.5億,1985年達到了10.5億,共計增長了1.9倍(表7-2)。(1)測算1950~1985年,我國平均每5年的人口增長速度;(2)測算1950~1975年,我國平均每5年的人口增長速度;(3)假如1975~1985年期間不實行支配生育政策,請測算1985年我國的人口總數(shù)。16第一節(jié)集中趨勢的度量年度人口數(shù)/萬人環(huán)比增長速度1950195519601965197019751980198555196614656620772538829929242098705104532-1.1141.0771.0961.1441.1141.0681.059

解:(1)MG=1.114?1.077?1.096?1.144?1.144?1.068?1.059)1/7≈1.096,即1950~1985年,我國平均每5年的人口增長速度為9.6%;

(2)MG=(1.114?1.077?1.096?1.144?1.144)1/5≈1.1096,即1950~1975年,我國平均每5年的人口增長速度10.9%;

(3)P=92420?(1.109)2=113590(萬人),即1985年我國的人口總數(shù)達到11.359億。17第一節(jié)集中趨勢的度量【例7-3】東方信托投資公司某筆投資的年收益率是按復(fù)利計算的,該筆投資的年收益狀況如表7-3所示,請測算該筆投資25年的平均年收益率。18第一節(jié)集中趨勢的度量年收益率/%環(huán)比增長率/%年數(shù)/F3481015103104108110115148102總計-25解:用幾何平均數(shù)求該筆投資的年收益率

XG=[(103%)1?(104%)4?(108%)8?(110%)10?(115%)2]1/25=(7.6504)1/25=108.48%則該筆投資的年平均收益率為8.48%。19第一節(jié)集中趨勢的度量

【例7-4】某汽車公司某年1~12月份生產(chǎn)的平均成本和總成本如表7-4所示。請測算:(1)該公司汽車的月平均生產(chǎn)量;(2)該公司某年汽車的平均生產(chǎn)成本。20第一節(jié)集中趨勢的度量月份平均成本(萬元)生產(chǎn)總成本(億元)12345678910111241.841.442.741.241.643.742.541.641.142.541.641.31421.218632433.914422329.62053.93697.51414.42219.425502329.61858.5總計25613解:(1)每個月的生產(chǎn)總成本除以平均成本,就可以得到該公司汽車的月平均生產(chǎn)量,分別為:34,45,57,35,56,47,87,34,54,60,56,45。(2)通過計算加權(quán)調(diào)和平均數(shù),就可以得到該公司汽車的平均生產(chǎn)成本:即該公司汽車的平均生產(chǎn)成本約為42萬元。21第一節(jié)集中趨勢的度量公共管理探討或調(diào)查所得到的數(shù)據(jù),大都具有隨機變量的性質(zhì)。而對這些隨機變量的描述,僅有集中趨勢的度量是不夠的。集中量數(shù)只描述數(shù)據(jù)的集中趨勢和典型狀況,還不能說明一組數(shù)據(jù)的全貌。對于數(shù)據(jù)變異性即離散趨勢進行度量的一組統(tǒng)計量,稱作差異量數(shù),這些差異量數(shù)有標(biāo)準(zhǔn)差或方差、全距、平均差、四分差及各種百分差等等。假如一組數(shù)據(jù)是產(chǎn)品質(zhì)量檢查的結(jié)果,那么數(shù)據(jù)的變異狀況說明生產(chǎn)是否穩(wěn)定;假如數(shù)據(jù)是測量的結(jié)果,那么變異的狀況說明測量方法是否正確、儀器是否精密;假如數(shù)據(jù)是學(xué)生的成果,那么變異的狀況說明成果是否整齊(而不是凹凸)。22其次節(jié)離散趨勢的度量一、極差極差又稱全距(range),是指總體中最大標(biāo)記值與最小標(biāo)記值之差。用極差反映總體分布的離散程度,特殊簡便。其計算公式為:其中,和分別為數(shù)據(jù)中的極大值和微小值。23其次節(jié)離散趨勢的度量三、平均差平均差(meanabsolutedeviation,M.D.)是離差(樣本值與均值之差)的確定值的平均數(shù),即:對于已分組的頻數(shù)分布(組數(shù)為k)平均差反映全部標(biāo)本數(shù)據(jù)平均的誤差,比極差和四分位差更能全面反映總體的數(shù)據(jù)變動狀況,它的缺點是確定值不適于作進一步的數(shù)學(xué)分析。24其次節(jié)離散趨勢的度量三、方差與標(biāo)準(zhǔn)差方差(variance)也稱變異數(shù)、均方,常用符號

表示;作為總體參數(shù)時,常用符號

表示。它是每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差平方后的均值,即離均差平方后的平均數(shù)。標(biāo)準(zhǔn)差(standarddeviation)即方差的平方根,常用S或SD表示。若用

表示,則是指總體的標(biāo)準(zhǔn)差。25其次節(jié)離散趨勢的度量(1)總體方差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(2)樣本方差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(3)總體標(biāo)準(zhǔn)差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))(4)樣本標(biāo)準(zhǔn)差(未分組的數(shù)據(jù))(已分組的數(shù)據(jù))26其次節(jié)離散趨勢的度量方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好、最常用的指標(biāo)。其值大,說明離散程度大;其值小,說明數(shù)據(jù)比較集中。它基本具備一個良好的差異量數(shù)應(yīng)具備的條件:①反應(yīng)靈敏;②由確定的計算公式嚴密確定;③簡潔計算;④適合代數(shù)運算;⑤受抽樣變動的影響??;⑥簡潔明白,這一點與其他差異量數(shù)比較稍有不足,但其意義還是較明白的。除上述之外,方差還具有可加性特點,它是對一組數(shù)據(jù)中造成各種變異的總和的測量,能利用其可加性分解并確定出屬于不同來源的變異性(如組間、組內(nèi)等)并可進一步說明每種變異對總結(jié)果的影響。27其次節(jié)離散趨勢的度量五、變差系數(shù)變差系數(shù)又稱變異系數(shù)、相對標(biāo)準(zhǔn)差等,通常用符號CV表示,其計算公式為:其中,S為某樣本的標(biāo)準(zhǔn)差;為該樣本的平均數(shù)。變異系數(shù)是一個無量綱的量。變差系數(shù)適于用在比較有不同算術(shù)平均數(shù)或有不同量綱的兩組數(shù)據(jù)的狀況。28其次節(jié)離散趨勢的度量六、離散趨勢度量的實例【例7-5】2012年某高校公共管理學(xué)院MPA報考人數(shù)為311人,缺考2人,其余309人的英語考試成果如表7-5所示,請計算相關(guān)的表征離散趨勢的特征數(shù)。29其次節(jié)離散趨勢的度量302012年某高校公共管理

學(xué)院MPA報考人員

英語成果83.0082.0078.0063.0067.0077.0062.0065.0076.0067.0068.0073.0073.0074.0065.0075.0063.0076.0060.0065.0065.0068.0064.0073.0059.0060.0064.0070.0048.0067.0055.0061.0061.0062.0075.0077.0061.0067.0049.0062.0068.0072.0052.0063.0073.0059.0062.0066.0073.0054.0060.0062.0065.0069.0042.0050.0072.0079.0055.0055.0056.0057.0067.0073.0050.0052.0055.0057.0060.0044.0061.0062.0065.0045.0053.0060.0068.0054.0073.0055.0045.0054.0062.0041.0041.0056.0058.0061.0064.0054.0065.0075.0075.0046.0051.0051.0053.0075.0048.0049.0050.0053.0056.0059.0061.0036.0044.0047.0052.0058.0058.0040.0044.0047.0050.0056.0065.0057.0048.0051.0053.0053.0059.0060.0060.0035.0042.0045.0046.0054.0066.0034.0046.0038.0040.0047.0068.0042.0054.0043.0046.0054.0056.0081.0035.0036.0038.0056.0057.0061.0049.0037.0038.0044.0037.0040.0045.0045.0057.0057.0037.0038.0041.0045.0047.0049.0060.0066.0041.0042.0051.0038.0043.0046.0053.0063.0063.0030.0045.0049.0056.0034.0043.0054.0045.0046.0046.0049.0057.0042.0044.0041.0043.0045.0021.0040.0037.0036.0040.0045.0058.0030.0034.0035.0044.0060.0025.0053.0039.0043.0047.0048.0049.0011.0034.0036.0045.0048.0050.0026.0034.0042.0043.0033.0034.0020.0034.0044.0028.0042.0045.0049.0036.0039.0049.0037.0038.0043.0027.0033.0041.0041.0021.0033.0070.0033.0052.0025.0027.0036.0039.0046.0027.0030.0035.0033.0034.0020.0024.0026.0027.0031.0027.0035.0048.0031.0034.0038.0029.0022.0037.0024.0025.0031.0048.0039.0033.0029.0031.0034.0030.0032.0034.0016.0019.0030.0036.0030.0028.0024.0026.0032.0023.0034.0031.0019.0023.0024.0017.0010.0016.0028.0014.0024.0021.0014.0015.0048.0015.00解:(1)極差:R=最大值-最小值=83-10=73(2)四分位差:

(3)方差和標(biāo)準(zhǔn)差。

31其次節(jié)離散趨勢的度量(4)變差系數(shù)。32其次節(jié)離散趨勢的度量集中趨勢和離散趨勢是數(shù)據(jù)分布的兩個重要特征,但要全面了解數(shù)據(jù)分布的特點,還須要知道數(shù)據(jù)分布的形態(tài)是否對稱、偏斜的程度以及分布的扁平程度等。偏斜度和峰度就是對這些分布特征的描述。偏斜度是對數(shù)據(jù)分布的偏移方向和程度所作的進一步描述;峰度是用來對數(shù)據(jù)分布的扁平程度所做的描述。對于偏斜程度的描述用偏斜度系數(shù);扁平程度的描述用峰度系數(shù)。33第三節(jié)偏斜度與峰度的度量一、動差法動差又稱矩,原是物理學(xué)上用以表示力與力臂對重心關(guān)系的術(shù)語,這個關(guān)系和統(tǒng)計學(xué)中變量與權(quán)數(shù)對平均數(shù)的關(guān)系在性質(zhì)上很類似,所以統(tǒng)計學(xué)也用動差來說明頻數(shù)分布的性質(zhì)。一般地說,取變量的值為中點,全部變量值與之差的K次方的平均數(shù)稱為變量X關(guān)于的K階動差。用公式表示為:34第三節(jié)偏斜度與峰度的度量當(dāng)

時,即變量以原點為中心,上式稱為K階原點動差,用大寫英文字母M表示。一階原點動差:

,即算術(shù)平均數(shù);二階原點動差:

,即平方平均數(shù);三階原點動差:

,等等。當(dāng)

時,即變量以算術(shù)平均數(shù)為中心,上式稱為K階中心動差,用小寫英文字母m表示。一階中心動差:

;二階中心動差:

;三階中心動差:

;等等。35第三節(jié)偏斜度與峰度的度量二、偏斜度偏斜度是對統(tǒng)計數(shù)據(jù)分布偏斜方向及程度的度量。統(tǒng)計數(shù)據(jù)的頻數(shù)分布有的是對稱的,有的是不對稱的,即呈現(xiàn)偏態(tài)。在偏態(tài)的分布中,又有兩種不同的形態(tài),即左偏態(tài)和右偏態(tài)。度量分布偏斜的程度,可計算偏斜度。接受動差法計算偏斜度系數(shù)是用變量的三階中心動差與進行對比,計算公式為:當(dāng)分布對稱時,變量的三階中心動差由于離差三次方后正負相互抵消而取得0值,則;當(dāng)分布不對稱時,正負離差不能抵消,就形成正的或負的三階中心動差。當(dāng)為正值時,表示正偏離差值比負偏離差值要大,可以推斷為正偏態(tài)或右偏態(tài);反之,當(dāng)為負值時,表示負偏離差值比正偏離差值要大,可以推斷為負偏態(tài)或左偏態(tài)。越大,表示偏斜的程度就越大。由于三階中心動差含有計量單位,為消退計量單位的影響,就用去除,使其轉(zhuǎn)化為相對數(shù)。同樣的,的確定值越大,表示偏斜的程度就越大。36第三節(jié)偏斜度與峰度的度量三、峰度峰度是用來衡量統(tǒng)計數(shù)據(jù)分布的集中程度或分布曲線的尖峭程度的指標(biāo)。計算公式為:當(dāng)峰度時,表示分布的形態(tài)比正態(tài)分布更尖更高,這意味著分布比正態(tài)分布更集中在平均數(shù)四周,這樣的分布稱為尖峰分布;時,分布為正態(tài)分布;時,表示分布比正態(tài)分布更扁平,意味著分布比正態(tài)分布更分散,這樣的分布稱為扁平分布。37第三節(jié)偏斜度與峰度的度量一、SPSS簡介社會科學(xué)統(tǒng)計軟件包(statisticalpackageforthesocialscience,SPSS)是世界上著名的統(tǒng)計分析軟件之一。它由美國斯坦福高校的三位探討生于1968年研制,同年成立了SPSS公司,并于1975年在芝加哥組建了SPSS總部。20世紀80年頭以前,SPSS統(tǒng)計軟件主要應(yīng)用于企事業(yè)單位。1984年,SPSS總部首先推出了世界上第一個統(tǒng)計分析軟件微機版本SPSS/PC+,開創(chuàng)了SPSS微機系列產(chǎn)品的開發(fā)方向,極大地擴充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域。隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”,標(biāo)記著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。38第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回來分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計過程,比如回來分析中又分線性回來分析、曲線估計、Logistic回來、Probit回來、加權(quán)估計、兩階段最小二乘法、非線性回來等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。39第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用二、SPSS的基本操作(一)啟動SPSS單擊Windows的[起先]按鈕,在[全部程序]菜單項[IBMSPSSStatistics]中找到[IBMSPSSStatistics20]并單擊(圖7-3)。40第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(二)打開SPSS的主窗口。SPSS啟動成功后,打開SPSS的主窗口[DataView]。SPSS的主窗口名為IBMSPSSStatisticsDataEditor(數(shù)據(jù)編輯窗口),如圖7-4所示。41第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用在SPSS的主窗口的菜單欄中,共有12個選項:(1)File:文件管理菜單,有關(guān)文件的調(diào)入、存儲、顯示和打印等;(2)Edit:編輯菜單,有關(guān)文本內(nèi)容的選擇、拷貝、剪貼、找尋和替換等;(3)View:視圖菜單,運用“視圖”菜單可顯示或隱藏狀態(tài)行、工具欄、網(wǎng)絡(luò)線、值標(biāo)簽和變更字體等;(4)Data:數(shù)據(jù)管理菜單,有關(guān)數(shù)據(jù)變量定義、數(shù)據(jù)格式選定、視察對象的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接、匯總等;(5)Transform:數(shù)據(jù)轉(zhuǎn)換處理菜單,有關(guān)數(shù)值的計算、重新賦值、缺失值替代等;(6)Analyze:統(tǒng)計菜單,有關(guān)一系列統(tǒng)計方法的應(yīng)用;(7)DirectMarketing:直銷菜單,有關(guān)了解顧客、改進行銷活動等;(8)Graphs:作圖菜單,有關(guān)統(tǒng)計圖的制作;(9)Utilities:用戶選項菜單,有關(guān)叮囑說明、字體選擇、文件信息、定義輸出標(biāo)題、窗口設(shè)計等;(10)Window:窗口管理菜單,有關(guān)窗口的排列、選擇、顯示等;(11)Add-ons:附加程序菜單,有關(guān)輸出管理系統(tǒng)限制、數(shù)據(jù)文件注釋、定義和運用變量集、運行腳本、定制對話框等;(12)Help:求助菜單,有關(guān)幫助文件的調(diào)用、查詢、顯示等。42第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(三)定義變量

打開[VariableView]進入變量定義窗口,對變量進行定義。變量定義包括11個方面的內(nèi)容,分別為:[Name],[Type],[Width],[Decimals],[Label],[Values],[Missing],[Columns],[Align],[Measure],[Role],如圖7-5所示。43第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(1)[Name]:定義變量名。要求定義變量名,不能超過8個字符(中文和英文均可以),但不能與SPSS軟件運算符相同的一些字符串,如all,and,by,not,or,to,with,eq,ge,gt,le,lt,ne;“(”,“)”,“/”,“?”等符號。(2)[Type]:定義變量類型。SPSS的主要變量類型有:Numeric(標(biāo)準(zhǔn)數(shù)值型)、Comma(帶逗點的數(shù)值型)、Dot(逗點作小數(shù)點的數(shù)值型)、ScientificNotation(科學(xué)記數(shù)法)、Date(日期型)、Dollar(帶美元符號的數(shù)值型)、CustomCurrency(自定義型)、String(字符型)、RestrictedNumeric(Integerwithleadingzeros)(受限數(shù)值,值限于非負整數(shù)的變量,在顯示值時,填充先導(dǎo)0以達到最大變量寬度)。(3)[Width]:設(shè)置變量長度。設(shè)置數(shù)值變量的長度,當(dāng)變量為日期型時無效。(4)[Decimals]:設(shè)置變量小數(shù)點位數(shù)。設(shè)置數(shù)值變量的小數(shù)點位數(shù),當(dāng)變量為日期型時無效。(5)[Label]:設(shè)置變量標(biāo)簽。變量標(biāo)簽是對變量名的進一步描述,變量只能由不超過8個字符組成,8個字符常常不足以表示變量的含義。而變量標(biāo)簽可長達120個字符,變量標(biāo)簽對大小寫敏感,顯示時與輸入值完全一樣,須要時可用變量標(biāo)簽對變量名的含義加以說明。(6)[Values]:設(shè)置變量值標(biāo)簽。變量值標(biāo)簽是對變量值進一步說明,主要針對名義(nominal)變量和等級(ordinal)變量。單擊[Values]相應(yīng)單元,在如圖7-7所示的對話框中進行設(shè)置。44第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)用(7)[Missing]:缺失值的定義方式。SPSS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。在數(shù)據(jù)長方形中任何空的數(shù)字單元都被認為系統(tǒng)缺失值,用點號(·)表示。SPSS可以指定那些由于特殊緣由造成的信息缺失值,然后將它們標(biāo)為用戶缺失值,統(tǒng)計過程識別這種標(biāo)識,帶有缺失值的觀測被特殊處理。默認值為[None]。單擊[Values]相應(yīng)單元中的按鈕,可變更缺失值定義方式。(8)[Column]:設(shè)置變量的顯示寬度。設(shè)置在屏幕上變量的顯示寬度,默認為8位,也可以依據(jù)需求自己設(shè)置。(9)[Align]:設(shè)置變量顯示的對齊方式。選擇變量值顯示時的對齊方式:[Left](左對齊),[Right](右對齊),[Center](居中對齊)。(10)[Measure]:設(shè)置變量的測量尺度。按測量精度的要求,SPSS將測量變量分為三大類分類變量[Nominal]、依次變量[Ordinal]、等距變量和等比變量[Scale]。等距變量和等比變量常常不加以區(qū)分。假如變量為定距變量或定比變量,則在[Measure]相應(yīng)單元的下拉列表中選擇[Scale];假如變量為定序變量,則選擇[Ordinal];假如變量為定類變量,則選擇[Nominal]。(11)[Role]:設(shè)置變量的角色。支配變量的角色:[Input](變量用作輸入)、[Target](變量用作輸出或目標(biāo))、[Both](變量同時用作輸入和輸出)、[None](變量沒有角色支配)、[Partition](分區(qū),用于將數(shù)據(jù)劃分為單獨的訓(xùn)練、檢驗和驗證樣本)、[Split](拆分,包括以便與IBMSPSSModeler相互兼容,具有此角色的變量不會在IBMSPSSStatistics中用作拆分文件變量)。45第四節(jié)SPSS在描述統(tǒng)計中的應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論