版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 計(jì)量資料的統(tǒng)計(jì)描述描述性統(tǒng)計(jì)分析是進(jìn)行統(tǒng)計(jì)分析的第一步,做好這一步是正確進(jìn)行統(tǒng)計(jì)推斷的先決條件。計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)和方法要緊有:1、集中趨勢(shì)指標(biāo)(Central Tendency):包括均數(shù)、幾何均數(shù)、中位數(shù)等。其中均數(shù)適用于正態(tài)分布和對(duì)稱分布資料;幾何均數(shù)適用于對(duì)數(shù)正態(tài)分布和呈等比的數(shù)據(jù)資料;中位數(shù)適合于所有分布類型的資料,但在實(shí)際中,中位數(shù)要緊應(yīng)用于偏態(tài)分布資料、分布不明資料和開(kāi)口資料。2、離散趨勢(shì)指標(biāo)(Dispersion):包括全距、四分位數(shù)間距、 方差、標(biāo)準(zhǔn)差、變異系數(shù)、標(biāo)準(zhǔn)誤等。方差、標(biāo)準(zhǔn)差用于正態(tài)分布資料,四分位數(shù)間距用于偏態(tài)分布資料,變異系數(shù)用于度量單位不同和均數(shù)相差
2、懸殊的資料,標(biāo)準(zhǔn)誤用于反映樣本均數(shù)的離散程度,講明均數(shù)抽樣誤差大小。SPSS的許多模塊均可完成描述性統(tǒng)計(jì)分析,但專門為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在Descriptive Statistics菜單中,最常用的是列在最前面的四個(gè)過(guò)程:Frequencies過(guò)程:產(chǎn)生頻數(shù)表;按要求給出某百分位數(shù)。對(duì)計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料的描述都適用Descriptives過(guò)程:進(jìn)行一般性的統(tǒng)計(jì)描述,用于服從正態(tài)分布的資料,計(jì)算產(chǎn)生均數(shù)、標(biāo)準(zhǔn)差等;Explore過(guò)程:用于對(duì)數(shù)據(jù)概況不清時(shí)的探究性分析;Crosstabs過(guò)程:完成計(jì)數(shù)資料和等級(jí)資料的統(tǒng)計(jì)描述和一般的統(tǒng)計(jì)檢驗(yàn),我們常用的X2 檢驗(yàn)也在其中完成。本
3、次實(shí)習(xí)練習(xí)前3個(gè)過(guò)程:Frequencies過(guò)程,Descriptives過(guò)程,Explore過(guò)程。Crosstabs過(guò)程在X2 檢驗(yàn)實(shí)習(xí)講述。Frequencies過(guò)程案例:某地101例健康男子血清總膽固醇值測(cè)定結(jié)果如下,請(qǐng)繪制頻數(shù)表、直方圖,計(jì)算均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)CV、中位數(shù)M、p2.5和p97.5。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50
4、4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40
5、4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05一、建立數(shù)據(jù)文件1、定義變量:在數(shù)據(jù)窗口,點(diǎn)擊Variable View ,定義一個(gè)變量,變量名(Name)“x”,類型(Type)“數(shù)值(Numeric)”,寬度(Width)8,小數(shù)位數(shù)(Decimals)2,變量標(biāo)簽(Label):“血清總膽固醇”。(2)輸入數(shù)據(jù):二、求最大值、最小值、全距(R),確定組距和組段 由于SPSS給出精細(xì)的頻數(shù)分布表(列出每個(gè)觀看值的頻數(shù)),不能指定組距和組段,需要人工制定,故求出組距,確定組距和組段,對(duì)數(shù)據(jù)重新編碼后在做頻數(shù)分析Analyz
6、e=Descriptive Statistics=Descriptives在Variable(s)框選入血清總膽固醇(x),= Options,點(diǎn)擊Range旁邊的復(fù)選框,=Continue結(jié)果輸出資料的最大值是7.22,最小值是2.70,全距是4.52。則頻數(shù)表的組距 I=R/10=0.452,取0.5。第1組段的下限取2.7,最后一個(gè)組段是7.27.7,共分10個(gè)組段。三、對(duì)原始數(shù)據(jù)進(jìn)行分組依照上述劃分的組段,用Recode命令對(duì)數(shù)據(jù)進(jìn)行分組。操作方法:Analyze=Transform=Recode= Into Different Variables在Numeric Variable -
7、 Output 選入 X ,在 Output Vable 窗口的Nane對(duì)話框中填入X1(新變量名),在Label框中添入“血清總膽固醇分組”(對(duì)x1進(jìn)行標(biāo)簽)。= Change = Old and New Values 在Old Value 框中,選擇Range , 分不輸入每個(gè)組段血清總膽固醇值的范圍;在New Valuable 中,在Value 框中輸入每個(gè)組段血清總膽固醇新的值(分不用110代表)。= Continue= OK 運(yùn)行后產(chǎn)生新的變量x1, 其值110,最好對(duì)x1的值定義標(biāo)簽,以便在統(tǒng)計(jì)分析的結(jié)果中明確1-10所對(duì)應(yīng)的數(shù)值范圍。四、對(duì)原始數(shù)據(jù)(變量X)進(jìn)行Frequenci
8、es過(guò)程分析Analyze=Descriptive Statistics=Frequencies Variables框:選入X 單擊Statistics鈕: 選中Mean、Std.deviation、Median復(fù)選框 單擊Percentiles:輸入2.5:?jiǎn)螕鬉dd:輸入97.5:?jiǎn)螕鬉dd: 單擊Continue鈕 單擊Charts鈕: 選中Histograms (繪制直方圖,若選擇了 With normal curve 則輸出帶有正態(tài)曲線的直方圖) 單擊Continue鈕 單擊OK得出結(jié)果后手工計(jì)算出CV。結(jié)果如下:最上方為表格名稱,左上方為分析變量名,可見(jiàn)樣本量N為101例,缺失值0
9、例,均數(shù)Mean=4.6995,中位數(shù)Median=4.6100,標(biāo)準(zhǔn)差STD=0.8616,P2.5=3.0455,P97.5=6.4565。偏度系數(shù)(Skewness)0.251, 偏度系數(shù)標(biāo)準(zhǔn)誤(Std.Error ofSkewnes) =0.240,峰度系數(shù)(Kurtosis)=0.101, 峰度系數(shù)標(biāo)準(zhǔn)誤(Std.Error of Kurtosis)=0.476。 偏度系數(shù)和峰度系數(shù)除各自的標(biāo)準(zhǔn)誤即為u值,若都小于1.28,則能夠認(rèn)為資料服從正態(tài)分布。該資料這兩個(gè)值分不為1.05和0.212,能夠認(rèn)為該資料服從正態(tài)分布。系統(tǒng)對(duì)變量x作頻數(shù)分布表(列出每個(gè)值的頻數(shù),由于表太長(zhǎng),此處只列
10、出了開(kāi)頭部分),Vaild右側(cè)為原始值,F(xiàn)requency為頻數(shù),Percent為各組頻數(shù)占總例數(shù)的百分比(包括缺失記錄在內(nèi)),Valid percent為各組頻數(shù)占總例數(shù)的有效百分比,Cum Percent為各組頻數(shù)占總例數(shù)的累積百分比。下圖繪制的直方圖,左側(cè)的圖形不添加正態(tài)曲線,右側(cè)的圖形添加有正態(tài)曲線,可見(jiàn)這資料的分布和正態(tài)曲線比較吻合。五、對(duì)重新分組的數(shù)據(jù)(X1)進(jìn)行Frequencies過(guò)程分析Analyze=Descriptive Statistics=Frequencies Variables框:選入X1 單擊Charts鈕: 選中Bar charts (輸出直條圖)單擊Cont
11、inue鈕 單擊OK結(jié)果輸出:對(duì)重新分組后的數(shù)據(jù)X1作頻數(shù)分析,得出我們所熟悉的頻數(shù)表,其中組段6.7的頻數(shù)為 0。由于x1的數(shù)據(jù)差不多重新定義為110,故不宜計(jì)算均數(shù)、標(biāo)準(zhǔn)差等指標(biāo),也不宜計(jì)算百分位數(shù)。若要計(jì)算這些指標(biāo),應(yīng)使用原始數(shù)據(jù)計(jì)算,見(jiàn)上例結(jié)果。結(jié)果輸出了直條圖,能直觀反映出各個(gè)組段的頻數(shù)(注:連續(xù)性頻數(shù)分布資料應(yīng)該繪制直方圖,但在那個(gè)地點(diǎn)選擇繪制直方圖效果不行)。Descriptives過(guò)程Descriptives過(guò)程是連續(xù)性資料統(tǒng)計(jì)描述應(yīng)用最多的一個(gè)過(guò)程,他可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo)。這和其他過(guò)程相比并無(wú)不同,但該過(guò)程還有個(gè)專門功能確實(shí)是可將原始數(shù)據(jù)
12、轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)評(píng)分值并以變量的形式存入數(shù)據(jù)庫(kù)供以后分析。案例1:上述對(duì)101例血清膽固醇值進(jìn)行統(tǒng)計(jì)描述1、建立數(shù)據(jù)文件(見(jiàn)前面)2、統(tǒng)計(jì)分析過(guò)程(1)Analyze=Descriptive Statistics=Descriptives(2)在Variable(s)框選入血清總膽固醇(x),(3)單擊 Options按鈕;(4)選中Mean、Std.Devivation、Minimum、Maximum 、Range、Variance、 S.E.mean旁邊的復(fù)選框(計(jì)算均數(shù)、標(biāo)準(zhǔn)差、方差、最大值、最小值及全距)(5)單擊Continue 按鈕;(6)單擊 OK。結(jié)果案例2110名7歲男童身高頻
13、數(shù)分布資料如下表,對(duì)該資料進(jìn)行統(tǒng)計(jì)描述。 身高 110 112 114 116 118 120 122 124 126 128 130 132 134136組中值 111 113 115 117 119 121 123 125 127 129 131 132 135頻數(shù) 1 3 9 9 15 18 21 14 10 4 3 2 1上表為計(jì)量資料的頻數(shù)表,描述性統(tǒng)計(jì)分析方法如下:【操作方法】1、建立數(shù)據(jù)文件設(shè)立兩個(gè)變量:分析變量High(輸入身高的組中值),頻數(shù)變量F,輸入各個(gè)組段的頻數(shù)。 HighF111111331159:2、統(tǒng)計(jì)分析過(guò)程(1)Data = Weight Cases. = W
14、eight Cases by =Frequency Variable框中選入:F (按F對(duì)數(shù)據(jù)進(jìn)行加權(quán))=OK (2)Analyze=Descriptive Statistics=Frequency在Variable(s)框選入x,(3)單擊 Statistic按鈕;選中Quartile 、Mean、Median、Std.Devivation、Minimum、Maximum 、Range、Variance、S.E.mean 、Skewness、Kurtosis旁邊的復(fù)選框(四分位間距、計(jì)算均數(shù)、標(biāo)準(zhǔn)差、方差、最大值、最小值及全距、偏度系數(shù)、峰度系數(shù)及其標(biāo)準(zhǔn)誤) 選種 Value are gro
15、up midpoimt (講明數(shù)據(jù)是頻數(shù)表資料,同時(shí)使用組中值進(jìn)行計(jì)算)(4)單擊Continue 按鈕;(5)單擊Charts. 按鈕; 選種 Histograms(繪制直方圖);(6)單擊Continue 按鈕;(7)單擊 OK。結(jié)果Explore過(guò)程Explore過(guò)程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析,要緊用于對(duì)資料的性質(zhì)、分布特點(diǎn)等完全不清晰時(shí)進(jìn)行分析,故又稱之為探究性分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,如莖葉圖、箱式圖等,顯得更加詳細(xì)、全面,有助于用戶制定接著分析的方案。案例:上述對(duì)101例血清膽固醇值進(jìn)行Explore過(guò)程1. Anal
16、yze=Descriptive Statistics=Explore2. 在Dependent List:框:選入X 3. 單擊Statistics鈕: 選中M-Estimator、Outlier復(fù)選框(Descriptives 為默認(rèn)選擇項(xiàng)) 4. 單擊Continue鈕 5. 單擊Plots鈕: 選中Normality Plots With tests (繪制QQ正態(tài)概率圖和趨勢(shì)QQ正態(tài)概率圖) 6. 單擊Continue鈕 7. 單擊OK結(jié)果:首先是例行的處理記錄缺失值情況報(bào)告,可見(jiàn)101例均為有效值。上表詳細(xì)列出了常用的描述統(tǒng)計(jì)量,假如有標(biāo)準(zhǔn)誤也會(huì)列出(如偏度和峰度系數(shù))。其輸出內(nèi)容的
17、統(tǒng)計(jì)量,從上到下依次是:均數(shù)(及其標(biāo)準(zhǔn)誤)、均數(shù)95%可信區(qū)間的下限和上限值、去除5%極端值后的均數(shù)、中位數(shù)、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位數(shù)間距、偏度系數(shù)(及標(biāo)準(zhǔn)誤)、峰度系數(shù)(及標(biāo)準(zhǔn)誤)。上表為M統(tǒng)計(jì)量,列出了四種M統(tǒng)計(jì)結(jié)果:Huber、Tukey、Hampel、Andrew,這四個(gè)結(jié)果專門接近,且與均數(shù)相差不大。這些結(jié)果講明該數(shù)據(jù)分布偏性不大,均數(shù)能夠代表數(shù)據(jù)的集中趨勢(shì)。上表列出最大和最小5個(gè)值及其記錄號(hào),這些值能夠看作極端值(Extreme value)。上表為正態(tài)性檢驗(yàn)結(jié)果,統(tǒng)計(jì)量為0.072,P值為0.200,能夠認(rèn)為該資料服從正態(tài)分布。血清總膽固醇 Stem-and-
18、Leaf Plot Frequency Stem & Leaf 1.00 2 . 7 8.00 3 . 00123334 9.00 3 . 556689999 24.00 4 . 000001111222333333344444 25.00 4 . 5555556666677777777788899 17.00 5 . 01111111222333334 9.00 5 . 556778889 6.00 6 . 112333 1.00 6 . 5 1.00 Extremes (=7.2)Stem width: 1.00 Each leaf: 1 case(s)以上是莖葉圖,整數(shù)位為莖,小數(shù)位為葉。如此能夠特不直觀的看
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年查對(duì)制度、手術(shù)安全核查制度考核試題(附答案)
- 護(hù)理人員值班制度
- 2025年網(wǎng)絡(luò)安全工程師認(rèn)證考試試卷及答案詳解
- 金融監(jiān)管的自動(dòng)化與智能化
- 城市文化空間的協(xié)同演化研究
- 幼兒園擴(kuò)建工程預(yù)算及進(jìn)度計(jì)劃
- 初中九年級(jí)道德與法治:我國(guó)生態(tài)環(huán)境現(xiàn)狀與挑戰(zhàn)教學(xué)方案
- 行業(yè)人才培養(yǎng)方案及職能分析
- 電子化學(xué)品行業(yè)環(huán)保調(diào)查分析
- 一年級(jí)語(yǔ)文拼音識(shí)字訓(xùn)練冊(cè)
- 2025大模型安全白皮書(shū)
- 2026國(guó)家國(guó)防科技工業(yè)局所屬事業(yè)單位第一批招聘62人備考題庫(kù)及1套參考答案詳解
- 工程款糾紛專用!建設(shè)工程施工合同糾紛要素式起訴狀模板
- 2026湖北武漢長(zhǎng)江新區(qū)全域土地管理有限公司招聘3人筆試備考題庫(kù)及答案解析
- 110(66)kV~220kV智能變電站設(shè)計(jì)規(guī)范
- (正式版)DB44∕T 2784-2025 《居家老年人整合照護(hù)管理規(guī)范》
- 2025年美國(guó)心臟病協(xié)會(huì)心肺復(fù)蘇和心血管急救指南(中文完整版)
- 1、湖南大學(xué)本科生畢業(yè)論文撰寫(xiě)規(guī)范(大文類)
- 基于多源數(shù)據(jù)融合的深圳市手足口病時(shí)空傳播模擬與風(fēng)險(xiǎn)預(yù)測(cè)模型構(gòu)建及應(yīng)用
- 2025年江西公務(wù)員考試(財(cái)經(jīng)管理)測(cè)試題及答案
- 局部麻醉課件
評(píng)論
0/150
提交評(píng)論