描述性統(tǒng)計(jì)分析_第1頁
描述性統(tǒng)計(jì)分析_第2頁
描述性統(tǒng)計(jì)分析_第3頁
描述性統(tǒng)計(jì)分析_第4頁
描述性統(tǒng)計(jì)分析_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、.,描述性統(tǒng)計(jì)分析,【學(xué)習(xí)提要】 對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)描述是統(tǒng)計(jì)分析中最基本的工作。對于整理好的數(shù)據(jù),通過描述性統(tǒng)計(jì)分析,可以挖掘出很多統(tǒng)計(jì)量的特征。SPSS軟件中,描述性統(tǒng)計(jì)分析功能主要集中在“Descriptive Statistics”菜單。具體包括5個(gè)過程:Frequencies過程、Descriptives過程、Explore過程、Crosstabs過程和Ratio過程。,.,4.1 描述統(tǒng)計(jì)量 常見的描述性統(tǒng)計(jì)量主要包括以下3類: 描述變量集中趨勢的統(tǒng)計(jì)量、描述變量分布 情況的統(tǒng)計(jì)量、描述變量離散程度的統(tǒng)計(jì) 量。 通常,綜合這三類統(tǒng)計(jì)量就能夠極為準(zhǔn) 確和清晰的把握數(shù)據(jù)的分布特點(diǎn)。,.,描

2、述變量集中趨勢的統(tǒng)計(jì)量: 均值Mean:表示變量值的平均水平 中位數(shù)Median:一組數(shù)據(jù)中處于最中間位置的數(shù) 眾數(shù)Mode:一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù) 和Sum:某變量的所有變量值之和,.,描述變量分布情況的統(tǒng)計(jì)量 偏度Skewness:描述變量分布的對稱程度和方 向。偏度為0表示對稱,大于0表示右偏,小于0表 示左偏 峰度Kurtosis:描述變量分布的陡峭程度。峰度為 0表示陡峭程度和正態(tài)分布相同,大于0表示比正 態(tài)分布陡峭,小于0表示比正態(tài)分布平緩,.,描述變量離散程度的統(tǒng)計(jì)量 標(biāo)準(zhǔn)差Std.deviation:描述變量關(guān)于均值的偏離程度 方差Variance:標(biāo)準(zhǔn)差的平方 極大值Ma

3、ximum:某變量所有取值的最大值 極小值Minimum:某變量所有取值的最小值 全距Range:某變量極大值與極小值之差 均值的標(biāo)準(zhǔn)誤差S.E.mean:均值的標(biāo)準(zhǔn)誤差,.,在描述性統(tǒng)計(jì)分析中,Descriptives過程是連 續(xù)資料統(tǒng)計(jì)描述應(yīng)用最多的一個(gè)過程,他可對變 量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng) 的統(tǒng)計(jì)指標(biāo)。,.,【界面介紹】 選擇菜單【Analyze】【Descriptive Statistics】【Descriptives】,進(jìn)入基本描述性統(tǒng)計(jì)量的分析界面,出現(xiàn)如圖所示的窗口。,., 在Variables(s)框定義要分析的數(shù)值型變量,可同時(shí)選擇多 個(gè)變量。 若需將原始

4、數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評分存為新變量,則選擇Save standardized values as variables選項(xiàng)。 單擊【Options】按鈕指定計(jì)算哪些基本描述性統(tǒng)計(jì)量,出 現(xiàn)如圖所示的窗口。,.,【實(shí)驗(yàn)案例】 例4-1 測量20臺(tái)液晶顯示器的重量,數(shù)據(jù)見4-1-1.sav,對其進(jìn)行 描述性統(tǒng)計(jì)分析。,.,4.2 頻數(shù)分布表分析 頻數(shù)分析統(tǒng)計(jì)的是每一組中觀測點(diǎn)的個(gè)數(shù),而不是 考慮其實(shí)際取值。 通過頻數(shù)分析能夠了解變量取值的情況,對于把握 數(shù)據(jù)的分布特征非常有用。當(dāng)某變量的自然取值是局限 在有限的幾個(gè)數(shù)值中,則頻數(shù)分析就是統(tǒng)計(jì)該變量在各 個(gè)取值點(diǎn)的個(gè)數(shù)分布情況;如果某變量的取值是在某范 圍內(nèi)

5、的離散值,則需要將其取值區(qū)域劃分為幾個(gè)取值區(qū) 間,頻數(shù)分析就是統(tǒng)計(jì)該變量在各個(gè)取值區(qū)間觀測點(diǎn)個(gè) 數(shù)的分布情況。,.,【界面介紹】 選擇菜單【Analyze】【Descriptive Statistics】 【Frequencies】,進(jìn)入頻數(shù)分析的分析界面,出現(xiàn)如圖所 示的窗口。 將若干頻數(shù)分析變量選擇到Variables(s)框中;選擇Display frequency tables復(fù)項(xiàng)表示在結(jié)果中輸出頻數(shù)表。,., 單擊【Statistics】按鈕后彈出Statistics子對話框。,., 單擊【Charts】按鈕后彈出Charts子對話框。,., 單擊【Format】按鈕,彈出Forma

6、t子對話框。該對話框用于定義輸出頻數(shù)表的格式,在實(shí)際中,我們一般采用默認(rèn)格式。,.,例4-2 已知有某地110名10歲女生身高數(shù)據(jù),數(shù)據(jù)見文件4-2-1.sav ,請編制頻數(shù)表。,.,4.3 探索性分析 Explore過程可對變量進(jìn)行更為深入詳盡的描述性統(tǒng) 計(jì)分析,主要用于對資料的性質(zhì)、分布特點(diǎn)等完全不清楚 時(shí),故又稱之為探索性分析。 它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他 特征的文字與圖形描述,如莖葉圖、箱圖等,顯得更加詳 細(xì)、全面,有助于用戶制定繼續(xù)分析的方案。,.,【界面介紹】 選擇菜單【Analyze】【Descriptive Statistics】【Explore】,進(jìn)入探

7、索性分析界面,出現(xiàn)如圖所示的窗口。,.,(2)單擊【Statistics】按鈕,彈出Statistics子對話框,如圖 所示。該項(xiàng)用于選擇所需要的描述統(tǒng)計(jì)量。,.,(3)單擊【Plots】按鈕,彈出Plots子對話框。該項(xiàng)用于選擇 所需要的統(tǒng)計(jì)圖。,.,(4 )單擊【Options】按鈕,在彈出的子對話框中選擇對 缺失值的處理方式,可以是不分析有任一缺失值的記錄 (Exclude cases listwise)、不分析計(jì)算某統(tǒng)計(jì)量時(shí)有缺 失值的記錄(Exclude cases pairwise),或報(bào)告缺失值 (Report values)。,.,例4-3 已知有某地城市和農(nóng)村各55名10歲女

8、生身高數(shù) 據(jù),數(shù)據(jù)見文件4-2-1.sav,請利用Explore過程分組分 析。,.,4.4 列聯(lián)表分析 通過頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況。 在實(shí)際分析過程中,不僅要了解單變量的分布特征,還 要分析多個(gè)變量不同取值下的分布,掌握多變量的聯(lián)合 分布特征,進(jìn)而分析變量之間的相互影響和關(guān)系。當(dāng)問 題涉及多個(gè)變量時(shí),采用單純的頻數(shù)分析方法顯然不 夠,這時(shí),我們需要借助交叉分組下的頻數(shù)分析,又稱 為列聯(lián)表分析。,.,列聯(lián)表分析的主要任務(wù)有兩個(gè): 第一,根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表。交叉列聯(lián)表是兩個(gè)或多個(gè)以上變量交叉分組后形成的頻數(shù)分布表。 第二,在交叉列聯(lián)表的基礎(chǔ)上,分析兩兩

9、變量之間是否具有獨(dú)立性或一定的相關(guān)性。對交叉列聯(lián)表中的行變量和列變量之間關(guān)系進(jìn)行分析是列聯(lián)表分析的第二個(gè)任務(wù)。在列聯(lián)表基礎(chǔ)上做進(jìn)一步分析,可以得到行變量和列變量之間是否有聯(lián)系、聯(lián)系的緊密程度如何等更深層次的信息。,.,【界面介紹】 選擇菜單【Analyze】【Descriptive Statistics】【Crosstabs】,進(jìn)入列聯(lián)表分析界面。,.,【實(shí)驗(yàn)案例】 例4-4 調(diào)查339名45歲以上吸煙習(xí)慣與患肺癌的關(guān)系,數(shù) 據(jù)見4-4-1.sav。試問吸煙者與不吸煙者患肺癌的概率是 否有所不同。,.,4.5 相對比描述 相對比描述用于對兩變量間變量值對比變化的 描述分析,適用于定距型變量。在

10、實(shí)際問題中,研究 者有時(shí)除了希望了解變量自身的統(tǒng)計(jì)特征外,還希望 得到兩個(gè)變量相對比之間的統(tǒng)計(jì)描述。通常,這可以 通過對兩個(gè)變量做除法形成一個(gè)新變量,然后分析新 變量的統(tǒng)計(jì)特征來得到(如均值、中位數(shù)、標(biāo)準(zhǔn)差、 全距等)。SPSS的Ratio過程除了能夠完成上述分析 外,還提供了其他相對比描述指標(biāo),大致屬于集中趨 勢描述指標(biāo)(Central Tendency)和離散程度描述指標(biāo) (Dispersion)的范疇。,.,指標(biāo)的具體含義如下: 加權(quán)比例均值(Weighted mean ) 加權(quán)比例均值屬于集中趨勢描述指標(biāo),是兩變量均值的比。 平均絕對離差(AAD,Average Absolute Di

11、spersion) AAD用于對比率變量離散程度的描述。 式中, 是比率數(shù), M 是比率變量的中位數(shù)。,.,離散系數(shù)(COD,Coefficient of Dispersion) COD也用于對比率變量離散程度的描述,其數(shù)學(xué)定義為: 相關(guān)價(jià)格微分(PRD,Price-related Differential) PRD也用于對比率變量離散程度的描述,是比率均值與加權(quán)比率均值的比。,.,變異系數(shù)(COV,Coefficient of Variation) COV用于對比率變量離散程度的描述,分為基于均值 的變異系數(shù)(Mean centered COV)和基于中位數(shù)的變異 系數(shù)(Median centered COV)?;诰档淖儺愊禂?shù)是通 常意義下的變異系數(shù),是標(biāo)準(zhǔn)差除以均值;基于中位數(shù)的 變異系數(shù)數(shù)學(xué)定義為:,.,【界面介紹】 選擇菜單【Analyze】【Descriptive Statistics】【Ratio】,進(jìn)入比率分析界面,出 現(xiàn)所示的窗口。,., 將相對比中作分子的變量選入Numerator框中。 將相對比中作分母的變量選入Denominator框中。 將分組變量選入Group Variable框中。選擇Sort by group variables選項(xiàng)表示選擇分組變量的排序方式。選擇Display result選項(xiàng)表示顯示結(jié)果。選擇Sa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論