連續(xù)變量的統(tǒng)計描述與參數(shù)估計_第1頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計_第2頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計_第3頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計_第4頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

連續(xù)變量的統(tǒng)計描述與參數(shù)估計演示文稿第1頁,共36頁。(優(yōu)選)連續(xù)變量的統(tǒng)計描述與參數(shù)估計第2頁,共36頁。參數(shù)和統(tǒng)計量◆參數(shù):刻畫總體特征的指標(biāo)稱為總體參數(shù)。

用來確定某一分布的特征;如總體均數(shù),總體分布

往往是已知的◆統(tǒng)計量:刻畫樣本特征的統(tǒng)計描述指標(biāo)稱為統(tǒng)計量。由觀察資料計算出來的量;可以用來近似的反映總體參數(shù)◆統(tǒng)計的任務(wù):由樣本估計總體,由樣本統(tǒng)計量估計總體參數(shù)第3頁,共36頁。一.連續(xù)變量的統(tǒng)計描述的工具(一)頻數(shù)表Frequency直觀的方法:分布類型分布特征看出集中趨勢與離散趨勢發(fā)現(xiàn)特大與特小值便于進一步計算統(tǒng)計指標(biāo)和做統(tǒng)計處理第4頁,共36頁。(二)統(tǒng)計指標(biāo)集中趨勢Centraltendency

均數(shù)mean、中位數(shù)median、眾數(shù)mode等離散趨勢Dispersiontendency

全距Range、方差Variance、標(biāo)準(zhǔn)差std.deviation、百分位數(shù)、變異系數(shù)CV等第5頁,共36頁。分布特征Distributiontendency

偏度系數(shù)Skewness、峰度系數(shù)Kurtosis等其他在SPSS中出現(xiàn)的指標(biāo)

M統(tǒng)計量

第6頁,共36頁。(三)統(tǒng)計表(四)統(tǒng)計圖直方圖(Histogram)

箱式圖(boxplot)

莖葉圖(stem-and-leaf)

QQ圖第7頁,共36頁。1.集中趨勢的描述指標(biāo)算術(shù)平均數(shù)(arithmeticmean)

◆簡稱均數(shù)(mean),有總體均數(shù)(PopulationMean,)和樣本均數(shù)之分

◆適用于對稱分布,特別是正態(tài)分布的資料,不適用于偏態(tài)分布的資料。

◆對于嚴(yán)重偏態(tài)分布的資料,均數(shù)將失去它應(yīng)有的代表性。第8頁,共36頁。中位數(shù)(Median)

◆是一組觀察值的位置平均數(shù),

◆用于描述偏態(tài)分布資料的集中位置,它不受兩端特大、特小值的影響,當(dāng)分布末端無確切數(shù)據(jù)時也可計算。◆對于沒有分組的原始數(shù)據(jù),必須先將標(biāo)志值按大小順序排序,第9頁,共36頁。截尾均數(shù)(trimmedmean)◆數(shù)據(jù)排序后按照一定比例去掉兩端的數(shù)據(jù)求均數(shù)

◆適用于兩端有極端值的資料

◆常用5%截尾均數(shù)第10頁,共36頁。幾何均數(shù)(geometricmean,G)

◆適用于呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布的資料,尤其是對數(shù)正態(tài)分布的計量資料

◆應(yīng)用中應(yīng)注意觀察值不能同時有正有負

◆同一資料算得的幾何均數(shù)小于算術(shù)均數(shù)第11頁,共36頁。(1)直接法第12頁,共36頁。眾數(shù)(mode)◆樣本數(shù)據(jù)中出現(xiàn)頻次最高的數(shù)字◆適用于單峰對稱的數(shù)據(jù),反映出現(xiàn)頻次最高的數(shù)據(jù)情況調(diào)和均數(shù)(H)

◆觀察值倒數(shù)的均數(shù)的倒數(shù),較少使用第13頁,共36頁。3組同齡男孩體重(KG)如下◆甲組2628303234◆乙組2427303336◆丙組2629303134◆均數(shù)相等,但各組差異不同◆對連續(xù)變量的描述,需要將集中趨勢和離散趨勢結(jié)合起來,才能對其分布有全面的認識。2.離散趨勢的描述指標(biāo)第14頁,共36頁。全距(Range,R)◆又稱極差,即最大和最小觀察值之間的間距,◆用全距描述資料的離散程度簡單明了,但它不能反映觀察值的整個變異度,樣本的例數(shù)越多,極差越大,越不夠穩(wěn)定?!羲砸话阒挥糜陬A(yù)備性檢查,大致了解數(shù)據(jù)的分布范圍。第15頁,共36頁。方差(variance)與標(biāo)準(zhǔn)差(standarddeviation)◆離均差平方和(sumofsquaresofdeviatonsfrommean,SS):可用來描述資料的離散程度?!鬝S的均數(shù)(即方差)不受觀察值個數(shù)的影響,用來描述資料的離散程度更好。第16頁,共36頁?!魧嶋H中,得到的常是樣本資料,總體均數(shù)未知,只能用樣本均數(shù)代替,得到樣本方差S2◆n-1為自由度(degreeoffreedom)第17頁,共36頁?!粢蚍讲畹膯挝皇窃瓎挝坏钠椒?,所以使用仍不方便。方差的算術(shù)平方根,即標(biāo)準(zhǔn)差(standarddeviation)是一個更好的指標(biāo)。◆標(biāo)準(zhǔn)差也有總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差之分:第18頁,共36頁?!暨m用范圍:◆方差和標(biāo)準(zhǔn)差適合于對稱分布,特別是正態(tài)分布及近似正態(tài)分布資料◆標(biāo)準(zhǔn)差可用于描述變量值的離散程度,與均數(shù)結(jié)合還可描述資料的分布情況,此外還可用于求參考值范圍和計算標(biāo)準(zhǔn)誤。第19頁,共36頁?!裘枋龇植计x正態(tài)分布的程度,即偏離對稱的程度。偏(斜)度(Skewness):偏度系數(shù)

◆Skewness>0:正偏或右偏(長尾在右邊)

Skewness<0:負偏離左偏(長尾在左邊)第20頁,共36頁?!裘枋龇植甲兞咳≈捣植夹螒B(tài)陡緩程度的統(tǒng)計量。峰(峭)度(Kurtosis)峰度系數(shù)

◆Kurtosis>0分布集中趨勢強

Kurtosis<0分布離心趨勢強第21頁,共36頁。百分位數(shù)(percentile)◆百分位數(shù)是一個位置指標(biāo),Px表示是資料分布數(shù)列的百等份分割值?!糁形粩?shù)是特定的百分位數(shù),即P50◆用于描述樣本或總體觀察值序列某百分位置的水平,應(yīng)用中注意,樣本例數(shù)不夠多時,兩端的百分位數(shù)不穩(wěn)定。◆還用于確定參考值范圍(referencerange)。第22頁,共36頁。四分位數(shù)間距(quartileinterval)◆四分位數(shù)是特定的百分位數(shù),其中P25為下四分位數(shù)QL,P75為上四分位數(shù)Qu?!鬛=Qu-QL◆四分位數(shù)間距比極差穩(wěn)定,但仍未考慮每個觀察值的變異度?!舾m用于偏態(tài)分布的資料,特別是末端無確切數(shù)據(jù)時第23頁,共36頁。變異系數(shù)(coefficientofvariance,CV)◆當(dāng)比較多組資料的變異度,均數(shù)相差懸殊時使用◆資料的單位不同時使用◆實際上是標(biāo)準(zhǔn)差占均數(shù)的百分比例。第24頁,共36頁。二.連續(xù)變量的參數(shù)估計(90頁)1.參數(shù)的點估計:◆用一個適當(dāng)?shù)臉颖窘y(tǒng)計量作為參數(shù)的估計量,并計算出估計值;◆矩估計;◆極大似然估計法;◆穩(wěn)健估計值:M估計(Explore過程會輸出)第25頁,共36頁?!魳?biāo)準(zhǔn)誤:描述參數(shù)估計值與真實值的距離的統(tǒng)計量;◆總體均數(shù)的100(1-α)%可信區(qū)間;◆Explore過程會輸出標(biāo)準(zhǔn)誤和可信區(qū)間2.區(qū)間估計第26頁,共36頁。三.SPSS統(tǒng)計描述的模塊用于兩個連續(xù)變量計算相對比指標(biāo)分類變量資料的統(tǒng)計描述及一般的統(tǒng)計檢驗(卡方檢驗)第27頁,共36頁。例:以問卷調(diào)查數(shù)據(jù)student.sav為例來闡述各過程Explore過程分析統(tǒng)計描述指標(biāo)參數(shù)估計百分位數(shù)和極端值統(tǒng)計圖Frequencies過程Descriptive過程:生成Z值(將原變量變換為標(biāo)準(zhǔn)正態(tài)分布下的得分,選Descriptive左下角的Savestandardizedvalueasvariables)第28頁,共36頁。1.Explore過程主要用于對連續(xù)型資料的性質(zhì)、分布特點等完全不清楚時的探索性分析;可計算許多描述統(tǒng)計量,給出各種統(tǒng)計圖,并進行簡單的參數(shù)估計。Statistics子對話框plot子對話框Option子對話框第29頁,共36頁。對男生和女生的身高進行描述需要分析的變量分組變量第30頁,共36頁。第31頁,共36頁。Statistics子對話框Descriptives復(fù)選框:輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度系數(shù)的標(biāo)準(zhǔn)誤、偏度系數(shù)、偏度系數(shù)的標(biāo)準(zhǔn)誤及指定的均數(shù)可信區(qū)間。M-estimators復(fù)選框:作中心趨勢的粗略最大似然穩(wěn)健估計,輸出四個不同權(quán)重的最大似然估計值。Outliers復(fù)選框:輸出五個最大值與五個最小值。Percentiles復(fù)選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)。第32頁,共36頁。plot子對話框◆Boxplots單選框組:確定箱式圖的繪制方式按組別分組繪制(Factorlevelstogether),

不分組繪制(Depentendstogether)不繪制(None)◆Descriptive復(fù)選框組:莖葉圖(Stem-and-leaf)和直方圖(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論