連續(xù)變量的統(tǒng)計描述與參數(shù)估計實用全套PPT_第1頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計實用全套PPT_第2頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計實用全套PPT_第3頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計實用全套PPT_第4頁
連續(xù)變量的統(tǒng)計描述與參數(shù)估計實用全套PPT_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

連續(xù)變量的統(tǒng)計(tǒngjì)描述與參數(shù)估計第一頁,共39頁?;靖拍顝土?fùxí)總體(population)與樣本(yàngběn)(sample)◆總體:根據(jù)研究目的確定的同質(zhì)觀察單位(研究對象)的全體,實際上是某一變量值的集合?!魳颖?yàngběn):是從總體中抽取的部分個體◆由于直接研究總體經(jīng)常是不可能的,故而大多采用抽樣研究,即通過抽取樣本(yàngběn)來推斷總體--統(tǒng)計推斷第二頁,共39頁。參數(shù)和統(tǒng)計量◆參數(shù):刻畫總體特征的指標稱為總體參數(shù)。用來確定某一分布的特征;如總體均數(shù),總體分布往往是已知的◆統(tǒng)計量:刻畫樣本特征的統(tǒng)計描述(miáoshù)指標稱為統(tǒng)計量。由觀察資料計算出來的量;可以用來近似的反映總體參數(shù)◆統(tǒng)計的任務:由樣本估計總體,由樣本統(tǒng)計量估計總體參數(shù)第三頁,共39頁。一.連續(xù)變量的統(tǒng)計描述(miáoshù)的工具(一)頻數(shù)表Frequency直觀的方法:分布類型分布特征看出集中趨勢與離散趨勢發(fā)現(xiàn)特大與特小值便于進一步計算統(tǒng)計指標(zhǐbiāo)和做統(tǒng)計處理第四頁,共39頁。(二)統(tǒng)計指標(zhǐbiāo)集中趨勢Centraltendency均數(shù)mean、中位數(shù)median、眾數(shù)mode等離散趨勢Dispersiontendency全距Range、方差Variance、標準差std.deviation、百分位數(shù)、變異系數(shù)CV等第五頁,共39頁。分布特征Distributiontendency偏度系數(shù)(xìshù)Skewness、峰度系數(shù)(xìshù)Kurtosis等其他在SPSS中出現(xiàn)的指標M統(tǒng)計量

第六頁,共39頁。(三)統(tǒng)計表(四)統(tǒng)計圖直方圖(Histogram)

箱式圖(boxplot)

莖葉圖(stem-and-leaf)

QQ圖第七頁,共39頁。1.集中(jízhōng)趨勢的描述指標算術(shù)平均數(shù)(arithmeticmean)◆簡稱均數(shù)(mean),有總體均數(shù)(PopulationMean,)和樣本均數(shù)之分◆適用于對稱分布,特別是正態(tài)分布的資料,不適用于偏態(tài)分布的資料?!魧τ?duìyú)嚴重偏態(tài)分布的資料,均數(shù)將失去它應有的代表性。第八頁,共39頁。中位數(shù)(Median)◆是一組觀察(guānchá)值的位置平均數(shù),◆用于描述偏態(tài)分布資料的集中位置,它不受兩端特大、特小值的影響,當分布末端無確切(quèqiè)數(shù)據(jù)時也可計算。◆對于沒有分組的原始數(shù)據(jù),必須先將標志值按大小(dàxiǎo)順序排序,第九頁,共39頁。截尾均數(shù)(trimmedmean)◆數(shù)據(jù)排序后按照一定(yīdìng)比例去掉兩端的數(shù)據(jù)求均數(shù)◆適用于兩端有極端值的資料◆常用5%截尾均數(shù)第十頁,共39頁。幾何均數(shù)(geometricmean,G)◆適用于呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布的資料,尤其是對數(shù)正態(tài)分布的計量資料◆應用中應注意(zhùyì)觀察值不能同時有正有負◆同一資料算得的幾何均數(shù)小于算術(shù)均數(shù)第十一頁,共39頁。(1)直接(zhíjiē)法第十二頁,共39頁。眾數(shù)(mode)◆樣本數(shù)據(jù)中出現(xiàn)頻次(píncì)最高的數(shù)字◆適用于單峰對稱的數(shù)據(jù),反映出現(xiàn)頻次(píncì)最高的數(shù)據(jù)情況調(diào)和均數(shù)(H)◆觀察值倒數(shù)的均數(shù)的倒數(shù),較少使用第十三頁,共39頁。3組同齡男孩體重(KG)如下◆甲組2628303234◆乙組2427303336◆丙組2629303134◆均數(shù)相等,但各組差異不同◆對連續(xù)變量的描述,需要將集中趨勢和離散趨勢結(jié)合起來(qǐlái),才能對其分布有全面的認識。2.離散趨勢的描述(miáoshù)指標第十四頁,共39頁。全距(Range,R)◆又稱極差,即最大和最小觀察值之間的間距,◆用全距描述資料(zīliào)的離散程度簡單明了,但它不能反映觀察值的整個變異度,樣本的例數(shù)越多,極差越大,越不夠穩(wěn)定?!羲砸话阒挥糜陬A備性檢查,大致了解數(shù)據(jù)的分布范圍。第十五頁,共39頁。方差(fānɡchà)(variance)與標準差(standarddeviation)◆離均差平方和(sumofsquaresofdeviatonsfrommean,SS):可用來描述資料的離散程度。◆SS的均數(shù)(即方差(fānɡchà))不受觀察值個數(shù)的影響,用來描述資料的離散程度更好。第十六頁,共39頁?!魧嶋H中,得到的常是樣本資料,總體(zǒngtǐ)均數(shù)未知,只能用樣本均數(shù)代替,得到樣本方差S2◆n-1為自由度(degreeoffreedom)第十七頁,共39頁。◆因方差(fānɡchà)的單位是原單位的平方,所以使用仍不方便。方差(fānɡchà)的算術(shù)平方根,即標準差(standarddeviation)是一個更好的指標?!魳藴什钜灿锌傮w標準差和樣本標準差之分:第十八頁,共39頁?!暨m用范圍:◆方差和標準差適合于對稱分布,特別是正態(tài)分布及近似正態(tài)分布資料◆標準差可用于描述變量值的離散程度,與均數(shù)結(jié)合還可描述資料的分布情況,此外(cǐwài)還可用于求參考值范圍和計算標準誤。第十九頁,共39頁?!裘枋?miáoshù)分布偏離正態(tài)分布的程度,即偏離對稱的程度。偏(斜)度(Skewness):偏度系數(shù)(xìshù)◆Skewness>0:正偏或右偏(長尾在右邊(yòubian))Skewness<0:負偏離左偏(長尾在左邊)第二十頁,共39頁?!裘枋龇植?fēnbù)變量取值分布(fēnbù)形態(tài)陡緩程度的統(tǒng)計量。峰(峭)度(Kurtosis)峰度系數(shù)(xìshù)◆Kurtosis>0分布(fēnbù)集中趨勢強Kurtosis<0分布(fēnbù)離心趨勢強第二十一頁,共39頁。百分位數(shù)(percentile)◆百分位數(shù)是一個位置指標,Px表示是資料分布數(shù)列的百等份分割值。◆中位數(shù)是特定的百分位數(shù),即P50◆用于描述樣本或總體觀察值序列某百分位置的水平,應用(yìngyòng)中注意,樣本例數(shù)不夠多時,兩端的百分位數(shù)不穩(wěn)定?!暨€用于確定參考值范圍(referencerange)。第二十二頁,共39頁。四分位數(shù)間距(quartileinterval)◆四分位數(shù)是特定的百分位數(shù),其中P25為下四分位數(shù)QL,P75為上四分位數(shù)Qu?!鬛=Qu-QL◆四分位數(shù)間距比極差穩(wěn)定,但仍未考慮(kǎolǜ)每個觀察值的變異度。◆更適用于偏態(tài)分布的資料,特別是末端無確切數(shù)據(jù)時第二十三頁,共39頁?;?jīběn)分析結(jié)果:變異系數(shù)(coefficientofvariance,CV)◆百分位數(shù)是一個位置指標,Px表示是資料分布數(shù)列的百等份分割值。Outliers復選框:輸出五個最大值與五個最小值??梢杂脕斫频姆从晨傮w參數(shù)百分位數(shù)(percentile)集中(jízhōng)趨勢的描述指標◆同一資料算得的幾何均數(shù)小于算術(shù)均數(shù)◆樣本數(shù)據(jù)中出現(xiàn)頻次(píncì)最高的數(shù)字◆同一資料算得的幾何均數(shù)小于算術(shù)均數(shù)Skewness<0:負偏離左偏(長尾在左邊)◆Q=Qu-QLPercentiles復選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)?!粲萌嗝枋鲑Y料(zīliào)的離散程度簡單明了,但它不能反映觀察值的整個變異度,樣本的例數(shù)越多,極差越大,越不夠穩(wěn)定。Kurtosis<0分布(fēnbù)離心趨勢強變異系數(shù)(coefficientofvariance,CV)◆當比較多組資料的變異度,均數(shù)相差懸殊時使用(shǐyòng)◆資料的單位不同時使用(shǐyòng)◆實際上是標準差占均數(shù)的百分比例。第二十四頁,共39頁。二.連續(xù)變量的參數(shù)估計(90頁)1.參數(shù)(cānshù)的點估計:◆用一個適當(shìdàng)的樣本統(tǒng)計量作為參數(shù)的估計量,并計算出估計值;◆矩估計;◆極大似然估計法;◆穩(wěn)健估計值:M估計(Explore過程會輸出)第二十五頁,共39頁。◆標準誤:描述(miáoshù)參數(shù)估計值與真實值的距離的統(tǒng)計量;◆總體均數(shù)的100(1-α)%可信區(qū)間;◆Explore過程會輸出標準誤和可信區(qū)間2.區(qū)間(qūjiān)估計第二十六頁,共39頁。三.SPSS統(tǒng)計描述(miáoshù)的模塊用于兩個(liǎnɡɡè)連續(xù)變量計算相對比指標分類(fēnlèi)變量資料的統(tǒng)計描述及一般的統(tǒng)計檢驗(卡方檢驗)第二十七頁,共39頁。例:以問卷調(diào)查數(shù)據(jù)(shùjù)student.sav為例來闡述各過程Explore過程分析統(tǒng)計描述指標參數(shù)估計百分位數(shù)和極端值統(tǒng)計圖Frequencies過程Descriptive過程:生成Z值(將原變量變換為標準正態(tài)分布下的得分,選Descriptive左下角的Savestandardizedvalueasvariables)第二十八頁,共39頁。1.Explore過程主要用于對連續(xù)型資料的性質(zhì)、分布特點等完全不清楚時的探索性分析;可計算許多描述統(tǒng)計量,給出各種(ɡèzhǒnɡ)統(tǒng)計圖,并進行簡單的參數(shù)估計。Statistics子對話框plot子對話框Option子對話框第二十九頁,共39頁。對男生和女生的身高進行(jìnxíng)描述需要分析(fēnxī)的變量分組變量(biànliàng)第三十頁,共39頁。第三十一頁,共39頁。Statistics子對話框Descriptives復選框:輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標準誤、方差、標準差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度系數(shù)的標準誤、偏度系數(shù)、偏度系數(shù)的標準誤及指定的均數(shù)可信區(qū)間。M-estimators復選框:作中心趨勢的粗略最大似然穩(wěn)健估計(gūjì),輸出四個不同權(quán)重的最大似然估計(gūjì)值。Outliers復選框:輸出五個最大值與五個最小值。Percentiles復選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)。第三十二頁,共39頁。plot子對話框◆Boxplots單選框組:確定箱式圖的繪制方式按組別分組繪制(Factorlevelstogether),不分組繪制(Depentendstogether)不繪制(None)◆Descriptive復選框組:莖葉圖(Stem-and-leaf)和直方圖(Histogram)?!鬘ormalityplotswithtest復選框:正態(tài)分布圖和正態(tài)分布的檢驗?!鬝preadvs.LevelwithLeveneTest單選框組:有分組變量(biànliàng)時,繪制水平圖,設(shè)置變量(biànliàng

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論