版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、統(tǒng)計學(xué)(第三版),2008年,第3章用統(tǒng)計學(xué)描述數(shù)據(jù),3.1水平測量3.2差異測量3.3分布形態(tài)測量,學(xué)習(xí)目標(biāo),水平測量統(tǒng)計量測量差異統(tǒng)計量測量分布形態(tài)統(tǒng)計量,每個統(tǒng)計量的特征和應(yīng)用都用Excel和SPSS計算和描述,2008年8月,3.1水平測量3.1.1平均值3.1第3章用統(tǒng)計學(xué)描述數(shù)據(jù),3.1.1平均值,3.1水平測量,平均值,也稱為平均值。其中一個常用的統(tǒng)計數(shù)據(jù)消除了觀察值的隨機(jī)波動,并且容易受到極值的影響。根據(jù)總體數(shù)據(jù)計算的平均值被記錄為:根據(jù)樣本數(shù)據(jù)計算,稱為樣本平均值,記錄為X,2008年8月,簡單平均值。假設(shè)一組數(shù)據(jù)為:x1,x2,xn(總體數(shù)據(jù)xN),樣本平均值,總體平均值,
2、2008年8月,加權(quán)平均。假設(shè)每組的中值是:M1、M2和XN。樣本加權(quán)平均值:總體加權(quán)平均值:2008年8月,2008年8月,加權(quán)平均值(示例分析),加權(quán)平均值(權(quán)重對平均值的影響),每組有10名學(xué)生。他們的測試分?jǐn)?shù)和分布數(shù)據(jù)如下:組A:測試分?jǐn)?shù)(x):020100人分布(f): 118組B:測試分?jǐn)?shù)(x):020100人分布(f): 811,統(tǒng)計函數(shù)平均值,2008年8月,3.1.2中位數(shù)和分位數(shù),3.1水平不受極值影響,2。位置確定,3。數(shù)值確定,計算2008年8月的中位數(shù)(數(shù)據(jù)個數(shù)為奇數(shù)),9戶家庭月人均收入原始數(shù)據(jù)為:15007507801080850960200012501630,排
3、名為:7507808509601080125016302000,中位數(shù)為1080,2008年8月。【示例】:10個家庭的人均月收入數(shù)據(jù)排序為:66075078085096010801250150016302000位置:12345678910,統(tǒng)計函數(shù)中值為2008年8月,四分位數(shù)分為三個四分位數(shù),排序后為2008年8月,計算四分位數(shù)(位置的確定),定義算法為2008年8月在一組數(shù)據(jù)中出現(xiàn)頻率最高的變量值適用于有大量數(shù)據(jù)且不受極值影響的情況。 一組數(shù)據(jù)可能沒有模式或有幾種模式。統(tǒng)計功能模式,2008年8月,3.1.3哪個值代表一組數(shù)據(jù)?3.1水平測量,模式,中值與平均值的關(guān)系,2008年8月,模
4、式,中值與平均值的特點及應(yīng)用,平均值易受極值影響,其數(shù)學(xué)性質(zhì)優(yōu)良。實際上,當(dāng)最常用的數(shù)據(jù)對稱或近似對稱分布時,中值不受極值的影響。當(dāng)數(shù)據(jù)分布在很大程度上傾斜時,代表模式不受極值的影響。如果數(shù)據(jù)分布在很大程度上是傾斜的,并且有明顯的峰值,這是有代表性的。在2008年8月,3.2差異測量3.2.1極端差異和四分位偏差3.2.2方差和標(biāo)準(zhǔn)偏差3.2.3比較了幾組數(shù)據(jù)的分散度:分散度系數(shù)。第三章使用統(tǒng)計學(xué)。假設(shè)有兩個地區(qū)的人均收入數(shù)據(jù),其中A地區(qū)的人均收入為5000元,B地區(qū)的人均收入為3000元。你如何評價這兩個地區(qū)的收入狀況?如果平均收入代表這個地區(qū)的生活水平,你認(rèn)為A區(qū)的平均生活水平比B區(qū)高嗎?
5、為了回答這些問題,我們需要弄清楚這里的平均收入是否能代表大多數(shù)人的收入水平。如果A區(qū)有一些富人,大多數(shù)人的收入很低,雖然平均收入很高,但大多數(shù)人的生活水平仍然很低。相反,B區(qū)大多數(shù)人的收入水平在3000元左右。雖然平均收入不如A區(qū),但大多數(shù)人的生活水平高于A區(qū),因為A區(qū)的收入差距大于b區(qū)。2008年8月,如何評價水平代表值?僅僅知道數(shù)據(jù)的級別是不夠的,還要考慮數(shù)據(jù)之間的差距有多大。數(shù)據(jù)之間的差距是統(tǒng)計語言中數(shù)據(jù)的離散程度。數(shù)據(jù)的離散度越大,每一個描述性統(tǒng)計對這組數(shù)據(jù)的代表性越差,離散度越小,其代表性越好。A、B、3.2.1范圍和四分位偏差、3.2差異的度量、范圍、最簡單的度量一組數(shù)據(jù)的最大值和
6、最小值之間的差異的離差程度易受極值的影響。不考慮數(shù)據(jù)分布的計算公式是,2008年8月,四分位數(shù)偏差,也稱內(nèi)距或四分位數(shù)間隔的上下四分位數(shù)之差:Qd=QUQL反映中間50%數(shù)據(jù)的離散度不受極值的影響,用于衡量中值的代表性,25%,75%,2008年8月,3.2.2方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差。 最常用的數(shù)據(jù)離差測量值反映了變量值和平均值之間的平均差異,平均值是根據(jù)總體數(shù)據(jù)計算的,稱為總體方差(標(biāo)準(zhǔn)差),記錄為2(); 根據(jù)樣本數(shù)據(jù)計算,稱為樣本方差(標(biāo)準(zhǔn)偏差),記錄為S2 (s),2008年8月,樣本方差和標(biāo)準(zhǔn)偏差,未分組數(shù)據(jù),組距離分組數(shù)據(jù),未分組數(shù)據(jù),組距離分組數(shù)據(jù),計算方差和標(biāo)準(zhǔn)偏差的公式,2
7、008年8月,人口方差和標(biāo)準(zhǔn)偏差,未分組數(shù)據(jù),組距離分組數(shù)據(jù),未分組數(shù)據(jù),組距離分組數(shù)據(jù),計算方差的公式,計算標(biāo)準(zhǔn)偏差的公式,2008年8月,遞減自由度,由統(tǒng)計學(xué)家R.AFisher提出,指字面上,自由是指一組數(shù)據(jù)中自由值的數(shù)量。當(dāng)樣本數(shù)據(jù)的數(shù)量為N時,如果確定樣本的平均數(shù)量,則附加到N個觀測值的約束的數(shù)量為1,因此只能自由獲取n-1個數(shù)據(jù)。根據(jù)這個邏輯,如果附加到n個觀測值的約束數(shù)是k,則自由度是n-k,并且在2008年8月的自由度中,樣本具有三個值,即x1=2,x2=4,x3=9,然后x=5。當(dāng)確定x=5時,x1、x2和x3這兩個數(shù)據(jù)可以自由取值,而其他數(shù)據(jù)不能自由取值。例如,x1=6,x
8、2=7,那么x3必須取2,但不能取其他值。為什么樣本方差的自由度是n-1?因為在計算偏差平方和時,必須首先計算樣本平均值X,并且X是附加到偏差平方和的約束,所以在計算偏差平方和時,只有n-1個獨立的觀測值,而不是通過自由度去除N個樣本方差,這可以從許多方面來解釋。從實際應(yīng)用的角度來看,在抽樣估計中,當(dāng)使用樣本方差s2估計總體方差2時,它是一個2008年樣本標(biāo)準(zhǔn)差的無偏估計量(示例分析),示例計算9名員工月工資收入的方差和標(biāo)準(zhǔn)差15007507801080850960200012501630,方差和標(biāo)準(zhǔn)差,統(tǒng)計函數(shù)stdev,2008年8月,standardscore,1。也稱為標(biāo)準(zhǔn)化值2。測量
9、一組數(shù)據(jù)中某個值的相對位置。它可以用來判斷一組數(shù)據(jù)是否有異常值。它用于標(biāo)準(zhǔn)化變量。平均值等于0,方差等于1。計算公式是,在2008年8月,標(biāo)準(zhǔn)分?jǐn)?shù)(用于數(shù)據(jù)轉(zhuǎn)換),z分?jǐn)?shù)僅線性轉(zhuǎn)換原始數(shù)據(jù),并且它不改變數(shù)據(jù)在數(shù)據(jù)組中的位置。它也沒有改變數(shù)字分布的形狀,只是使組數(shù)據(jù)的平均值為0,標(biāo)準(zhǔn)差為1。2008年8月,SPSS被用于數(shù)據(jù)標(biāo)準(zhǔn)化。步驟1:選擇分析下拉菜單,選擇描述性統(tǒng)計-描述性選項進(jìn)入主對話框。步驟2:在主對話框中選擇變量,然后選擇保存單擊確定 (SPSS將標(biāo)準(zhǔn)化變量存儲在以“z”開頭的原始變量工作表中),并使用SPSS、2008年8月標(biāo)準(zhǔn)分?jǐn)?shù)(示例分析)、2008年8月經(jīng)驗法則對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)
10、化。經(jīng)驗法則表明,當(dāng)一組數(shù)據(jù)對稱分布時,約68%的數(shù)據(jù)在平均值1標(biāo)準(zhǔn)偏差范圍內(nèi),約95%的數(shù)據(jù)在平均值2標(biāo)準(zhǔn)偏差范圍內(nèi),約99%的數(shù)據(jù)在平均值3標(biāo)準(zhǔn)偏差范圍內(nèi)2008年8月,經(jīng)驗法則(示例分析),九名員工月工資收入的經(jīng)驗法則,2008年8月,切比雪夫不等式,如果一組數(shù)據(jù)不是對稱分布的,則經(jīng)驗法則不再適用。此時,可以使用切比雪夫不等式,它適用于任何分布形狀的數(shù)據(jù)。切比雪夫不等式提供了一個“下限”,即“至少是多少比例”。根據(jù)切比雪夫不等式,對于具有任何分布形狀的數(shù)據(jù),至少1-1/k2個數(shù)據(jù)落在正或負(fù)k的平均值上。其中k是大于1的任意值,但不一定是整數(shù)。在2008年8月的切比雪夫辛質(zhì)量中,對于k=2
11、,3,4,這個不等式的含義是至少75%的數(shù)據(jù)落在均值2標(biāo)準(zhǔn)差的范圍內(nèi),至少89%的數(shù)據(jù)落在均值3標(biāo)準(zhǔn)差的范圍內(nèi),至少94%的數(shù)據(jù)落在均值4標(biāo)準(zhǔn)差的范圍內(nèi)。2008年8月,3月2.3日,我們比較了幾組數(shù)據(jù)的離差系數(shù)和差異度量。系數(shù)變化),1 1。標(biāo)準(zhǔn)偏差與其相應(yīng)平均值之間的比較消除了數(shù)據(jù)水平和測量單位的影響。4.它用于比較不同數(shù)據(jù)組的分散程度。5.計算公式為,2008年8月,離差系數(shù)(實例分析),實例來評價哪個運動員打得更穩(wěn)定。穩(wěn)定的運動員是塞爾維亞的賈斯納塞卡里克和中國的郭文軍,不穩(wěn)定的運動員是蒙古的卓格巴德拉欣蒙赫珠勒和波蘭的勒萬多夫斯卡薩貢,2008年8月,3.3測量分布形狀的偏斜度和峰值
12、狀態(tài),第3章用統(tǒng)計學(xué)描述數(shù)據(jù)、形狀偏斜度和峰值狀態(tài)的數(shù)據(jù)分布,2008年8月,偏斜度。這意味著數(shù)據(jù)分布的不對稱測度統(tǒng)計量是偏度系數(shù)。2.偏斜系數(shù)=0是對稱分布;0分布在右側(cè);0表示左偏態(tài)分布的偏態(tài)系數(shù)大于1或小于-1,表示它是高度偏態(tài)分布;偏斜系數(shù)在0.51或-1-0.5之間,這意味著它是適度偏斜的。偏斜度系數(shù)越接近0,偏斜度越低。2008年8月,峰度首次由統(tǒng)計學(xué)家皮爾森在1905年提出。數(shù)據(jù)分布峰值高低測度的統(tǒng)計量為峰態(tài)系數(shù)(峰態(tài)系數(shù)=0)、平坦峰度、中等峰態(tài)系數(shù),0為峰態(tài)分布的計算公式,統(tǒng)計函數(shù)為Kurt,2008年8月,統(tǒng)計函數(shù)為Excel。模式計算模式中位數(shù)計算中位數(shù)四分位數(shù)計算四分位數(shù)平均值計算平均值HARMEAN計算簡單調(diào)和平均幾何圖形計算幾何平均值A(chǔ)VEDEV計算平均差異STDEV計算樣本標(biāo)準(zhǔn)偏差STDEV計算總體標(biāo)準(zhǔn)偏差偏斜計算偏斜系數(shù)KU
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB 4053.3-2025固定式金屬梯及平臺安全要求第3部分:工業(yè)防護(hù)欄桿及平臺
- 蔬菜宣傳活動策劃方案(3篇)
- 路基施工方案事例(3篇)
- 春節(jié)白酒活動策劃方案(3篇)
- 污水導(dǎo)向施工方案(3篇)
- 政治比賽活動方案策劃(3篇)
- 蓋體施工方案(3篇)
- 2025年酒店服務(wù)流程與操作手冊
- 人力資源盤點方案
- 2025年大學(xué)統(tǒng)計(統(tǒng)計學(xué)原理)試題及答案
- 中小企業(yè)主的家庭財富管理方案
- 專題03 基本不等式(期末壓軸專項訓(xùn)練20題)(原卷版)-25學(xué)年高一數(shù)學(xué)上學(xué)期期末考點大串講(人教A版必修一)
- 檔案管理基本知識課件
- 臨床硬膜下血腫患者中醫(yī)護(hù)理查房
- 正規(guī)裝卸合同范本
- 科研設(shè)計及研究生論文撰寫智慧樹知到期末考試答案章節(jié)答案2024年浙江中醫(yī)藥大學(xué)
- 2024年江蘇省普通高中學(xué)業(yè)水平測試小高考生物、地理、歷史、政治試卷及答案(綜合版)
- 土力學(xué)與地基基礎(chǔ)(課件)
- 精神分裂癥等精神病性障礙臨床路徑表單
- 提撈采油安全操作規(guī)程
- 管道安全檢查表
評論
0/150
提交評論