第三章數(shù)據(jù)分布特征的描述_第1頁
第三章數(shù)據(jù)分布特征的描述_第2頁
第三章數(shù)據(jù)分布特征的描述_第3頁
第三章數(shù)據(jù)分布特征的描述_第4頁
第三章數(shù)據(jù)分布特征的描述_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2023/2/6版權(quán)所有BY統(tǒng)計學課程組1第一節(jié)集中趨勢——數(shù)值平均數(shù)第二節(jié)集中趨勢——位置平均數(shù)第三節(jié)離中趨勢的測度第四節(jié)偏度與峰度的測度第三章數(shù)據(jù)分布特征的描述2023/2/6版權(quán)所有BY統(tǒng)計學課程組2本章重點與難點重點:

了解和掌握算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、方差、標準差、標準分數(shù)的含義及其計算方法;正確使用離散系數(shù)比較不同均值的代表性。難點:

是偏度和峰度的含義及其計算方法。2023/2/6版權(quán)所有BY統(tǒng)計學課程組3學習目標

正確理解平均指標與變異指標的概念的、意義與作用,明確其種類和區(qū)別;掌握平均指標和變異指標的計算方法,以及應(yīng)用的原則和條件;掌握偏度和峰度的含義及其計算方法;了解各種分位數(shù)的概念與意義。2023/2/6版權(quán)所有BY統(tǒng)計學課程組4數(shù)據(jù)分布的特征:一、集中趨勢:反映數(shù)據(jù)向其中心靠攏或聚集程度;二、離中趨勢;數(shù)據(jù)遠離中心的趨勢(又稱離散程度);三、偏態(tài)和峰態(tài);偏態(tài)是對數(shù)據(jù)分布對稱性的度量;峰度是指數(shù)據(jù)分布的平峰或尖峰程度(形狀)。2023/2/65數(shù)據(jù)分布的特征集中趨勢:反映數(shù)據(jù)向其中心靠攏或聚集程度

(位置)偏態(tài)和峰態(tài);偏態(tài):反映數(shù)據(jù)偏斜程度;峰度:數(shù)據(jù)分布的平峰或尖峰程度(形狀)離中趨勢;數(shù)據(jù)遠離中心的趨勢

(分散程度)2023/2/66數(shù)據(jù)分布特征的測度1.集中趨勢算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)和中位數(shù)。2.離散程度全距、異眾比率、四分位差、平均差、方差和標準差、離散系數(shù)、標準分數(shù)。3.分布的形狀偏態(tài)系數(shù)、峰態(tài)系數(shù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組7第一節(jié)集中趨勢——數(shù)值平均數(shù)

p75

一、算術(shù)平均數(shù)二、調(diào)和平均數(shù)三、幾何平均數(shù)數(shù)值型數(shù)據(jù)的平均數(shù)2023/2/6版權(quán)所有BY統(tǒng)計學課程組8集中趨勢

(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值注意:低層次數(shù)據(jù)的測度方法也適用于高層次的數(shù)據(jù),但高層次數(shù)據(jù)的測度方法往往不適用于低層次的數(shù)據(jù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組9一、算術(shù)平均數(shù)

均值(算術(shù)平均數(shù))定義:將一組數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)所得到的一個數(shù)值,稱為算術(shù)平均數(shù)(average)或均值(mean)。

算術(shù)平均數(shù),又有簡單算術(shù)平均數(shù)和加權(quán)平均數(shù)之分。算術(shù)平均數(shù)公式的應(yīng)用條件(1)各變量值相互獨立;(2)變量名稱和計量單位相同;(3)截面數(shù)據(jù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組10

一、算術(shù)平均數(shù)

設(shè)一組數(shù)據(jù)為:x1,x2,…,xn

未分組數(shù)據(jù)各組的組中值為:x1,x2,…,xk

組距分組數(shù)據(jù)

相應(yīng)的頻數(shù)為:f1,f2,…,fk簡單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)2023/2/6版權(quán)所有BY統(tǒng)計學課程組11【例3.1】根據(jù)表3-1中的數(shù)據(jù),計算職工通信費用支出額平均水平。p72解:2023/2/6版權(quán)所有BY統(tǒng)計學課程組12

身高組中值人數(shù)比重(cm)xi(cm)fi(人)(%)

150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25

總計-83100.00

例3.2分組資料均值的計算:某年級83名女生身高資料組距數(shù)據(jù)次數(shù)f頻率f/∑f變量值x加權(quán)算術(shù)平均數(shù)2023/2/6版權(quán)所有BY統(tǒng)計學課程組13【例3.3】依據(jù)整理得表3-4中的數(shù)據(jù),計算職工通信費用支出額平均水平。p74解:或2023/2/6版權(quán)所有BY統(tǒng)計學課程組14

計算算術(shù)平均數(shù),

注意:用各組的組中值代表其實際數(shù)據(jù)計算算術(shù)平均數(shù)時,通常假定各組數(shù)據(jù)在組內(nèi)是均勻分布的,相應(yīng)的組中值近似等于各組的平均數(shù)。權(quán)數(shù):衡量變量值相對重要性的數(shù)值。各個變量值的權(quán)數(shù)要起作用必須具備兩個條件:一是各個變量值之間有差異;二是各個變量值的權(quán)數(shù)有差異。簡單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)在權(quán)數(shù)相等時的特例。2023/2/6版權(quán)所有BY統(tǒng)計學課程組15

算術(shù)平均數(shù)的性質(zhì)p75-76

1.各變量值與其算術(shù)平均數(shù)的離差之和等于零,即

2023/2/6版權(quán)所有BY統(tǒng)計學課程組16算術(shù)平均數(shù)的性質(zhì)2023/2/6版權(quán)所有BY統(tǒng)計學課程組17集中趨勢的最常用測度值;一組數(shù)據(jù)的均衡點所在;易受極端值的影響;由組距分組資料計算的均值有近似值性質(zhì);5、用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)算術(shù)平均數(shù)(均值)特征:2023/2/6版權(quán)所有BY統(tǒng)計學課程組18

二、調(diào)和平均數(shù)

調(diào)和平均數(shù)也稱“倒數(shù)平均數(shù)”,它是對變量的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù),以表示。根據(jù)掌握的資料不同,調(diào)和平均數(shù)也有簡單調(diào)和平均數(shù)和加權(quán)平均數(shù)兩種形式。其計算公式為:

2023/2/6版權(quán)所有BY統(tǒng)計學課程組19

例題分析【例3.4]假設(shè)甲、乙、丙三種蘋果的價格分別為每斤2.4元、1.8元及1.5元(1)若三種蘋果各買1元,試問所購蘋果的平均價格又為多少?(2)如果甲、乙、丙三種蘋果分別購買5元、8元和10元,試問其平均價格為多少?解:計算平均價格的是用所付金額除以所購數(shù)量。(1)(2)2023/2/6版權(quán)所有BY統(tǒng)計學課程組20

計算調(diào)和平均數(shù),注意:

從數(shù)學定義角度看算術(shù)平均數(shù)與調(diào)和平均數(shù)是不一樣的,但在社會經(jīng)濟應(yīng)用領(lǐng)域,調(diào)和平均數(shù)實際上只是算術(shù)平均數(shù)的另一種表現(xiàn)形式,二者本質(zhì)上是一致的,唯一的區(qū)別是計算時使用了不同的數(shù)據(jù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組21三、幾何平均數(shù)(geometricmean)p78幾何平均數(shù)也稱幾何均值,它是n個變量值乘積的n次方根。幾何平均法是計算平均比率或平均發(fā)展速度最適用的一種方法。如果分布數(shù)列中各變量值呈幾何級數(shù)變化或頻率分布極不對稱,也常采用幾何平均法來計算平均數(shù)。根據(jù)統(tǒng)計資料的不同,幾何平均數(shù)也有簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)之分。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組22幾何平均數(shù)的計算公式

用途:適用于對比率數(shù)據(jù)的平均。主要用于計算平均發(fā)展速度、平均增長率、平均比率對于未分組的資料,幾何平均數(shù)的計算公式為2023/2/6版權(quán)所有BY統(tǒng)計學課程組23例題分析【例3.7】已知某市2008~2012年國內(nèi)生產(chǎn)總值的發(fā)展速度(以上年為100)依次分別為112%、108%、114%、116%和113%。試計算這5年國內(nèi)生產(chǎn)總值的平均發(fā)展速度。

如果已知的是各年的增長速度,要計算若干年的平均增長速度,則需要先將增長率加上100%得到發(fā)展速度,再根據(jù)上述方法計算平均發(fā)展速度,最后用平均發(fā)展速度減100%則得到平均增長速度。2023/2/6版權(quán)所有BY統(tǒng)計學課程組24例題分析【例3.8】甲投資銀行某項投資的年利率是按復利計算的,若將過去20年的年利率資料如表3-8所示.要求:試計算20年的平均年利率。2023/2/6版權(quán)所有BY統(tǒng)計學課程組25應(yīng)用幾何平均數(shù)時注意幾何平均數(shù)在實際應(yīng)用中受到很多限制;如果被平均的變量值中有一個為零,則不能計算幾何平均數(shù);如果變量值為負數(shù),開偶次根會形成虛根,失去意義;幾何平均數(shù)在實際應(yīng)用中的范圍比算術(shù)平均數(shù)要窄。2023/2/6版權(quán)所有BY統(tǒng)計學課程組26第二節(jié)集中趨勢—位置平均數(shù)p80一、眾數(shù)Mo二、中位數(shù)Me三、四分位數(shù)QU、QL2023/2/6版權(quán)所有BY統(tǒng)計學課程組27集中趨勢—位置平均數(shù)位置平均數(shù):根據(jù)總體中處于特殊位置上的個別單位或部分單位的標志值來確定的代表值;對于整個總體來說,具有非常直觀的代表性,常用來反映分布的集中趨勢;常用的位置平均數(shù)有眾數(shù)和中位數(shù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組28一、眾數(shù)p80(一)眾數(shù)的含義眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用表示。眾數(shù)直觀地說明分布的集中趨勢,并用它作為反映變量值一般水平的代表值。在某些場合只有眾數(shù)才適合作為總體的代表值。2023/2/6版權(quán)所有BY統(tǒng)計學課程組29(二)眾數(shù)的計算方法1.觀察法求眾數(shù)如果數(shù)據(jù)已按單個變量值整理成頻率分布表或者是分類數(shù)據(jù)表,則次數(shù)出現(xiàn)最多或頻率最大的那個變量值即為眾數(shù)?!纠?.9】某制鞋廠要了解消費者最需要哪種型號的男皮鞋,調(diào)查了某百貨商場2009年3月男皮鞋的銷售情況,得到資料如表3-9所示。2023/2/6版權(quán)所有BY統(tǒng)計學課程組30眾數(shù)的計算--例題分析要求:試根據(jù)上表資料計算男皮鞋銷售量的眾數(shù)。解:銷售量最多的是規(guī)格為25.5厘米的鞋號,銷售量320雙,占32%,故眾數(shù)為25.5公分。2023/2/6版權(quán)所有BY統(tǒng)計學課程組31眾數(shù)的計算--例題分析p81【例3.10】某高校電影院在安排2010年影片放映計劃時,分別按性別隨機抽取200名男女學生,登記其對影片類型的取向。統(tǒng)計結(jié)果如表3-10所示。要求:試分析學生對影片取向的集中趨勢。解:

7種類型的影片中,男生最喜歡看動作片,人數(shù)為48人,占24%,眾數(shù)即為動作片這種影片類型;女生最喜歡看言情片,人數(shù)為46人,占23%,眾數(shù)即為言情片這種影片類型;男女生對影片類型的取向,綜合而言是動作片,眾數(shù)為動作片這種影片類型。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組32數(shù)值型數(shù)據(jù)眾數(shù)的確定方法單變量值分組資料某年級83名女生身高資料

身高人數(shù)(CM)(人)

152115421552156415711582159216012161716281634

身高人數(shù)(CM)(人)

1643165816651673168716911705171217231741總計

83

STAT眾數(shù)2023/2/6版權(quán)所有BY統(tǒng)計學課程組33

注意:

眾數(shù)不僅適用于測度順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的集中趨勢,而且適用于測度不能計算平均數(shù)的分類數(shù)據(jù)的集中趨勢。2023/2/6版權(quán)所有BY統(tǒng)計學課程組34眾數(shù)的計算方法2.插值法求眾數(shù)對于組距分組形成的分布數(shù)列,當頻率分布屬于完全對稱分布,而眾數(shù)所在組的變量值分布比較均勻時,可用觀察法求眾數(shù),即以眾數(shù)組的組中值作為所求的眾數(shù)。完全對稱分布不存在,眾數(shù)組前后各組的次數(shù)不一定相等,眾數(shù)就不等于組中值,因此需要采用插值法求眾數(shù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組35組距分組數(shù)據(jù),眾數(shù)的計算步驟1、先找到眾數(shù)所在的組;2、按該組次數(shù)與前后相鄰兩組分布次數(shù)之差所占的比重來推算眾數(shù)值。如果眾數(shù)組前一組的次數(shù)大于后一組的次數(shù),則眾數(shù)值小于其所在組的組中值;反之,眾數(shù)值則大于其所在組的組中值;若眾數(shù)組前后相鄰組的次數(shù)相等,則眾數(shù)值等于其所在組的組中值。3、計算眾數(shù)有上限和下限公式之分。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組36眾數(shù)的計算方法2023/2/6版權(quán)所有BY統(tǒng)計學課程組37

身高人數(shù)比重(CM)(人)(%)

150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25

總計83100某年級83名女生身高資料③數(shù)值型數(shù)據(jù)眾數(shù)的確定方法組距分組資料STAT眾數(shù)組2023/2/6版權(quán)所有BY統(tǒng)計學課程組38

眾數(shù)的特點1.眾數(shù)不受分布數(shù)列的極大或極小值的影響,眾數(shù)對分布數(shù)列有好的代表性。2.數(shù)據(jù)的分布沒有明顯的集中趨勢或最高峰點,眾數(shù)可能不存在;3.有兩個或多個高峰點,可以有兩個或多個眾數(shù)。眾數(shù)不具有唯一性。4.眾數(shù)缺乏敏感性。2023/2/6版權(quán)所有BY統(tǒng)計學課程組39二、中位數(shù)Mep83(一)中位數(shù)的含義中位數(shù)是將數(shù)據(jù)按大小順序排列起來,形成一個數(shù)列,居于數(shù)列中間位置的那個變量值稱為中位數(shù)。中位數(shù)用Me表示。2023/2/6版權(quán)所有BY統(tǒng)計學課程組40中位數(shù)的計算中位數(shù)概念:排序后處于中間位置上的值1.根據(jù)未分組數(shù)據(jù)計算中位數(shù)。Me50%50%2023/2/6版權(quán)所有BY統(tǒng)計學課程組41例題分析【例3.12】某班第一、二兩個小組統(tǒng)計學期末考試成績排序結(jié)果如表3-12所示。要求:分別計算兩小組成績的中位數(shù)解:兩個學習小組的考試成績已經(jīng)分別按由低到高排列。第一小組有7個學生,第4位為中位數(shù)的位置,Me=75.

第二小組有8個學生,中位數(shù)的位置處于第四和第五個學生之間。2023/2/6版權(quán)所有BY統(tǒng)計學課程組42中位數(shù)的計算2.由分組資料確定中位數(shù)

如果由組距數(shù)列確定中位數(shù),應(yīng)先按的公式求出中位數(shù)所在組的位置,然后再按下限公式或上限公式確定中位數(shù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組43組距分組數(shù)據(jù)中位數(shù)的確定方法

身高fi人數(shù)累計(CM)(人)人數(shù)

150-15533155-1601114160-1653448165-1702472170以上1183

總計83某年級83名女生身高資料STAT中位數(shù)組2023/2/6版權(quán)所有BY統(tǒng)計學課程組44

中位數(shù)的特點1.不受分布數(shù)列的極大或極小值影響。2.有些離散型變量的單項式數(shù)列,當次數(shù)分布偏態(tài)時,中位數(shù)的代表性會受到影響。3.中位數(shù)缺乏敏感性。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組45三、四分位數(shù)p85

中位數(shù)是根據(jù)其在數(shù)列中所處的位置來確定的一個平均數(shù),作為各變量值的一個代表值,以反映分布數(shù)列的集中趨勢。為了進一步了解一組數(shù)據(jù)分布的內(nèi)部結(jié)構(gòu),觀察變量值在各個區(qū)間的一般水平,還可以計算四分位數(shù)、十分位數(shù)和百分位數(shù)。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組46

四分位數(shù)四分位數(shù)是通過3個點將全部數(shù)據(jù)等分為四個部分,其中每部分包含25%的數(shù)據(jù)。

QLMeQU25%25%25%25%處于25%和75%位置上的值即四分位數(shù)特點:不受極端值的影響要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)(各種分位數(shù)可由spss計算)2023/2/6版權(quán)所有BY統(tǒng)計學課程組47四分位數(shù)的計算1.根據(jù)未分組數(shù)據(jù)計算四分位數(shù)時,先對數(shù)據(jù)進行排序,然后再確定四分位數(shù)所在的位置當四分位數(shù)的位置不是整數(shù)時,可根據(jù)四分位數(shù)的位置,按比例分攤四分位數(shù)所在位置兩側(cè)變量值之差的數(shù)值。2023/2/6版權(quán)所有BY統(tǒng)計學課程組48四分位數(shù)的計算—例題分析【例3.14】將例3.12中兩個學習小組的統(tǒng)計學考試成績合并如下:

要求:

(1)計算前15個學生統(tǒng)計學考試成績的四分位數(shù);(2)如果增加一個學生的成績95分,試計算16個學生統(tǒng)計學考試成績的四分位數(shù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組49四分位數(shù)的計算—例題分析2023/2/6版權(quán)所有BY統(tǒng)計學課程組50四分位數(shù)的計算2.根據(jù)組距數(shù)列計算四分位數(shù)

2023/2/6版權(quán)所有BY統(tǒng)計學課程組51四分位數(shù)的計算2023/2/6版權(quán)所有BY統(tǒng)計學課程組52

算術(shù)平均數(shù)簡評算術(shù)平均數(shù):算術(shù)平均數(shù)符合上述六個條件,應(yīng)用范圍最廣。易受極端值的影響。當分布數(shù)列中存在開口組時,會影響平均數(shù)的準確性。算術(shù)平均數(shù)適用于數(shù)值型數(shù)據(jù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組53(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系

在數(shù)據(jù)分布呈完全對稱的正態(tài)分布時,算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者相等。在次數(shù)分布非對稱時,算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者不相等,但具有相對固定的關(guān)系。在尾巴拖在右邊的正偏態(tài)(或右偏態(tài))分布中,眾數(shù)最小,中位數(shù)適中,算術(shù)平均數(shù)最大。2023/2/6版權(quán)所有BY統(tǒng)計學課程組54

眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系

左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值對何種數(shù)據(jù)而言的?2023/2/6版權(quán)所有BY統(tǒng)計學課程組55第三節(jié)離中趨勢的測度

p85數(shù)據(jù)分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側(cè)面說明了集中趨勢測度值的代表性注意:數(shù)據(jù)的離散程度越大,集中趨勢的測度對該組數(shù)據(jù)的代表性越差;數(shù)據(jù)的離散程度越小,集中趨勢的測度值對該組數(shù)據(jù)的代表性越好。不同類型的數(shù)據(jù)有不同的離散程度測度值2023/2/6版權(quán)所有BY統(tǒng)計學課程組56下面是兩個總體關(guān)于年齡分布的數(shù)據(jù),相對而言,那個總體的年齡分布分散,差異大些?46、47、48、49、50、51、52、53、548、15、20、30、5070、80、85、92總體1總體22023/2/6版權(quán)所有BY統(tǒng)計學課程組57離中趨勢;數(shù)據(jù)遠離中心的趨勢

(分散程度)總體2總體12023/2/658數(shù)值型數(shù)據(jù):①全距(或稱極差)(range

)②平均差(meandeviation)③方差和標準差(Varianceandstandarddeviation)④相對離散程度:離散系數(shù)(CoefficientofVariation

)分類數(shù)據(jù):異眾比率(variationratio)順序數(shù)據(jù):四分位差(quartilerange

)離散程度的測度2023/2/6版權(quán)所有BY統(tǒng)計學課程組59一、全距(Range)

全距也稱為極差,是指一組數(shù)據(jù)的最大值與最小值之差,用R表示。即:R=最大變量值-最小變量值沒有開口組的組距分布數(shù)列計算全距,可以用最大組的上限值減去最小組的下限值,得到全距的近似值。全距可以反映一組數(shù)據(jù)的差異范圍。2023/2/6版權(quán)所有BY統(tǒng)計學課程組60全距的計算【例3.16】表3-14是兩組人口關(guān)于年齡分布的數(shù)據(jù),要求計算全距。解:第一組全距第二組全距

注意:如果組距分布數(shù)列中有開口組,則不能計算全距。全距計算簡單,易理解,易受極端值的影響;不能反映中間數(shù)據(jù)分散狀況,不能準確描述數(shù)據(jù)的分散程度。2023/2/661

二、異眾比率

(variationratio)① 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率②計算公式為③用于對分類數(shù)據(jù)離散程度的測度

④用于衡量眾數(shù)的代表性2023/2/6版權(quán)所有BY統(tǒng)計學課程組62異眾比率

異眾比率主要用于衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性越好。異眾比率適合測度分類數(shù)據(jù)、測度順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的離散程度。2023/2/6版權(quán)所有BY統(tǒng)計學課程組63異眾比率的應(yīng)用

p89【例3.17】根據(jù)例3.10的數(shù)據(jù)計算學生對影片取向的異眾比率。【解】根據(jù)公式得說明:比較上面的三個異眾比率,全部樣本學生的異眾比率最大,說明其眾數(shù)的代表性最差;男生的異眾比率略小于女生的異眾比率,說明男生對影片取向的眾數(shù)的代表性略好于女生對影片取向的眾數(shù)的代表性。2023/2/6版權(quán)所有BY統(tǒng)計學課程組64三、四分位差p89

注意:①上四分位數(shù)與下四分位數(shù)之差

Qd=QU

–QL反映了中間50%數(shù)據(jù)的離散程度②對順序數(shù)據(jù)離散程度的測度③不受極端值的影響④用于衡量中位數(shù)的代表性2023/2/6版權(quán)所有BY統(tǒng)計學課程組65四分位差的應(yīng)用注意:四分位差不易受極端值的影響,可以測量含有開口組的數(shù)據(jù)分布的差異程度,但不能反映所有變量值的差異程度?!纠恳罁?jù)前面例3.16中兩組人口年齡的四分位差:

結(jié)論:第一、第二組的中位數(shù)均為50歲,但其代表性不同。第一小組的中位數(shù)代表性相對高些,因為相對而言,四分位差小,數(shù)據(jù)分布集中。第二組年齡中位數(shù)代表性低些,因為該組年齡差異大,年齡分布相對分散。2023/2/6版權(quán)所有BY統(tǒng)計學課程組66四、平均差(AverageDeviation)平均差就是各個變量值與其算術(shù)平均數(shù)離差的絕對值的平均數(shù),以AD表示。它綜合反映了各變量值的變動程度,是各個離差的代表值。平均差越大,則表示變量值的離散程度越大,說明平均數(shù)的代表性越??;平均差越小,則表示變量值的離散程度越小,說明平均數(shù)的代表性越大。2023/2/6版權(quán)所有BY統(tǒng)計學課程組67

平均差的計算①各變量值與其均值離差絕對值的平均數(shù)計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)諸變量值與均值的偏差②能全面反映一組數(shù)據(jù)的離散程度③數(shù)學性質(zhì)較差,實際中應(yīng)用較少2023/2/6版權(quán)所有BY統(tǒng)計學課程組68

平均差的計算【例3.18】

要求:根據(jù)例3.16所給的資料分別計算第一、第二組人口年齡的平均差,并比較其平均年齡的代表性。解:結(jié)論:

比較兩個平均差可知,兩組人口年齡平均數(shù)均為50歲,第一組平均差小,人口年齡分布的差異小,平均年齡的代表性好;第二組平均差大,年齡分布的離散水平大,平均年齡的代表性差些。2023/2/6版權(quán)所有BY統(tǒng)計學課程組69

平均差的計算【例3.19】根據(jù)表的資料計算120名職工通信費用支出額的平均差。解:2023/2/6版權(quán)所有BY統(tǒng)計學課程組70平均差的含義:

每名職工通信費用支出額有高有低,與平均數(shù)165元相比,差異有大有小。平均差表明:以平均通信費用165元為中心,每名職工通信費用支出額與平均水平的平均差距為42.42元。注意:平均差易理解、計算簡便,可以說明數(shù)據(jù)分布的離中趨勢;但由于有絕對值及數(shù)理統(tǒng)計學的廣泛應(yīng)用,故其應(yīng)用范圍受到限制。2023/2/6版權(quán)所有BY統(tǒng)計學課程組71五、方差與標準差p92方差是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的平均數(shù),通常以表示總體方差,s2表示樣本方差。標準差又稱均方差,是方差的平方根,一般用表示總體標準差,以S表示樣本標準差。方差和標準差的計算也分為簡單平均法和加權(quán)平均法。對于總體數(shù)據(jù)和樣本數(shù)據(jù),公式略有不同。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組72方差與標準差注意:方差和標準差是根據(jù)全部數(shù)據(jù)計算的,它反映了每個數(shù)據(jù)與其均值相比平均相差的數(shù)值;它能準確地反映出數(shù)據(jù)的離散程度;方差和標準差是應(yīng)用最廣泛的離散程度測度值。

2023/2/6版權(quán)所有BY統(tǒng)計學課程組73總體方差與標準差的計算公式總體標準差2023/2/6版權(quán)所有BY統(tǒng)計學課程組74樣本方差和標準差(記?。﹑92

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!2023/2/6版權(quán)所有BY統(tǒng)計學課程組75方差與標準差的應(yīng)用【例3.20】要求:根據(jù)表中的數(shù)據(jù)計算120名職工通信費用支出額的方差和標準差。2023/2/6版權(quán)所有BY統(tǒng)計學課程組76方差與標準差的計算【解】已知平均數(shù)為165元,因是隨機抽取的樣本資料,故依據(jù)樣本方差及標準差的公式計算。計算結(jié)果表明,樣本中每名職工月通信費用支出額與月平均通信費用支出額165元的水平相比,差異有大有小,但平均偏差是51.4元。2023/2/6版權(quán)所有BY統(tǒng)計學課程組77方差與標準差的應(yīng)用【例3.21】考察一臺機器的生產(chǎn)狀況,利用抽樣程序來檢驗其生產(chǎn)出來的產(chǎn)品質(zhì)量是否穩(wěn)定。據(jù)行業(yè)標準,如果樣本零件尺寸的標準差大于0.3公分,則表明該零件的質(zhì)量不穩(wěn)定,需要對該機器進行停工檢修。數(shù)據(jù)如下:要求:根據(jù)資料,判斷該機器是否需要停工修。2023/2/6版權(quán)所有BY統(tǒng)計學課程組78方差與標準差的應(yīng)用解:計算的樣本標準差0.2126公分,小于0.3分,表明該臺機器不需要停工檢修。注意:標準差是一個重要的偏差,描述了各觀察值與均值的平均距離。2023/2/6版權(quán)所有BY統(tǒng)計學課程組79六、離散系數(shù)p94離散系數(shù)(標準差系數(shù)或變異系數(shù))通常是用標準差來計算的,它是一組數(shù)據(jù)的標準差與其相應(yīng)的均值之比,是測度數(shù)據(jù)離散程度的相對指標,其計算公式為:式中:Vσ和Vs分別表示總體離散系數(shù)和樣本離散系數(shù)。2023/2/6版權(quán)所有BY統(tǒng)計學課程組80離散系數(shù)的應(yīng)用平均水平或計量單位不同的不同組別的變量值,不能直接用離散程度的測度值比較。平均水平或計量單位不同的不同組別進行比較,需計算離散系數(shù)。離散系數(shù)大的說明該組數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說明該組數(shù)據(jù)的離散程度小。2023/2/6版權(quán)所有BY統(tǒng)計學課程組81離散系數(shù)的應(yīng)用【例3.22】從某管理局所屬的兩家企業(yè)中各隨機抽取10名職工,調(diào)查獲得他們的年收入數(shù)據(jù)如表所示:要求:根據(jù)上表數(shù)據(jù)計算甲乙兩企業(yè)抽樣職工的平均收入以及離散系數(shù),說明兩組數(shù)據(jù)的離散程度及平均數(shù)的代表性。2023/2/6版權(quán)所有BY統(tǒng)計學課程組82結(jié)論:

因為v乙<v甲,所以乙企業(yè)職工年收入平均水平比的甲企業(yè)的更具有代表性。v甲=4667014354.25=30.76%v乙=5338015277.4=28.62%2023/2/6版權(quán)所有BY統(tǒng)計學課程組83第四節(jié)偏態(tài)與峰態(tài)的測度p98一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論