第4章數(shù)據(jù)概括性度量_第1頁
第4章數(shù)據(jù)概括性度量_第2頁
第4章數(shù)據(jù)概括性度量_第3頁
第4章數(shù)據(jù)概括性度量_第4頁
第4章數(shù)據(jù)概括性度量_第5頁
免費預覽已結(jié)束,剩余93頁可下載查看

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第4章數(shù)據(jù)的概括性度量PowerPoint統(tǒng)計學概述

圖表只能對數(shù)據(jù)分布的形狀和特征有大致的了解,要更準確地把握數(shù)據(jù)分布的特征,還需要找到分布特征的各個代表值:數(shù)據(jù)集中趨勢的代表值、數(shù)據(jù)離散程度的代表值、分布形狀的代表值等。第4章數(shù)據(jù)的概括性度量4.1

集中趨勢的度量4.2離散程度的度量4.3偏態(tài)與峰態(tài)的度量學習目標1. 集中趨勢各測度值的計算方法2. 集中趨勢各測度值的特點及應用場合3. 離散程度各測度值的計算方法4. 離散程度各測度值的特點及應用場合偏態(tài)與峰態(tài)的測度方法用Excel計算描述統(tǒng)計量并進行分析4.1集中趨勢的度量4.1.1分類數(shù)據(jù):眾數(shù)4.1.2順序數(shù)據(jù):中位數(shù)和分位數(shù)4.1.3數(shù)值型數(shù)據(jù):平均數(shù)4.1.4眾數(shù)、中位數(shù)和平均數(shù)的比較集中趨勢

(centraltendency)數(shù)據(jù)的集中趨勢

—一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值不同類型(分類、順序、數(shù)值)的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)分類數(shù)據(jù):眾數(shù)眾數(shù)

(mode)眾數(shù)

—一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用Mo表示適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)

(不惟一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242分類數(shù)據(jù)的眾數(shù)

(P86:例4.1)不同類型軟飲的頻數(shù)分布

飲料類型頻數(shù)比例百分比(%)

果汁礦泉水綠茶其他碳酸飲料610118150.120.200.220.160.301220221630合計501100【例4.1】計算“飲料類型”的眾數(shù)解:這里的變量為“飲料類型”,這是個分類變量,不同類型的飲料就是變量值所調(diào)查的50人中,購買碳酸飲料的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即

Mo=碳酸飲料順序數(shù)據(jù)的眾數(shù)

(P86:例4.2)【例4.2】計算甲城市居民對住房狀況的滿意程度評價的眾數(shù)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別”甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0眾數(shù)要點眾數(shù)是一個位置代表值,不受數(shù)據(jù)中極端值的影響眾數(shù)是具有明顯集中趨勢點的數(shù)值,一組數(shù)據(jù)分布的最高峰點所對應的數(shù)值即為眾數(shù)如果數(shù)據(jù)的分布沒有明顯的集中趨勢或最高峰點,眾數(shù)可能不存在。如果有兩個或多個最高峰點,則可能存在多個眾數(shù)。(見P75:圖4-1)順序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù)和分位數(shù)找出一組數(shù)據(jù)經(jīng)過排序后,處于某個位置上的值中位數(shù)

(median)中位數(shù)

—一組數(shù)據(jù)排序后,處于中間位置上的值,用Me表示Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即中位數(shù)

(位置和數(shù)值的確定)位置確定數(shù)值確定順序數(shù)據(jù)的中位數(shù)

(例題分析)【例4.4】根據(jù)左表的數(shù)據(jù)求出甲城市家庭對住房滿意程度的中位數(shù)。解:中位數(shù)的位置為

(300+1)/2=150.5

從累計頻數(shù)看,中位數(shù)在“一般”這一組別中中位數(shù)為

Me=一般甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—數(shù)值型數(shù)據(jù)的中位數(shù)

(9個數(shù)據(jù)的算例)【例4.3】以下為9個家庭的人均月收入數(shù)據(jù),求這些家庭人均收入的中位數(shù)。原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)

(10個數(shù)據(jù)的算例)【例】:以下為10個家庭的人均月收入數(shù)據(jù),求其中位數(shù)排序:

660

75078085096010801250150016302000位置:1234

5678910四分位數(shù)

(quartile)四分位數(shù)

—排序后處于25%和75%位置上的值不受極端值的影響計算公式QLQMQU25%25%25%25%注意:(1)若QL(QU)為整數(shù),則取QL(QU)對應位置上的數(shù)值為四分位數(shù);(2)如果QL(QU)小數(shù)點后為0.5,則取該位置兩側(cè)的值的平均數(shù);(3)如果QL或QU小數(shù)點后為0.25或0.75,則取該位置下側(cè)值加上按比例分攤兩側(cè)數(shù)值的差值。順序數(shù)據(jù)的四分位數(shù)

(例題分析)【例】根據(jù)左表數(shù)據(jù)求甲城市家庭對住房滿意程度的四分位數(shù)。解:QL位置=(300)/4=75QU位置=(3×300)/4

=225

從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中四分位數(shù)為

QL

=不滿意

QU

=一般甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個數(shù)據(jù)的算例)【例4.6】:根據(jù)以下9個家庭的人均月收入數(shù)據(jù),計算人均月收入的四分位數(shù)。原始數(shù)據(jù):15007507801080850960200012501630排序:750780850960108012501500

16302000位置:123456

789數(shù)值型數(shù)據(jù):平均數(shù)平均數(shù)

(mean)平均數(shù)

—也稱為均值,是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)得到的結(jié)果。僅適合數(shù)值型數(shù)據(jù),不適用于分類和順序數(shù)據(jù)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在易受極端值的影響有簡單平均數(shù)和加權(quán)平均數(shù)之分根據(jù)總體數(shù)據(jù)計算的,稱為總總體平均數(shù),記為;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本平均數(shù),記為xx簡單平均數(shù)

(Simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn(總體數(shù)據(jù)xN)樣本平均數(shù)總體平均數(shù)簡單平均數(shù)的若干數(shù)學性質(zhì)若每個變量值X加減一任意常數(shù),則平均數(shù)也增減一個若每個變量值X乘以一任意常數(shù),則平均數(shù)也乘以一個若每個變量值X除以一任意常數(shù),則平均數(shù)也除以一個各個變量值X與算術(shù)平均數(shù)的離差和為零各個變量值X與算術(shù)平均數(shù)的離差平方和為最小值加權(quán)平均數(shù)

(Weightedmean)加權(quán)平均數(shù)

—根據(jù)分組數(shù)據(jù)計算的平均數(shù)設(shè)各組的組中值為:M1,M2,…,Mk

相應的頻數(shù)為:f1,f2,…,fk樣本加權(quán)平均總體加權(quán)平均加權(quán)平均數(shù)

(例題分析)【例4.7】根據(jù)左表數(shù)據(jù)計算電腦銷售量的平均數(shù)。解:某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(Mi)頻數(shù)(fi)Mifi

140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845580139526404725370033152050

合計—12022200平均數(shù)的統(tǒng)計意義

平均數(shù)是一組數(shù)據(jù)的重心所在,是數(shù)據(jù)誤差相互抵消后的結(jié)果。反映出事物必然性的數(shù)量特征。在統(tǒng)計學中具有重要地位。幾何平均數(shù)

(geometricmean)幾何平均數(shù)

—n個變量值乘積的

n次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為可看作是平均數(shù)的一種變形幾何平均數(shù)

(例題分析)

【例4.8】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:

幾何平均:注意:當所平均的各比率數(shù)值相差不大時,算術(shù)平均和幾何平均的結(jié)果相差不大,如果各比率的數(shù)值相差較大時,二者的差別就很明顯。眾數(shù)、中位數(shù)和平均數(shù)的比較眾數(shù)、中位數(shù)、平均數(shù)的特點和應用眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時應用主要適合于數(shù)據(jù)量較大的分類數(shù)據(jù)的集中趨勢測量中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應用主要適用于順序數(shù)據(jù)的集中趨勢測量平均數(shù)易受極端值影響數(shù)學性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應用適用于數(shù)值型數(shù)據(jù)均值、中位數(shù)與眾數(shù)的關(guān)系對稱分布Mo=Me=X—均值、中位數(shù)與眾數(shù)的關(guān)系右偏分布Mo<Me<X—正偏(右偏)左偏分布<Me<Mo—X負偏(左偏)下列關(guān)于眾數(shù)的說法,錯誤的是()A.一組數(shù)據(jù)可能存在多個眾數(shù)B.眾數(shù)主要適用于分類數(shù)據(jù)C.眾數(shù)不受極端值的影響D.主要在數(shù)據(jù)分布對稱的情況下,用于對數(shù)據(jù)集中程度的度量

某居民區(qū)準備采取一項新的物業(yè)管理措施,為此,隨機抽取了100戶居民進行調(diào)查,其中表示贊成的有69戶,表示中立的有22戶,表示反對的有9戶。描述該數(shù)據(jù)的集中趨勢最好采用()A.眾數(shù)B.中位數(shù)C.四分位數(shù)D.平均數(shù)在某行業(yè)中隨機抽取10家企業(yè),第一季度的利潤額(單位:萬元)分別是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。該組數(shù)據(jù)的中位數(shù)為()A.28.46B.30.2C.27.95D.39.19練習(1)DBC練習P94:4.1(1)(2)4.2(1)(2)4.2離散程度的度量4.2.1分類數(shù)據(jù):異眾比率4.2.2順序數(shù)據(jù):四分位差4.2.3數(shù)值型數(shù)據(jù):方差和標準差4.2.4相對離散程度:離散系數(shù)離散程度數(shù)據(jù)的離散程度

—反映各變量值遠離其中心值的程度(離散程度)數(shù)據(jù)分布的另一個重要特征從另一個側(cè)面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值分類數(shù)據(jù):異眾比率異眾比率

(variationratio)異眾比率

—非眾數(shù)組的頻數(shù)占總頻數(shù)的比例,用Vr表示用于衡量眾數(shù)的代表程度,主要適合測度分類數(shù)據(jù)的離散程度(也適用于順序和數(shù)值型數(shù)據(jù))計算公式為fi為變量值的總頻數(shù),fm為眾數(shù)組的頻數(shù)Vr越大,表明眾數(shù)的代表性越差,數(shù)據(jù)不集中Vr越小,表明眾數(shù)的代表性越好,數(shù)據(jù)集中異眾比率

(例題分析)【例4.9】根據(jù)左表數(shù)據(jù)計算異眾比率解:

在所調(diào)查的50人當中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“碳酸飲料”代表消費者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

果汁礦泉水綠茶其他碳酸飲料610118150.120.200.220.160.301220221630合計501100順序數(shù)據(jù):四分位差四分位差

(quartiledeviation)四分位差

—上四分位數(shù)與下四分位數(shù)之差,用Qd表示

Qd

=QU–QL也稱為內(nèi)距或四分間距,反映了中間50%數(shù)據(jù)的離散程度是對順序數(shù)據(jù)離散程度的測度(也適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù))不受極端值的影響用于衡量中位數(shù)的代表性四分位差

(例題分析)【P97:例4.7】:9個家庭的人均月收入數(shù)據(jù)如下,請計算家庭人均月收入的四分位差。原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456

789解:Step1:先計算四分位數(shù):

Step2:再計算四分位差

QU-QL=1437.5-797.5=640數(shù)值型數(shù)據(jù):方差和標準差測度數(shù)值型數(shù)據(jù)離散程度的方法極差平均差方差和標準差(常用)極差

(range)極差

—一組數(shù)據(jù)的最大值與最小值之差,也稱為全距,用R表示離散程度的最簡單測度值計算公式為:R=max(xi)-min(xi)max(xi)和min(xi)分別表示一組數(shù)據(jù)的最大值和最小值缺點:易受極端值影響未考慮數(shù)據(jù)的分布不能反映出中間數(shù)據(jù)的分散狀況,因而不能準確描述出數(shù)據(jù)的分散程度極差

(例題分析)【例】:9個家庭的人均月收入數(shù)據(jù)如下,請計算家庭人均月收入的極差。原始數(shù)據(jù):15007507801080850960200012501630排序:750

78085096010801250150016302000解:計算極差:

Max(xi)

-Min(xi)L=2000-750=1250平均差

(meandeviation)平均差

—各變量值與其平均數(shù)離差絕對值的平均數(shù)計算公式未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差以平均數(shù)為中心,反映了每個數(shù)據(jù)與平均數(shù)的平均差異程度平均差越大,說明數(shù)據(jù)的離散程度越大;平均差越小,說明數(shù)據(jù)的離散程度越小。在實際中應用較少(因為計算中取絕對值給計算帶來不便)平均差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040已計算出:x=185_平均差

(例題分析)

含義:每一天的銷售量平均數(shù)相比,平均相差17臺方差和標準差

(varianceandstandarddeviation)方差

—是各變量值與其平均數(shù)離差平方的平均數(shù)。標準差

—方差的平方根。數(shù)據(jù)離散程度的最常用測度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差(標準差),記為2();根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差(標準差),記為s2(s)樣本方差和標準差

(samplevarianceandstandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!自由度

(degreeoffreedom)自由度是指數(shù)據(jù)個數(shù)與附加給獨立的觀測值的約束或限制的個數(shù)之差從字面涵義來看,自由度是指一組數(shù)據(jù)中可以自由取值的個數(shù)當樣本數(shù)據(jù)的個數(shù)為n時,若樣本平均數(shù)確定后,則附加給n個觀測值的約束個數(shù)就是1個,因此只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)不能自由取值按著這一邏輯,如果對n個觀測值附加的約束個數(shù)為k個,自由度則為n-k自由度

(degreeoffreedom)樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x

=5。當

x

=5

確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值為什么樣本方差的自由度為什么是n-1呢?因為在計算離差平方和時,必須先求出樣本均值x

,而x則是附件給離差平方和的一個約束,因此,計算離差平方和時只有n-1個獨立的觀測值,而不是n個樣本方差用自由度去除,其原因可從多方面解釋,從實際應用角度看,在抽樣估計中,當用樣本方差s2去估計總體方差σ2時,它是σ2的無偏估計量樣本標準差

(P86:例4.12)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845403020100102030405064008100640027000170040007200640012500合計—120—55400例4.12:根據(jù)下表數(shù)據(jù),計算電腦銷售量的標準差樣本標準差

(例題分析)

含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺總體方差和標準差

(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)總體方差的計算公式樣本標準差的計算公式練習P94:4.1(3)(4)4.2(3)相對位置的度量相對位置的度量(1)

標準分數(shù)(2)經(jīng)驗法則(3)切比雪夫不等式標準分數(shù)

(standardscore)標準分數(shù)

—變量值與其平均數(shù)的離差除以標準差后的值。也稱標準化值或z分數(shù)。計算公式為給出了一個值在一組數(shù)據(jù)中的相對位置,可用于判斷一組數(shù)據(jù)是否有離群點(outlier)在對多個具有不同量綱的變量進行處理時,常常需要對變量作標準化處理標準分數(shù)

(例題分析)9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996【例4.13】根據(jù)家庭人均月收入,計算每個家庭人均月收入的標準分數(shù)。標準分數(shù)

(性質(zhì))性質(zhì):z分數(shù)只是將原始數(shù)據(jù)進行了線性變換,它并沒有改變一個數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變該組數(shù)分布的形狀,而只是使該組數(shù)據(jù)均值為0,標準差為1

例如:以下一組數(shù)據(jù)平均數(shù)為34,標準差為6,其標準分數(shù)變換為:經(jīng)驗法則經(jīng)驗法則表明:當一組數(shù)據(jù)對稱分布時約有68%的數(shù)據(jù)在平均數(shù)加減1個標準差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個標準差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個標準差的范圍之內(nèi)在平均數(shù)左右3個標準差范圍內(nèi)幾乎包含了所有數(shù)據(jù),而在3個標準差以外的數(shù)據(jù),在統(tǒng)計上稱為離群點(outlier)(以上是數(shù)據(jù)是根據(jù)標準正態(tài)分布計算)見P88例題切比雪夫不等式

(Chebyshev’sinequality)【切比雪夫不等式】

對于任意分布形態(tài)的數(shù)據(jù),至少有1-1/k2的數(shù)據(jù)落在平均數(shù)加減k個標準差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)。如果一組數(shù)據(jù)不是對稱分布,經(jīng)驗法則就不再適用,這時可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式

(Chebyshev’sinequality)對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個標準差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個標準差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個標準差的范圍之內(nèi)相對離散程度:離散系數(shù)離散系數(shù)

(coefficientofvariation)離散系數(shù)(變異系數(shù))—標準差與其相應的均值之比計算公式為對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響用于對不同組別數(shù)據(jù)離散程度的比較離散系數(shù)

(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)

(例題分析)結(jié)論:

計算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710銷售額:銷售利潤:小結(jié)1.不同類型的數(shù)據(jù),采用不同測度值測度其離散程度分類數(shù)據(jù):異眾比率(主要)順序數(shù)據(jù):四分位差(也可以使用異眾比率)數(shù)值數(shù)據(jù):方差和標準差(平均差、極差或其它方法)對比不同樣本數(shù)據(jù)的離散程度:離散系數(shù)2.實際應用時,要根據(jù)所掌握的數(shù)據(jù)類型和分析目的來確定使用哪種測度值。如果一個數(shù)據(jù)的標準分數(shù)為2,表明該數(shù)據(jù)()A.比平均數(shù)高出2個標準差;B.比平均數(shù)低2個標準差;C.等于2倍平均數(shù);D.等于2倍標準差

某班學生的平均成績是80分,標準差是10分,如果已知該班學生的考試分數(shù)為對稱分布,可以判斷成績在60~100分之間的學生大約占()A.95%B.89%C.68%D.99%某班學生的平均成績是80分,標準差是5分。如果已知該班學生的考試分數(shù)是非對稱分布,可以判斷成績在70~90之間的學生至少占()A.95%B.89%C.68%D.75%(4)比較兩組數(shù)據(jù)的離散程度最適合用的統(tǒng)計量是()A.極差B.平均差C.標準差D.離散系數(shù)練習(2)AADD在離散程度的測度中,最容易受極端值影響的是()A.平均差;B.四分位差;C.標準差;D.極差

測度離散程度的相對統(tǒng)計量是()A.極差B.平均差C.標準差D.離散系數(shù)兩組數(shù)據(jù)的平均數(shù)不等,但標準差相等,則()A.平均數(shù)小的,離散程度大B.平均數(shù)大的,離散程度大C.平均數(shù)小的,離散程度小D.兩組數(shù)據(jù)離散程度相同。練習(3)DDA4.3偏態(tài)與峰態(tài)的度量4.3.1偏態(tài)及其測度4.3.2峰態(tài)及其測度偏態(tài)偏態(tài)

(skewness)偏態(tài)—由統(tǒng)計學家Pearson于1895年首次提出,用于測度數(shù)據(jù)分布偏斜程度。表征概率分布密度曲線相對于平均值不對稱程度的特征數(shù)。直觀看來就是密度函數(shù)曲線尾部的相對長度。

測量偏態(tài)的統(tǒng)計量是偏態(tài)系數(shù)偏態(tài)分類負偏(negativeskew)

左側(cè)尾部更長,分布主體集中在右側(cè),又稱為左偏。正偏(posiriveskew)

右側(cè)尾部更長,分布主體集中在左側(cè),又稱為右偏。對稱

平均值=中位數(shù)。正偏(右偏)分布負偏(左偏)分布對稱分布對稱、左偏、右偏偏態(tài)系數(shù)

(coefficientofskewness)樣本偏態(tài)系數(shù):根據(jù)原始數(shù)據(jù)計算樣本偏度(計算方法有多種)根據(jù)分組數(shù)據(jù)計算偏態(tài)系數(shù)=0為對稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)大于1或小于-1,被稱為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-1~-0.5之間,被認為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低

總體偏態(tài)系數(shù):SK=E(X-)3/3偏態(tài)系數(shù)

(例題分析)

某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)

fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000

70100000

P91:例4.15

根據(jù)下表,計算電腦銷售量的偏態(tài)系數(shù)偏態(tài)系數(shù)

(例題分析續(xù))結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)峰態(tài)峰態(tài)

(kurtosis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論