統(tǒng)計(jì)學(xué)第六版賈俊平第4章_第1頁
統(tǒng)計(jì)學(xué)第六版賈俊平第4章_第2頁
統(tǒng)計(jì)學(xué)第六版賈俊平第4章_第3頁
統(tǒng)計(jì)學(xué)第六版賈俊平第4章_第4頁
統(tǒng)計(jì)學(xué)第六版賈俊平第4章_第5頁
已閱讀5頁,還剩83頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 4 章 數(shù)據(jù)分布特征的測(cè)度,第 4 章 數(shù)據(jù)分布特征的測(cè)度,4.1 集中趨勢(shì)的測(cè)度 4.2 離散程度的測(cè)度 4.3 偏態(tài)與峰度的測(cè)度,學(xué)習(xí)目標(biāo),1.集中趨勢(shì)各測(cè)度值的計(jì)算方法 2.集中趨勢(shì)各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合 3.離散程度各測(cè)度值的計(jì)算方法 4.離散程度各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合 偏態(tài)與峰態(tài)的測(cè)度方法 用Excel計(jì)算描述統(tǒng)計(jì)量并進(jìn)行分析,數(shù)據(jù)分布的特征,數(shù)據(jù)分布特征的測(cè)度,4.1 集中趨勢(shì)的測(cè)度,一. 分類數(shù)據(jù):眾數(shù) 二. 順序數(shù)據(jù):中位數(shù)和分位數(shù) 三. 數(shù)值型數(shù)據(jù):均值 四. 眾數(shù)、中位數(shù)和均值的比較,數(shù)據(jù)分布特征的和測(cè)度(本節(jié)位置),集中趨勢(shì)(Central tendency),一

2、組數(shù)據(jù)向其中心值靠攏的傾向和程度 測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值 不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值 低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù),分類數(shù)據(jù):眾數(shù),眾數(shù)(mode),出現(xiàn)次數(shù)最多的變量值 不受極端值的影響 一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù) 主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),眾數(shù)(不唯一性),無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8,一個(gè)眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5,多于一個(gè)眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42,分類數(shù)據(jù)的眾數(shù) (例題分析),解:這里的變量為“飲料品牌”,這是個(gè)分

3、類變量,不同類型的飲料就是變量值 在所調(diào)查的50人中,購(gòu)買可口可樂的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即 Mo可口可樂,順序數(shù)據(jù)的眾數(shù) (例題分析),解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別” 甲城市中對(duì)住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意,順序數(shù)據(jù):中位數(shù)和分位數(shù),中位數(shù)(median),排序后處于中間位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),中位數(shù)(位置的確定),原始數(shù)據(jù):,順序數(shù)據(jù):,順序數(shù)據(jù)的中位數(shù) (例題分析),解:中位數(shù)的位置為 300/2150 從

4、累計(jì)頻數(shù)看,中位數(shù)在“一般”這一組別中。因此 Me=一般,數(shù)值型數(shù)據(jù)的中位數(shù) (9個(gè)數(shù)據(jù)的算例),【例】:9個(gè)家庭的人均月收入數(shù)據(jù) 原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,中位數(shù) 1080,數(shù)值型數(shù)據(jù)的中位數(shù) (10個(gè)數(shù)據(jù)的算例),【例】:10個(gè)家庭的人均月收入數(shù)據(jù) 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8

5、 9 10,四分位數(shù)(quartile),排序后處于25%和75%位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),四分位數(shù)(位置的確定),原始數(shù)據(jù):,順序數(shù)據(jù):,順序數(shù)據(jù)的四分位數(shù) (例題分析),解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 從累計(jì)頻數(shù)看, QL在“不滿意”這一組別中; QU在“一般”這一組別中。因此 QL = 不滿意 QU = 一般,數(shù)值型數(shù)據(jù)的四分位數(shù) (9個(gè)數(shù)據(jù)的算例),【例】:9個(gè)家庭的人均月收入數(shù)據(jù) 原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630 排

6、 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,數(shù)值型數(shù)據(jù)的四分位數(shù) (10個(gè)數(shù)據(jù)的算例),【例】:10個(gè)家庭的人均月收入數(shù)據(jù) 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10,數(shù)值型數(shù)據(jù):均值,均值(mean),集中趨勢(shì)的最常用測(cè)度值 一組數(shù)據(jù)的均衡點(diǎn)所在 體現(xiàn)了數(shù)據(jù)的必然性特征 易受極端值的影響 用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù),簡(jiǎn)單均值與加權(quán)均值(simple mean / weighted

7、 mean),設(shè)一組數(shù)據(jù)為: x1 ,x2 , ,xn 各組的組中值為:M1 ,M2 , ,Mk 相應(yīng)的頻數(shù)為: f1 , f2 , ,fk,簡(jiǎn)單均值,加權(quán)均值,已改至此!,加權(quán)均值 (例題分析),加權(quán)均值(權(quán)數(shù)對(duì)均值的影響),甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下 甲組: 考試成績(jī)(x ): 0 20 100 人數(shù)分布(f ):1 1 8 乙組: 考試成績(jī)(x): 0 20 100 人數(shù)分布(f ):8 1 1,均值(數(shù)學(xué)性質(zhì)),1.各變量值與均值的離差之和等于零,調(diào)和平均數(shù)(harmonic mean),均值的另一種表現(xiàn)形式 易受極端值的影響 計(jì)算公式為,原來只是計(jì)算時(shí)使用

8、了不同的數(shù)據(jù)!,調(diào)和平均數(shù) (例題分析),【例】某蔬菜批發(fā)市場(chǎng)三種蔬菜的日成交數(shù)據(jù)如表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格,幾何平均數(shù)(geometric mean),n 個(gè)變量值乘積的 n 次方根 適用于對(duì)比率數(shù)據(jù)的平均 主要用于計(jì)算平均增長(zhǎng)率 計(jì)算公式為,5. 可看作是均值的一種變形,幾何平均數(shù) (例題分析),【例】某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬噸,2000年與1999年相比增長(zhǎng)率為9%,2001年與2000年相比增長(zhǎng)率為16%,2002年與2001年相比增長(zhǎng)率為20%。求各年的年平均增長(zhǎng)率。,年平均增長(zhǎng)率114.91%-1=14.91%,幾何平均數(shù) (例題分析),【例】一位投資

9、者購(gòu)持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率,算術(shù)平均:,幾何平均:,眾數(shù)、中位數(shù)和均值的比較,眾數(shù)、中位數(shù)和均值的關(guān)系,眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用,眾數(shù) 不受極端值影響 具有不唯一性 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用 中位數(shù) 不受極端值影響 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用 平均數(shù) 易受極端值影響 數(shù)學(xué)性質(zhì)優(yōu)良 數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用,數(shù)據(jù)類型與集中趨勢(shì)測(cè)度值,4.2 離散程度的測(cè)度,分類數(shù)據(jù):異眾比率 順序數(shù)據(jù):四分位差 數(shù)值型數(shù)據(jù):方差及標(biāo)準(zhǔn)差 相對(duì)位置的測(cè)量:標(biāo)準(zhǔn)分?jǐn)?shù) 相對(duì)離散程度

10、:離散系數(shù),數(shù)據(jù)的特征和測(cè)度(本節(jié)位置),離中趨勢(shì),數(shù)據(jù)分布的另一個(gè)重要特征 反映各變量值遠(yuǎn)離其中心值的程度(離散程度) 從另一個(gè)側(cè)面說明了集中趨勢(shì)測(cè)度值的代表程度 不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值,分類數(shù)據(jù):異眾比率,異眾比率(variation ratio),1.對(duì)分類數(shù)據(jù)離散程度的測(cè)度 2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比率 3.計(jì)算公式為,4. 用于衡量眾數(shù)的代表性,異眾比率 (例題分析),解: 在所調(diào)查的50人當(dāng)中,購(gòu)買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費(fèi)者購(gòu)買飲料品牌的狀況,其代表性不是很好,順序數(shù)據(jù):四分位差,四分位差(quartile devi

11、ation),對(duì)順序數(shù)據(jù)離散程度的測(cè)度 也稱為內(nèi)距或四分間距 上四分位數(shù)與下四分位數(shù)之差 QD = QU QL 反映了中間50%數(shù)據(jù)的離散程度 不受極端值的影響 用于衡量中位數(shù)的代表性,四分位差 (例題分析),解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2 QU = 一般 = 3 四分位差: QD = QU = QL = 3 2 = 1,數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差,極差(range),一組數(shù)據(jù)的最大值與最小值之差 離散程度的最簡(jiǎn)單測(cè)度值 易受極端值影響 未考慮數(shù)據(jù)的分布,R = max(xi) - min(xi),計(jì)算公式為,平均差(m

12、ean deviation),各變量值與其均值離差絕對(duì)值的平均數(shù) 能全面反映一組數(shù)據(jù)的離散程度 數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少,計(jì)算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),平均差 (例題分析),平均差 (例題分析),含義:每一天的銷售量平均數(shù)相比, 平均相差17臺(tái),方差和標(biāo)準(zhǔn)差(variance and standard deviation),數(shù)據(jù)離散程度的最常用測(cè)度值 反映了各變量值與均值的平均差異 根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差,樣本方差和標(biāo)準(zhǔn)差 (simple variance and standard deviation),未分組數(shù)據(jù):,組距

13、分組數(shù)據(jù):,未分組數(shù)據(jù):,組距分組數(shù)據(jù):,方差的計(jì)算公式,標(biāo)準(zhǔn)差的計(jì)算公式,樣本方差自由度(degree of freedom),一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù) 當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值x 確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值 例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值 樣本方差用自由度去除,其原因可從多方面來解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差2

14、時(shí),它是2的無偏估計(jì)量,樣本標(biāo)準(zhǔn)差 (例題分析),樣本標(biāo)準(zhǔn)差 (例題分析),含義:每一天的銷售量與平均數(shù)相比, 平均相差21.58臺(tái),相對(duì)位置的測(cè)量:標(biāo)準(zhǔn)分?jǐn)?shù),標(biāo)準(zhǔn)分?jǐn)?shù)(standard score),1. 也稱標(biāo)準(zhǔn)化值 2.對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量 3.可用于判斷一組數(shù)據(jù)是否有離群點(diǎn) 4.用于對(duì)變量的標(biāo)準(zhǔn)化處理 5. 計(jì)算公式為,標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì)),均值等于0 2.方差等于1,標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì)),z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在改組數(shù)據(jù)中的位置,也沒有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。,標(biāo)準(zhǔn)化值 (例題分析),經(jīng)驗(yàn)法則,經(jīng)驗(yàn)法則

15、表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí) 約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),切比雪夫不等式(Chebyshevs inequality ),如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不再使用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用 切比雪夫不等式提供的是“下界”,也就是“所占比例至少和多少” 對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有 的數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù),切比雪夫不等式(Chebyshevs inequality ),對(duì)于k=2,

16、3,4,該不等式的含義是 至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),相對(duì)離散程度:離散系數(shù),離散系數(shù)(coefficient of variation),1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比 對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度 消除了數(shù)據(jù)水平高低和計(jì)量單位的影響 4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較 5. 計(jì)算公式為,離散系數(shù) (例題分析),【 例 】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度,離散系數(shù) (例題分析),結(jié)論: 計(jì)算結(jié)果表明,v1v2,

17、說明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度,數(shù)據(jù)類型與離散程度測(cè)度值,4.3 偏態(tài)與峰態(tài)的測(cè)度,一. 偏態(tài)及其測(cè)度 二. 峰態(tài)及其測(cè)度,數(shù)據(jù)的特征和測(cè)度(本節(jié)位置),偏態(tài)與峰態(tài)分布的形狀,偏態(tài),峰態(tài),偏 態(tài),偏態(tài)(skewness),統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出 數(shù)據(jù)分布偏斜程度的測(cè)度 2.偏態(tài)系數(shù)=0為對(duì)稱分布 3.偏態(tài)系數(shù) 0為右偏分布 4.偏態(tài)系數(shù) 0為左偏分布,偏態(tài)系數(shù) (skewness coefficient),根據(jù)原始數(shù)據(jù)計(jì)算 根據(jù)分組數(shù)據(jù)計(jì)算,偏態(tài)系數(shù) (例題分析),偏態(tài)系數(shù) (例題分析),結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù),偏態(tài)與峰態(tài)(從直方圖上觀察),按銷售量分組(臺(tái)),結(jié)論:1. 為右偏分布 2. 峰態(tài)適中,某電腦公司銷售量分布的直方圖,峰 態(tài),峰態(tài)(kurtosis),統(tǒng)計(jì)學(xué)家Pearson于1905年首次提出 數(shù)據(jù)分布扁平程度的測(cè)度 峰態(tài)系數(shù)=0扁平峰度適中 峰態(tài)系數(shù)0為尖峰分布,峰態(tài)系數(shù) (kurtosis coefficient),根據(jù)原始數(shù)據(jù)計(jì)算 根據(jù)分組數(shù)據(jù)計(jì)算,峰態(tài)系數(shù) (例題分析),結(jié)論

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論