統(tǒng)計(jì)數(shù)據(jù)的匯總_第1頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的匯總_第2頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的匯總_第3頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的匯總_第4頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的匯總_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)數(shù)據(jù)的匯總1第一頁(yè),共四十二頁(yè),2022年,8月28日本章主要介紹以下3類綜合統(tǒng)計(jì)指標(biāo):度量中心(集中)趨勢(shì)的平均指標(biāo)度量離散程度的指標(biāo)度量偏斜程度的指標(biāo)度量?jī)煞N數(shù)值變量關(guān)系的指標(biāo)

第2章統(tǒng)計(jì)數(shù)據(jù)的描述度量2第二頁(yè),共四十二頁(yè),2022年,8月28日平均指標(biāo)是說(shuō)明社會(huì)經(jīng)濟(jì)現(xiàn)象一般水平的統(tǒng)計(jì)指標(biāo),反映標(biāo)志值分布的集中趨勢(shì)。平均指標(biāo)按計(jì)算方式可分為數(shù)值平均數(shù)和位置平均數(shù)兩大類。

§2.1度量集中趨勢(shì)的平均指標(biāo)3第三頁(yè),共四十二頁(yè),2022年,8月28日——是根據(jù)總體各單位所有標(biāo)志值計(jì)算出的平均數(shù)。包括算術(shù)平均數(shù)、幾何平均數(shù)。(一)算術(shù)平均數(shù)1.算術(shù)平均數(shù)的基本公式一.數(shù)值平均數(shù)

4第四頁(yè),共四十二頁(yè),2022年,8月28日

(1)簡(jiǎn)單算術(shù)平均數(shù)2.算術(shù)平均數(shù)的計(jì)算

n—總體單位總數(shù);xi—第i

個(gè)單位的標(biāo)志值。

(2)加權(quán)算術(shù)平均數(shù)

xi

—第i組的代表值(組中值或該組變量值);

fi—第i組的頻數(shù)。

5第五頁(yè),共四十二頁(yè),2022年,8月28日使用Excel函數(shù)求加權(quán)算術(shù)平均數(shù)利用Excel“數(shù)學(xué)和三角函數(shù)”中的SUMPRODUCT函數(shù)可以方便地計(jì)算出分組數(shù)據(jù)的加權(quán)算術(shù)平均數(shù)。語(yǔ)法規(guī)則:格式:SUMPRODUCT(<區(qū)域1>,<區(qū)域2>,…)功能:返回兩個(gè)或多個(gè)區(qū)域中對(duì)應(yīng)元素乘積之和。

例:利用比特啤酒公司各銷售點(diǎn)分組頻數(shù)分布數(shù)據(jù),求各銷售點(diǎn)的平均銷售量。

6第六頁(yè),共四十二頁(yè),2022年,8月28日(二)幾何平均數(shù)當(dāng)統(tǒng)計(jì)資料是各時(shí)期的發(fā)展速度等前后期的兩兩比環(huán)數(shù)據(jù),要求每時(shí)期的平均發(fā)展速度時(shí),就需要使用幾何平均數(shù)。幾何平均數(shù)是n個(gè)數(shù)連乘積的n次方根。1.簡(jiǎn)單幾何平均數(shù)

2.加權(quán)幾何平均數(shù)fi—各比率出現(xiàn)的頻數(shù)

7第七頁(yè),共四十二頁(yè),2022年,8月28日例:某公司原料成本隨時(shí)間增長(zhǎng)的情況如下表求原料成本的平均年增長(zhǎng)率。解一:解二:年平均增長(zhǎng)率=1.0688-1=6.88%

8第八頁(yè),共四十二頁(yè),2022年,8月28日3.使用Excel求幾何平均數(shù)可以使用Excel統(tǒng)計(jì)函數(shù)中的GEOMEAN函數(shù)返回幾何平均數(shù)。語(yǔ)法規(guī)則:格式:GEOMEAN(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的幾何平均數(shù)。

9第九頁(yè),共四十二頁(yè),2022年,8月28日位置平均數(shù)是根據(jù)總體標(biāo)志值所處的特殊位置確定的一類平均指標(biāo)。包括中位數(shù)和眾數(shù)兩種。(一)中位數(shù)——將總體各單位標(biāo)志值按由小到大的順序排列后處于中間位置的標(biāo)志值稱為中位數(shù),記為Me。中位數(shù)是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。當(dāng)統(tǒng)計(jì)資料中含有異常的或極端的數(shù)據(jù)時(shí),中位數(shù)比算術(shù)平均數(shù)更具有代表性。比如有5筆付款:9元,10元,10元,11元,60元付款的均值為20元,顯然這并不是一個(gè)很好的代表值,而中位數(shù)Me

=10元?jiǎng)t更能代表平均每筆的付款數(shù)。二.位置平均數(shù)10第十頁(yè),共四十二頁(yè),2022年,8月28日1.使用Excel的統(tǒng)計(jì)函數(shù)返回未分組數(shù)據(jù)的中位數(shù)可以使用Excel統(tǒng)計(jì)函數(shù)中的MEDIAN函數(shù)返回未分組數(shù)據(jù)的中位數(shù)。格式:MEDIAN(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的中位數(shù)。

11第十一頁(yè),共四十二頁(yè),2022年,8月28日2.分組數(shù)據(jù)中位數(shù)的確定對(duì)于分組數(shù)據(jù)的統(tǒng)計(jì)資料,中位數(shù)要用插值法來(lái)估算。

(1)計(jì)算各組的累計(jì)頻數(shù);

(2)確定中位數(shù)所在的組

——是累計(jì)頻數(shù)首次包含中位數(shù)位次Σf/2的組。其中:L—中位數(shù)所在組的下限;

Sm-1—中位數(shù)所在組前一組的累計(jì)頻數(shù);

fm—中位數(shù)所在組的頻數(shù);

d—中位數(shù)所在組的組距。

12第十二頁(yè),共四十二頁(yè),2022年,8月28日例:計(jì)算下表數(shù)據(jù)的中位數(shù)解:Σf/2=27.5,中位數(shù)在“15-25”的組中,

13第十三頁(yè),共四十二頁(yè),2022年,8月28日(二)眾數(shù)——是總體中出現(xiàn)次數(shù)最多的標(biāo)志值,記為M

0。眾數(shù)明確反映了數(shù)據(jù)分布的集中趨勢(shì),也是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。但并非所有數(shù)據(jù)集合都有眾數(shù),也可能存在多個(gè)眾數(shù)。在某些情況下,眾數(shù)是一個(gè)較好的代表值。例如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在進(jìn)行生產(chǎn)和存貨決策時(shí),更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當(dāng)要了解大多數(shù)家庭的收入狀況時(shí),也要用到眾數(shù)。

14第十四頁(yè),共四十二頁(yè),2022年,8月28日1.未分組數(shù)據(jù)眾數(shù)的確定在數(shù)據(jù)量很大的時(shí)候,可以使用Excel統(tǒng)計(jì)函數(shù)中的MODE函數(shù)返回眾數(shù)。格式:MODE(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的眾數(shù)。

15第十五頁(yè),共四十二頁(yè),2022年,8月28日2.分組數(shù)據(jù)眾數(shù)的確定對(duì)于分組數(shù)據(jù)的統(tǒng)計(jì)資料,眾數(shù)也要用插值法來(lái)估算。(1)確定眾數(shù)所在的組

對(duì)于等距分組,眾數(shù)組是頻數(shù)最高的組;(2)使用以下插值公式計(jì)算其中:L—眾數(shù)組的下限Δ1—眾數(shù)組與前一組的頻數(shù)之差Δ2—眾數(shù)組與后一組的頻數(shù)之差

d—眾數(shù)組的組距Δ1Δ2眾數(shù)Ld16第十六頁(yè),共四十二頁(yè),2022年,8月28日例:計(jì)算下表數(shù)據(jù)的眾數(shù)解:眾數(shù)組是“15-25”的組,則

17第十七頁(yè),共四十二頁(yè),2022年,8月28日三.算術(shù)平均數(shù)和位置平均數(shù)間的關(guān)系1.頻數(shù)分布呈完全對(duì)稱的單峰分布,算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相同。0xf(Me,M0)0xfMeM00xfMeM02.頻數(shù)分布為右偏態(tài)時(shí),眾數(shù)小于中位數(shù),算術(shù)平均數(shù)大于中位數(shù)。3.頻數(shù)分布為左偏態(tài)時(shí),眾數(shù)大于中位數(shù),算術(shù)平均數(shù)小于中位數(shù)。18第十八頁(yè),共四十二頁(yè),2022年,8月28日補(bǔ)充習(xí)題補(bǔ)充題3:某地區(qū)私營(yíng)企業(yè)注冊(cè)資金分組資料如下,求該地區(qū)私營(yíng)企業(yè)注冊(cè)資金的平均數(shù)、中位數(shù)和眾數(shù)。19第十九頁(yè),共四十二頁(yè),2022年,8月28日

補(bǔ)充題3答案Σf/2=143/2=71.5,中位數(shù)所在組為“100~150”的組,眾數(shù)組為“100~150”的組,20第二十頁(yè),共四十二頁(yè),2022年,8月28日四分位數(shù)

(概念要點(diǎn))1.

集中趨勢(shì)的測(cè)度值之一2. 排序后處于25%和75%位置上的值

3.不受極端值的影響

4.可用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%21第二十一頁(yè),共四十二頁(yè),2022年,8月28日四分位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N422第二十二頁(yè),共四十二頁(yè),2022年,8月28日數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(7個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 3032 282526排序:2123

2526283032位置:1 23 4567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4

==6QU=3023第二十三頁(yè),共四十二頁(yè),2022年,8月28日數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(6個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 30 282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)=28.524第二十四頁(yè),共四十二頁(yè),2022年,8月28日數(shù)值型分組數(shù)據(jù)的四分位數(shù)

上四分位數(shù):

下四分位數(shù):

25第二十五頁(yè),共四十二頁(yè),2022年,8月28日數(shù)值型分組數(shù)據(jù)的四分位數(shù)

QL位置=50/4=12.5QU位置=3×50/4=37.5表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—【例】根據(jù)第三章表中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的四分位數(shù)26第二十六頁(yè),共四十二頁(yè),2022年,8月28日使用Excel統(tǒng)計(jì)函數(shù)中的QUARTILE函數(shù)在數(shù)據(jù)量很大的時(shí)候,可以使用Excel統(tǒng)計(jì)函數(shù)中的QUARTILE函數(shù)返回四分位數(shù),語(yǔ)法規(guī)則如下:格式:QUARTILE(數(shù)據(jù)集,第nthquart分位數(shù))功能:返回不同nthquart的四分位數(shù)。如果nthquart等于函數(shù)QUARTILE的返回值0最小值1第一四分位數(shù)(第25個(gè)百分點(diǎn)值)2中位數(shù)(第50個(gè)百分點(diǎn)值)3第三四分位數(shù)(第75個(gè)百分點(diǎn)值)4最大值27第二十七頁(yè),共四十二頁(yè),2022年,8月28日五數(shù)匯總和箱線圖五數(shù)匯總包括最小值、第一分位數(shù)、中位數(shù)、第三分位數(shù)和最大值這樣五個(gè)數(shù)據(jù),即

箱線圖(亦稱箱須圖)提供了基于五數(shù)匯總的幾何圖形28第二十八頁(yè),共四十二頁(yè),2022年,8月28日箱線圖和四種不同類型分布圖的聯(lián)系c)右偏分布a)鐘形分布b)左偏分布d)矩形分布29第二十九頁(yè),共四十二頁(yè),2022年,8月28日x頻數(shù)要分析總體的分布規(guī)律,僅了解中心趨勢(shì)指標(biāo)是不夠的,還需要了解數(shù)據(jù)的離散程度或差異狀況。幾個(gè)總體可以有相同的均值,但取值情況卻可以相差很大。變異指標(biāo)就是用來(lái)表示數(shù)據(jù)離散程度特征的。變異指標(biāo)主要有:極差、平均差、標(biāo)準(zhǔn)差和變異系數(shù)。

§2.2度量離散程度的指標(biāo)30第三十頁(yè),共四十二頁(yè),2022年,8月28日【案例】道格拉斯公司應(yīng)如何選擇供應(yīng)商道森公司和克拉克公司是道格拉斯公司的兩家供貨商。兩家供貨商都表示大約需要10個(gè)工作日交付定貨。下表是兩家供應(yīng)商定貨交付時(shí)間的歷史數(shù)據(jù)。今后道格拉斯公司應(yīng)選擇哪家供應(yīng)商供貨?31第三十一頁(yè),共四十二頁(yè),2022年,8月28日一.極差極差也稱全距,是一組數(shù)據(jù)的最大值和最小值之差,通常記為R。顯然,一組數(shù)據(jù)的差異越大,其極差也越大。極差是最簡(jiǎn)單的變異指標(biāo),它廣泛應(yīng)用于產(chǎn)品質(zhì)量管理中控制質(zhì)量的差異,一旦發(fā)現(xiàn)超過(guò)控制范圍,就采取措施加以糾正,以保證產(chǎn)品質(zhì)量的穩(wěn)定。但極差有很大的局限性,它僅考慮了兩個(gè)極端的數(shù)據(jù),沒(méi)有利用其余數(shù)據(jù)的信息,因而是一種比較粗糙的變異指標(biāo)。

32第三十二頁(yè),共四十二頁(yè),2022年,8月28日二.平均差平均差是各數(shù)據(jù)與其均值離差絕對(duì)值的算術(shù)平均數(shù),通常記為A.D。平均差越大,反映數(shù)據(jù)間的差異越大。但由于使用了絕對(duì)值,其數(shù)學(xué)性質(zhì)很差,因而很少使用。

33第三十三頁(yè),共四十二頁(yè),2022年,8月28日四分位差

1. 離散程度的測(cè)度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差

QD

=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性34第三十四頁(yè),共四十二頁(yè),2022年,8月28日三.方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差是應(yīng)用得最為廣泛的變異指標(biāo)。標(biāo)準(zhǔn)差是方差的算術(shù)平方根,也稱均方差或根方差。應(yīng)注意總體方差、標(biāo)準(zhǔn)差與樣本方差、標(biāo)準(zhǔn)差是有區(qū)別的。1.總體方差和總體標(biāo)準(zhǔn)差總體方差是各總體數(shù)據(jù)與其均值離差平方的均值,記為

2,總體標(biāo)準(zhǔn)差記為。

35第三十五頁(yè),共四十二頁(yè),2022年,8月28日2.樣本方差與樣本標(biāo)準(zhǔn)差樣本方差記為

S

2,樣本標(biāo)準(zhǔn)差記為

S,在推斷統(tǒng)計(jì)中,它們分別是總體方差和標(biāo)準(zhǔn)差的優(yōu)良估計(jì)。其中:n為樣本容量,Xi為樣本觀察值為樣本均值。

36第三十六頁(yè),共四十二頁(yè),2022年,8月28日變異系數(shù)當(dāng)需要比較不同總體的離散程度時(shí),如果使用的度量單位不同,或它們?cè)跀?shù)量級(jí)上相差很大,則用絕對(duì)數(shù)值表示的方差和標(biāo)準(zhǔn)差就缺乏可比性,此時(shí)就應(yīng)使用相對(duì)變異指標(biāo)(變異系數(shù))。例如,對(duì)汽車發(fā)動(dòng)機(jī)的汽缸而言,0.05毫米的標(biāo)準(zhǔn)差就很大了,但對(duì)建筑工程而言則可完全忽略不記。相對(duì)變異指標(biāo)中最重要的是標(biāo)準(zhǔn)差系數(shù),是標(biāo)準(zhǔn)差與均值之比,記為V。37第三十七頁(yè),共四十二頁(yè),2022年,8月28日未分組數(shù)據(jù)方差和標(biāo)準(zhǔn)差的計(jì)算方差和標(biāo)準(zhǔn)差的手工計(jì)算非常煩瑣,只要求掌握以下兩種方法。⑴使用計(jì)算器的統(tǒng)計(jì)功能(SD或STAT功能)⑵使用Excel的統(tǒng)計(jì)函數(shù)①VARP(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的總體方差。②STDEVP(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的總體標(biāo)準(zhǔn)差。③VAR(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的樣本方差。④STDEV(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的樣本標(biāo)準(zhǔn)差。

38第三十八頁(yè),共四十二頁(yè),2022年,8月28日總體分布的特征不僅與均值和變異指標(biāo)有關(guān),而且與分布的偏斜程度有關(guān),如對(duì)稱分布、右偏分布和左偏分布。這種分布形態(tài)上的數(shù)量特征,往往具有重要的社會(huì)經(jīng)濟(jì)意義。偏度系數(shù)是度量偏斜程度的指標(biāo),主要有以下兩種計(jì)算方法:一、用標(biāo)準(zhǔn)差為單位計(jì)量的偏度系數(shù)該偏度系數(shù)記為SK,計(jì)算公式為

SK是無(wú)量綱的量,取值通常在-3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論