第三章 變量分布特征的描述(xu)_第1頁(yè)
第三章 變量分布特征的描述(xu)_第2頁(yè)
第三章 變量分布特征的描述(xu)_第3頁(yè)
第三章 變量分布特征的描述(xu)_第4頁(yè)
第三章 變量分布特征的描述(xu)_第5頁(yè)
已閱讀5頁(yè),還剩133頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

三個(gè)教授(一個(gè)物理學(xué)家、一個(gè)化學(xué)家和一個(gè)統(tǒng)計(jì)學(xué)家)被召到院長(zhǎng)辦公室,他們剛剛坐定就發(fā)現(xiàn)一個(gè)廢紙簍著火了。

物理學(xué)家說:“我知道怎么辦,把材料溫度降至可燃溫度以下,火自然就滅了?!?/p>

化學(xué)家不同意,“不對(duì),必須先切斷氧氣的供應(yīng),缺少了反應(yīng)物,火才會(huì)滅?!?/p>

正當(dāng)物理學(xué)家和化學(xué)家爭(zhēng)論不休的時(shí)候,他們驚訝得發(fā)現(xiàn)統(tǒng)計(jì)學(xué)家跑來跑去得點(diǎn)燃一個(gè)又一個(gè)廢紙簍?!澳阍诟墒裁矗?!”

統(tǒng)計(jì)學(xué)家答道:“我正在做抽樣檢驗(yàn)!”

統(tǒng)計(jì)笑話之一--統(tǒng)計(jì)學(xué)家在一所大學(xué)的操場(chǎng)上,政治學(xué)教授、哲學(xué)教授和語(yǔ)言學(xué)教授圍著一根旗桿。

統(tǒng)計(jì)學(xué)教授走過來,問:“先生們?cè)诿κ裁矗俊?/p>

“我們需要這旗桿的高度,正在討論用什么手段得到它?!闭螌W(xué)教授說。

“瞧我的!”統(tǒng)計(jì)學(xué)教授說著,彎下腰抱緊旗桿使勁一拔,把旗桿拔出后,放倒在地,拿出卷尺量了量,“正好五米五”說完便把旗桿插回原地,走了。

“這人!”語(yǔ)言學(xué)教授望著他離去的背影輕蔑地說,“我們要的是高度,他卻給了我們長(zhǎng)度,瞎添亂!”

統(tǒng)計(jì)笑話之二--統(tǒng)計(jì)學(xué)教授甲、乙兩個(gè)班的統(tǒng)計(jì)學(xué)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)173108119882880377527711792090298538873781275218230743951461137122953174407457314892376328541966921584248933744277778166925953482439188117862686358244829791876275936824572序號(hào)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)序號(hào)成績(jī)1869461792256933752641079189026893496383117719862779357947412732098287436885581385216429853794693148122923067387177115642391318439558691675248732824095請(qǐng)對(duì)兩個(gè)班的成績(jī)進(jìn)行對(duì)比分析,你會(huì)從哪幾個(gè)方面著手??jī)砂喑煽?jī)的對(duì)比分析指標(biāo)數(shù)值平均79.66667標(biāo)準(zhǔn)誤差1.378405中位數(shù)80眾數(shù)82標(biāo)準(zhǔn)差9.246621方差85.5峰度1.31565偏度-0.70131最小值51最大值96求和3585觀測(cè)數(shù)45指標(biāo)數(shù)值平均79標(biāo)準(zhǔn)誤差1.923872中位數(shù)80眾數(shù)64標(biāo)準(zhǔn)差12.16763方差148.0513峰度0.037583偏度-0.62146最小值46最大值98求和3160觀測(cè)數(shù)40甲班成績(jī)的描述性指標(biāo)乙班成績(jī)的描述性指標(biāo)第三章變量分布特征的描述一、集中趨勢(shì)的描述二、離中趨勢(shì)的描述三、分布形狀的描述學(xué)習(xí)要求①理解變量分布三大特征即集中趨勢(shì)、離中趨勢(shì)和分布形狀的的含義;②理解平均指標(biāo)、離散指標(biāo)和形狀指標(biāo)的意義與作用;③熟練掌握各種平均數(shù)的計(jì)算方法并加以正確的應(yīng)用,科學(xué)理解加權(quán)平均數(shù)中權(quán)數(shù)的意義,正確認(rèn)識(shí)算術(shù)平均數(shù)與調(diào)和平均數(shù)之間的應(yīng)用關(guān)系,以及算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者之間的數(shù)量關(guān)系;④熟練掌握各種離散指標(biāo)的計(jì)算方法并加以正確的應(yīng)用,尤其是要深刻理解方差、標(biāo)準(zhǔn)差和離散系數(shù)的內(nèi)涵;⑤了解偏度系數(shù)和峰度系數(shù)的計(jì)算方法并加以正確的應(yīng)用,尤其是要了解動(dòng)差的含義。

變量分布特征集中趨勢(shì)

(位置)離中趨勢(shì)

(分散程度)偏態(tài)和峰度(形狀)數(shù)據(jù)分布的測(cè)度峰度偏度數(shù)據(jù)的特征和測(cè)度分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)變異系數(shù)方差和標(biāo)準(zhǔn)差四分位差極差位置平均數(shù)數(shù)值平均數(shù)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)第一節(jié)集中趨勢(shì)的描述集中趨勢(shì)

亦稱為趨中性,是指變量分布以某一數(shù)值為中心的傾向,一般用平均指標(biāo)來表示。一、集中趨勢(shì)與平均指標(biāo)平均指標(biāo)主要用來表明變量值在一定時(shí)間、地點(diǎn)條件下所達(dá)到的一般水平。其數(shù)值表現(xiàn)平均數(shù)。平均指標(biāo)的種類從總體各單位變量值中抽象出具有一般水平的量,這個(gè)量是根據(jù)各個(gè)單位的具體標(biāo)志值計(jì)算出來的,有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)等形式。數(shù)值平均數(shù)1、反映時(shí)間不同,分為靜態(tài)和動(dòng)態(tài)平均數(shù)。2、取得集中趨勢(shì)代表值方法的不同,可分為數(shù)值平均數(shù)和位置平均數(shù)。先將總體各單位的變量值按一定順序排列,然后取某一位置的變量值來反映總體各單位的一般水平。位置平均數(shù)有眾數(shù)、中位數(shù)、四分位數(shù)等形式。位置平均數(shù)平均指標(biāo)分類示意圖平均指標(biāo)動(dòng)態(tài)平均數(shù)靜態(tài)平均數(shù)發(fā)展水平平均數(shù)數(shù)值平均數(shù)位置平均數(shù)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)眾數(shù)中位數(shù)四分位數(shù)簡(jiǎn)單加權(quán)發(fā)展速度平均數(shù)平均指標(biāo)的作用(1)通過反映變量分布的一般水平,幫助人們對(duì)研究現(xiàn)象的一般數(shù)量特征有一個(gè)客觀認(rèn)識(shí)。(成績(jī)、收入水平)(2)利用平均指標(biāo)可以對(duì)不同空間的發(fā)展水平進(jìn)行比較,反映總體水平上存在的差距。(3)利用平均指標(biāo)可以對(duì)某一現(xiàn)象總體在不同時(shí)間上的發(fā)展水平進(jìn)行比較,以說明這種現(xiàn)象發(fā)展變化的趨勢(shì)或規(guī)律性。(4)利用平均指標(biāo)可以分析現(xiàn)象之間的依存關(guān)系或進(jìn)行數(shù)量上的推算。(銷售額與流通費(fèi)用率)(5)平均指標(biāo)還可以作為研究和評(píng)價(jià)事物的一種數(shù)量標(biāo)準(zhǔn)或參考。(成績(jī)、經(jīng)濟(jì)水平)二、數(shù)值(計(jì)算)平均數(shù)數(shù)值平均數(shù)調(diào)和平均數(shù)算術(shù)平均數(shù)幾何平均數(shù)簡(jiǎn)單加權(quán)(一)算術(shù)平均數(shù)概念:算術(shù)平均數(shù)一般就稱為平均數(shù)(mean)。其定義是:觀察值的總和除以觀察值個(gè)數(shù)的商。計(jì)算公式為:

在實(shí)際工作中,由于所掌握的統(tǒng)計(jì)資料的不同,利用上述公式進(jìn)行計(jì)算時(shí),可分為簡(jiǎn)單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)兩種。

1.簡(jiǎn)單算術(shù)平均數(shù)(SimpleArithmeticMean)

2.加權(quán)算術(shù)平均數(shù)(WeightedArithmeticMean)

1.簡(jiǎn)單算術(shù)平均數(shù)

簡(jiǎn)單算術(shù)平均數(shù)的公式根據(jù)未經(jīng)分組整理的原始數(shù)據(jù)計(jì)算的均值。設(shè)一組數(shù)據(jù)為x1,x2,x3,…xn.則簡(jiǎn)單算術(shù)平均數(shù)的計(jì)算公式如下:

例子:據(jù)南方人才服務(wù)中心調(diào)查,從事IT行業(yè)的從業(yè)人員年薪在40000-55000元之間,表中的數(shù)據(jù)是IT從業(yè)人員年薪的一個(gè)樣本:

491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900要求:計(jì)算IT從業(yè)人員的平均年薪。24名IT從業(yè)人員年薪資料表2.加權(quán)算術(shù)平均數(shù)

根據(jù)分組整理的數(shù)據(jù)計(jì)算的算術(shù)平均數(shù)。

加權(quán)算術(shù)平均數(shù)的公式:

式中:f代表各組變量值出現(xiàn)的頻數(shù)。例子:設(shè)某廠職工按日產(chǎn)量分組后所得組距數(shù)列如下,據(jù)此求平均日產(chǎn)量。按日產(chǎn)量分組(千克)工人數(shù)f(人)

60以下

1060–70

1970–80

5080–90

36

90–100

27100–110

14110以上

8合計(jì)

164組中值X(千克)Xf5555065

1235

75

3750

85

3060

95

2565105

1470115

920合計(jì)

13550(1)算術(shù)平均數(shù)的大小,不僅取決于研究對(duì)象的變量值(x),而且受各變量值重復(fù)出現(xiàn)的頻數(shù)(f)或頻率(f/∑f)大小的影響,頻數(shù)或頻率較大,該組數(shù)據(jù)的大小對(duì)算術(shù)平均數(shù)的影響就大,反之則小。

(2)權(quán)數(shù)的表現(xiàn)形式問題:絕對(duì)權(quán)數(shù)與相對(duì)權(quán)數(shù)注意事項(xiàng)按日產(chǎn)量分組(千克)組中值X(千克)工人數(shù)f(人)ff/∑f

60以下

55

100.06

3.360–70

65

190.12

7.870–80

75

500.30

22.580–90

85

360.22

18.7

90–100

95

270.16

15.2

100–110105

140.09

9.45110以上115

80.05

5.75合計(jì)-1641.00

82.7例子:不同的權(quán)數(shù)形式

(1)各變量值與其算術(shù)平均數(shù)的離差之和等于零。(2)各變量值與其算術(shù)平均數(shù)的離差平方和最小。

(3)兩個(gè)獨(dú)立的同性質(zhì)變量代數(shù)和的平均數(shù)等于各變量平均數(shù)的代數(shù)和。

(4)兩個(gè)獨(dú)立的同性質(zhì)變量乘積的平均數(shù)等于各變量平均數(shù)的乘積。3.算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)4.算術(shù)平均數(shù)的優(yōu)缺點(diǎn)優(yōu)點(diǎn)1、可用于推算總體標(biāo)志總量。2、代表性強(qiáng)。3、可以進(jìn)行代數(shù)運(yùn)算。4、在抽樣中具有良好的穩(wěn)定性和可靠性。缺點(diǎn)1、當(dāng)總體中個(gè)別單位標(biāo)志值特別大或特別小時(shí),會(huì)導(dǎo)致算術(shù)平均數(shù)偏大或偏小。2、當(dāng)組距數(shù)列有開口組時(shí),組中值有較大假定性。(二)調(diào)和平均數(shù)算術(shù)題:一輛小車以每小時(shí)80公里的速度從山下開到山頂,又以每小時(shí)100公里的速度沿原路返回到山下,問:該車的平均速度。80km/h100km/h鏈接例子:F1賽車時(shí),A車手第一圈時(shí)速300公里,第二圈時(shí)速340公里,B車手第一圈時(shí)速320公里,第二圈時(shí)速318。請(qǐng)問:只賽兩圈誰獲勝?問題的解答:

速度=距離/時(shí)間,故平均速度=總距離/總時(shí)間。這一計(jì)算方式被定義為“調(diào)和平均數(shù)”(H)。變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),故又稱為倒數(shù)平均數(shù)推廣:如果該車山下——山頂來回開,n次的速度分別為x1,x2,x3,…,xn,則平均速度就成為:1、簡(jiǎn)單調(diào)和平均數(shù)(1)作為算術(shù)平均的變形例1:三種不同等級(jí)的青菜,每公斤單價(jià)分別為2元、4元、5元。每種等級(jí)各買1元,則均價(jià)是多少?例2:某人在30元/股、50元/股、100元/股的三個(gè)不同價(jià)位各買進(jìn)“貴州茅臺(tái)”股票6000元,則所持該股票的均價(jià)是多少?例1等價(jià)于:三種等級(jí)的青菜單價(jià)分別為2元/公斤、4元/公斤、5元/公斤,分別購(gòu)買0.5公斤、0.25公斤、0.2公斤,要求計(jì)算平均價(jià)格。等價(jià)的計(jì)算方式是:例2等價(jià)于:A股票30元/股時(shí)買了200股,50元/股時(shí)買了120股,100元/股時(shí)買了60股。要求計(jì)算股票均價(jià)。等價(jià)的計(jì)算方式是:顯然,此二例資料形式改變一下,就成為加權(quán)算術(shù)平均公式??梢娝阈g(shù)平均與調(diào)和平均在此時(shí)是等價(jià)的。(2)作為獨(dú)立公式運(yùn)用在統(tǒng)計(jì)綜合評(píng)價(jià)領(lǐng)域,調(diào)和平均是一種獨(dú)立的合成方法。在計(jì)算一些變量值的平均值時(shí),如果不考慮變量值本身的物理含義,調(diào)和平均與算術(shù)平均、對(duì)數(shù)平均、海倫平均、平方平均、幾何平均一樣,是獨(dú)立的平均數(shù)公式。例1:計(jì)算1與2的調(diào)和平均。例2:編制價(jià)格總指數(shù)時(shí),代表品1的價(jià)格指數(shù)是110%,代表品2的價(jià)格指數(shù)是105%,則可用兩者的調(diào)和平均值作為這一小類的價(jià)格指數(shù)。例3:甲員工的“德”、“才”、“能”測(cè)量分值分別是90分、86分、84分;乙員工的“德”、“才”、“能”測(cè)量分值分別為84分、98分、78分。要求采用簡(jiǎn)單調(diào)和平均方法計(jì)算并比較甲、乙兩人的綜合素質(zhì)。此三例只是“規(guī)定”采用簡(jiǎn)單調(diào)和平均數(shù)公式進(jìn)行計(jì)算。因而不能“變形”為算術(shù)平均,此三例的算術(shù)平均結(jié)果將會(huì)不同:分別為1.5,107.5%,甲=乙(86.67)2、加權(quán)調(diào)和平均數(shù)例:法拉利隊(duì)的車王邁克爾·舒馬赫在2004年9月初的一次試車中(F2004),以每小時(shí)320公里的速度開了52圈,以每小時(shí)345公里的速度開了35圈,而隊(duì)友巴里切羅以每小時(shí)322公里的速度開了45圈,以每小時(shí)337公里的速度開了42圈,求兩人各自的平均車速。例2:三種不同等級(jí)的青菜分別買5元、6元、10元,每公斤單價(jià)分別為2元、4元、5元,則平均價(jià)格是多少?(1)加權(quán)調(diào)和平均數(shù)的基本公式

(2)加權(quán)調(diào)和平均公式的應(yīng)用——作為算術(shù)平均的變形當(dāng)mi=xifi

時(shí),有:表

兩公司員工工資情況表月工資

(元)A公司B公司80048000400001000700004000016003200040000合計(jì)150000120000要求計(jì)算兩公司的平均工資。解答:在這里,平均工資作為“單位標(biāo)志平均數(shù)”仍然必須是標(biāo)志總量(工資總額)與單位總數(shù)(員工總數(shù))之比。我們計(jì)算A公司的平均工資,得到:

對(duì)于B公司,固然也可以采用加權(quán)調(diào)和平均數(shù)公式來計(jì)算其平均工資:然而在這里,由于各組的權(quán)數(shù)(工資總額)相同,實(shí)際上并沒有真正起到加權(quán)的作用。我們采用簡(jiǎn)單調(diào)和平均數(shù)的公式來計(jì)算,可以得到完全相同的結(jié)果,而計(jì)算過程卻大大簡(jiǎn)化了:(3)加權(quán)調(diào)和平均公式應(yīng)該注意的幾個(gè)問題第一,與加權(quán)算術(shù)平均公式類似,加權(quán)調(diào)和平均公式的權(quán)數(shù)也有兩種類型:絕對(duì)權(quán)重與比重權(quán)重,相應(yīng)就有兩種不同形式的加權(quán)方式.調(diào)和平均數(shù)的權(quán)數(shù)不是“次數(shù)”而是各組的標(biāo)志值。絕對(duì)權(quán)重比重權(quán)重第二,計(jì)算加權(quán)調(diào)和平均值時(shí),同樣需要注意選擇合適的x,以及合適的權(quán)重m.

應(yīng)該以組平均作為x,若無,則用組中值近似代表。權(quán)重m應(yīng)該是具有實(shí)際意義的“各組標(biāo)志總量”。第三,調(diào)和平均與算術(shù)平均的正確選擇問題

作為算術(shù)平均數(shù)變形,調(diào)和平均數(shù)主要用于“平均數(shù)的平均”與“相對(duì)數(shù)的平均”計(jì)算之中。如果掌握了變量值,以及該變量的分子資料時(shí),需要通過基本數(shù)量關(guān)系推導(dǎo)出分母數(shù)值,此時(shí)即為“加權(quán)調(diào)和平均”。這是以分母為權(quán)重的加權(quán)算術(shù)平均這是以分子為權(quán)重的加權(quán)調(diào)和平均第四,簡(jiǎn)單調(diào)和平均與加權(quán)調(diào)和平均的關(guān)系簡(jiǎn)單調(diào)和平均是加權(quán)調(diào)和平均的一個(gè)特例,當(dāng)權(quán)數(shù)全部相等時(shí),即:M1=m2=m3=…=mn1.調(diào)和平均數(shù)易受極端值的影響,且受極小值的影響比受極大值的影響更大。2.只要有一個(gè)變量值為零,就不能計(jì)算調(diào)和平均數(shù)。3.當(dāng)組距數(shù)列有開口組時(shí),其組中值即使按相鄰組距計(jì)算了,假定性也很大,這時(shí),調(diào)和平均數(shù)的代表性就很不可靠。4.調(diào)和平均數(shù)應(yīng)用的范圍較小。

第五,調(diào)和平均的特點(diǎn)3.由相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù)(1)由相對(duì)數(shù)計(jì)算平均數(shù)例1:設(shè)有某行業(yè)150個(gè)企業(yè)的有關(guān)產(chǎn)值和利潤(rùn)資料如表所示,計(jì)算該行業(yè)一、二季度的平均產(chǎn)值利潤(rùn)率。產(chǎn)值利潤(rùn)率(%)一季度二季度企業(yè)數(shù)(個(gè))實(shí)際產(chǎn)值(萬元)企業(yè)數(shù)(個(gè))實(shí)際利潤(rùn)(萬元)5-103057005071010-20702050080351420-305022500202250合

計(jì)150487001506474計(jì)算第一季度的平均產(chǎn)值利潤(rùn)率,應(yīng)該采用實(shí)際產(chǎn)值加權(quán),進(jìn)行算術(shù)平均,即有:而計(jì)算第二季度的平均產(chǎn)值利潤(rùn)率,則應(yīng)該采用實(shí)際利潤(rùn)加權(quán),即有:產(chǎn)值計(jì)劃完成程度%)組中值(%)X企業(yè)數(shù)(個(gè))實(shí)際產(chǎn)值(萬元)M計(jì)劃產(chǎn)值(萬元)M/X80~9085268080090~10095323752500100~110105101806017200110~120115350604400合計(jì)-182617524900例2:計(jì)算下表企業(yè)的平均計(jì)劃完成程度(2)由平均數(shù)計(jì)算平均數(shù)例3:某車間各班組工人的平均勞動(dòng)生產(chǎn)率和實(shí)際工時(shí)數(shù)據(jù)如表所示,要求計(jì)算車間平均勞動(dòng)生產(chǎn)率。班組平均勞動(dòng)生產(chǎn)率(件/工時(shí))實(shí)際工時(shí)(小時(shí))123412162028200320300190合計(jì)1000分析:我們掌握的資料是平均數(shù)的母項(xiàng)數(shù)值即實(shí)際工時(shí)數(shù),因而應(yīng)該以實(shí)際工時(shí)數(shù)為權(quán)數(shù),采用加權(quán)算術(shù)平均數(shù)的形式來計(jì)算平均勞動(dòng)生產(chǎn)率。平均勞動(dòng)生產(chǎn)率(件/工時(shí))實(shí)際工時(shí)實(shí)際產(chǎn)品總量(件)班組1234121620282003203001902400512060005320合計(jì)101018840車間平均勞動(dòng)生產(chǎn)率(件/工時(shí))

==解答:(三)幾何平均數(shù)(GeometricMean)幾何平均數(shù)也稱幾何均值,它是n個(gè)變量值乘積的n次方根。適用對(duì)象:現(xiàn)象的總比率是若干項(xiàng)變量的乘積,或現(xiàn)象的總發(fā)展速度是各時(shí)期發(fā)展速度的連乘積時(shí),計(jì)算平均比率或平均發(fā)展速度。1.簡(jiǎn)單幾何平均數(shù)

(SimpleGeometricMean)

直接將n項(xiàng)變量連乘,對(duì)其連乘積開n次方根所得的平均數(shù)即為簡(jiǎn)單幾何平均數(shù)。計(jì)算公式為:例1:某企業(yè)的一條生產(chǎn)流水線有四道工序,每一道工序完成的產(chǎn)品都要作一次質(zhì)量檢查,只有合格的中間件才進(jìn)入下一道工序。工序C工序A工序B工序D合格率98%合格率97%合格率94%合格率95%請(qǐng)問:平均合格率=?適用于連續(xù)作業(yè)的情況:所謂平均“合格率”,是指每一道工序合格率是相同的。這也就是說,如果記“平均合格率為G,則只有”四道工序全部合格的產(chǎn)品才是合格的,因而,有以下等式:解答:例2:據(jù)網(wǎng)上報(bào)到,成都溫江的蘭花節(jié)(2006年2月27日)上,一盆蘭花賣價(jià)是1100萬元,這背后是迅速壯大的10萬戶成都養(yǎng)蘭、炒蘭戶,不少人是在借高利貸炒蘭,圖謀暴利。紅荷黃金海岸龍女彩蝶設(shè)某炒蘭投資者從朋友處借得一筆高利貸,以季度為結(jié)算單位,每個(gè)季度生成的利息到期自動(dòng)轉(zhuǎn)為本金,一年連本帶利付清。各季利率根據(jù)蘭花價(jià)格變化適當(dāng)調(diào)整。實(shí)際一年下來,第一季度的利率是3%,第二季度的利率是3.2%,第三季度的利率是3.6%,第四季度的利率是2.8%。問:平均利率是多少?

解答:本題需要注意的是,不能夠直接對(duì)利率進(jìn)行幾何平均,而應(yīng)該通過連本帶利計(jì)算,即若借款總額為L(zhǎng)萬元,則一年之后的付款額(本息和)為:如果平均利率為G,則應(yīng)該有:

2.加權(quán)幾何平均數(shù)

(WeightedGeometricMean)

與算術(shù)平均數(shù)一樣,當(dāng)資料中的某些變量值重復(fù)出現(xiàn)時(shí),相應(yīng)地,簡(jiǎn)單幾何平均數(shù)就變成了加權(quán)幾何平均數(shù)。計(jì)算公式為:式中:fi代表各個(gè)變量值出現(xiàn)的次數(shù)。

即20年的平均年利率為114.14%-1=14.14%例3:已知一筆貸款第1年的利率為5%,接下來3年利率為8%,再接下來的11年利率為15%,最后5年的利率為18%,試計(jì)算20年的平均利率。1.幾何平均數(shù)受極端值的影響較算術(shù)平均數(shù)小。2.如果變量值有負(fù)值,計(jì)算出的幾何平均數(shù)就會(huì)成為負(fù)數(shù)或虛數(shù)。3.它僅適用于具有等比或近似等比關(guān)系的數(shù)據(jù)。4.幾何平均數(shù)的對(duì)數(shù)是各變量值對(duì)數(shù)的算術(shù)平均數(shù)。幾何平均數(shù)特點(diǎn)幾何平均數(shù)、算術(shù)平均數(shù)和調(diào)和平均數(shù)的關(guān)系冪平均函數(shù)1.算術(shù)平均數(shù)易受極端值影響;2.調(diào)和平均數(shù)也受極端值影響,但受極小值影響較大;3.幾何平均數(shù)受極端值影響較小。

對(duì)同一資料來說:幾何平均數(shù)大于調(diào)和平均數(shù)而小于算術(shù)平均數(shù),即有:數(shù)字12345幾何平均數(shù)2.61算術(shù)平均數(shù)3調(diào)和平均數(shù)2.19一般來說:在對(duì)某一企業(yè)領(lǐng)導(dǎo)集體中的五名成員的“綜合素質(zhì)”進(jìn)行綜合評(píng)價(jià)時(shí),假設(shè)指標(biāo)體系由兩個(gè)子系統(tǒng)構(gòu)成:“德子系統(tǒng)”和“才子系統(tǒng)”,經(jīng)過匯總,得到五位領(lǐng)導(dǎo)成員德、才的評(píng)價(jià)當(dāng)量值(百分制),結(jié)果如下表所示。假設(shè)“德”、“才”兩方面是等權(quán)的。分別用不同平均方法來比較這五名領(lǐng)導(dǎo)。被評(píng)價(jià)者“德”總得分“才”總得分甲乙丙丁戊808488941008076726660算術(shù)平均名次8080808080

并列調(diào)和平均名次8079.8079.2077.5575.0012345幾何平均名次8079.9079.6078.7777.46

12345平方平均名次8080.1080.4081.2282.46

54321例子:結(jié)論:(1)算術(shù)平均是一種“取長(zhǎng)補(bǔ)短式的平均”(折衷型平均);(2)幾何平均是一種“懲罰落后式的平均”,體現(xiàn)了“鼓勵(lì)均衡發(fā)展”的評(píng)價(jià)要求(懲罰型平均);調(diào)和平均是一種比幾何平均懲罰力度更強(qiáng)的“懲罰型平均”(3)平方平均是一種“抓大放小式的平均”,體現(xiàn)了“鼓勵(lì)搞突出抓重點(diǎn)”的評(píng)價(jià)原則(激勵(lì)型平均)。實(shí)踐中可以根據(jù)“獎(jiǎng)罰程度”的不同要求而靈活選擇一個(gè)適當(dāng)?shù)膋值。(4)上述性質(zhì)是針對(duì)“平均值越大越好”的情形。對(duì)于平均值越小越好的現(xiàn)象,上述結(jié)論相反。某公司所屬三個(gè)企業(yè)有關(guān)生產(chǎn)資料如下:(1)若三個(gè)企業(yè)生產(chǎn)同一種產(chǎn)品,試計(jì)算平均合格率(2)若三個(gè)企業(yè)生產(chǎn)不同的產(chǎn)品,試計(jì)算平均合格率(3)若三個(gè)企業(yè)為流水作業(yè)生產(chǎn)同一種產(chǎn)品,試計(jì)算平均合格率企業(yè)合格率(%)產(chǎn)品產(chǎn)量(件)實(shí)際消耗工時(shí)(工時(shí))甲96100500乙95200450丙98300400思考題:三、位置平均數(shù)位置平均數(shù),就是根據(jù)總體中處于特殊位置上的個(gè)別單位或部分單位的標(biāo)志值來確定的代表值,它對(duì)于整個(gè)總體來說,具有非常直觀的代表性,因此,常用來反映分布的集中趨勢(shì)。常用的眾數(shù)、中位數(shù)。(一)中位數(shù)與分位數(shù)1.中位數(shù)(Median)的含義中位數(shù)是將數(shù)據(jù)按大小順序排列起來,形成一個(gè)數(shù)列,居于數(shù)列中間位置的那個(gè)數(shù)據(jù)就是中位數(shù)。中位數(shù)用Me表示。Me50%50%在一個(gè)等差數(shù)列或一個(gè)正態(tài)分布數(shù)列中,中位數(shù)就等于算術(shù)平均數(shù)。2.中位數(shù)的計(jì)算確定中位數(shù),必須將總體各單位的標(biāo)志值按大小順序排列,最好是編制出變量數(shù)列。這里有兩種情況:A.對(duì)于未分組的原始資料,首先必須將標(biāo)志值按大小排序。設(shè)排序的結(jié)果為:491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900例1:24名IT從業(yè)人員年薪資料表如下所示,計(jì)算該24名IT人員的中位數(shù)排序得:中位數(shù)的位置在(24+1)/2=12.5,中位數(shù)在第12個(gè)數(shù)值(49800)和第13個(gè)數(shù)值(49900)之間,即

Me=(49800+49900)/2=49850(元)。例2:某車間50名工人日加工零件數(shù)分組表零件數(shù)(個(gè))頻數(shù)(人)零件數(shù)(個(gè))頻數(shù)(人)零件數(shù)(個(gè))頻數(shù)(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112B.由分組資料確定中位數(shù)(1)由單項(xiàng)數(shù)列確定中位數(shù),直接按的公式求出中位數(shù)所在組的位置,計(jì)算累計(jì)次數(shù)確定中位數(shù)所在的組,組值即是中位數(shù)。

(2)由組距數(shù)列確定中位數(shù)。應(yīng)先按的公式求出中位數(shù)所在組的位置,然后再按下限公式或上限公式確定中位數(shù)。Sm–1--中位數(shù)所在組以下的累計(jì)次數(shù)。Sm+1--中位數(shù)所在組以上的累計(jì)次數(shù)。

例3:某企業(yè)50名工人加工零件中位數(shù)計(jì)算表,計(jì)算50名工人日加工零件數(shù)的中位數(shù)按零件數(shù)分組(個(gè))頻數(shù)(人)向上累計(jì)(人)向下累計(jì)(人)105~1103350110~1155847115~12081642120~125143034125~1301040201301404504Sm-1Sm+1A.中位數(shù)是以它在所有標(biāo)志值中所處的位置確定的全體單位標(biāo)志值的代表值,不受分布數(shù)列的極大或極小值影響,從而在一定程度上提高了中位數(shù)對(duì)分布數(shù)列的代表性。B.有些離散型變量的單項(xiàng)式數(shù)列,當(dāng)次數(shù)分布偏態(tài)時(shí),中位數(shù)的代表性會(huì)受到影響。C.缺乏敏感性。

中位數(shù)特點(diǎn)2.分位數(shù)分位數(shù)是將變量的數(shù)值按大小順序排列并等分為若干部分后,處于等分點(diǎn)位置的數(shù)值。常用的分位數(shù)有四分位數(shù)、十分位數(shù)和百分位數(shù)根據(jù)中位數(shù)的原理,你能寫出四分位數(shù)的公式嗎?(二)眾數(shù)(Mode)1.眾數(shù)的含義眾數(shù)是指總體中出現(xiàn)次數(shù)最多的那個(gè)標(biāo)志值。用Mo表示。它主要用于定類(品質(zhì)標(biāo)志)數(shù)據(jù)的集中趨勢(shì),當(dāng)然也適用于作為定序(品質(zhì)標(biāo)志)數(shù)據(jù)以及定距和定比(數(shù)量標(biāo)志)數(shù)據(jù)集中趨勢(shì)的測(cè)度值。眾數(shù)也不受數(shù)列中極端變量值的影響,它可反映總體各單位某一標(biāo)志值的集中趨勢(shì)。2.眾數(shù)的計(jì)算(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):

10591268一個(gè)眾數(shù)

原始數(shù)據(jù):

659855多于一個(gè)眾數(shù)

原始數(shù)據(jù):

252828364242某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—例:根據(jù)表中的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的眾數(shù)數(shù)值型分組數(shù)據(jù)的眾數(shù)(要點(diǎn)及計(jì)算公式)A.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)D.該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布B.

相鄰兩組的頻數(shù)相等時(shí),眾數(shù)組的組中值即為眾數(shù)MoC.相鄰兩組的頻數(shù)不相等時(shí),眾數(shù)采用下列近似公式計(jì)算MoMo組距數(shù)列確定眾數(shù)的方法下限公式上限公式式中:

L——眾數(shù)所在組下限;U——眾數(shù)所在組上限;Δ1——眾數(shù)所在組次數(shù)與其下限的鄰組次數(shù)之差;Δ2——眾數(shù)所在組次數(shù)與其上限的鄰組次數(shù)之差;d——眾數(shù)所在組組距。

例子根據(jù)下表的數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的眾數(shù)。按零件數(shù)分組(個(gè))頻數(shù)(人)向上累計(jì)(人)向下累計(jì)(人)105~1103350110~1155847115~12081642120~125143034125~1301040201301404504解:從上表的數(shù)據(jù)可以看出,最大的頻數(shù)值是14,即眾數(shù)組為120--125這一組,根據(jù)眾數(shù)計(jì)算公式)得50名工人日加工零件的眾數(shù)為:眾數(shù)特點(diǎn)

1.眾數(shù)是以它在所有標(biāo)志值中所處的位置確定的全體單位標(biāo)志值的代表值,它不受分布數(shù)列的極大或極小值的影響,從而增強(qiáng)了眾數(shù)對(duì)分布數(shù)列的代表性。2.眾數(shù)是一種位置平均數(shù),是總體中出現(xiàn)次數(shù)最多的變量值,因而在實(shí)際工作中有時(shí)有它特殊的用途。諸如,要說明一個(gè)企業(yè)中工人最普遍的技術(shù)等級(jí),說明消費(fèi)者需要的內(nèi)衣、鞋襪、帽子等最普遍的號(hào)碼,說明農(nóng)貿(mào)市場(chǎng)上某種農(nóng)副產(chǎn)品最普遍的成交價(jià)格等,都需要利用眾數(shù)。3.從分布的角度看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的數(shù)值即為眾數(shù)。當(dāng)然,如果數(shù)據(jù)的分布沒有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)也可能不存在;如果有兩個(gè)最高峰點(diǎn),也可以有兩個(gè)眾數(shù)。只有在總體單位比較多,而且又明顯地集中于某個(gè)變量值時(shí),計(jì)算眾數(shù)才有意義。

4.如果與眾數(shù)組相比鄰的上下兩組的次數(shù)相等則眾數(shù)組的組中值就是眾數(shù)值;如果與眾數(shù)組比鄰的上一組的次數(shù)較多,而下一組的次數(shù)較少,則眾數(shù)在眾數(shù)組內(nèi)會(huì)偏向該組下限;如果與眾數(shù)組比鄰的上一組的次數(shù)較少,而下一組的次數(shù)較多,則眾數(shù)在眾數(shù)組內(nèi)會(huì)偏向該組上限。(三)中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系在對(duì)稱分布(即正態(tài))時(shí)在右偏時(shí)在左偏時(shí)適度偏態(tài)時(shí)眾數(shù)與算術(shù)平均數(shù)的距離約為中位數(shù)與算術(shù)平均數(shù)距離的3倍!中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系在次數(shù)分布完全對(duì)稱時(shí),算術(shù)平均數(shù)、眾數(shù)和中位數(shù)都是同一數(shù)值;在次數(shù)分布非對(duì)稱時(shí),算術(shù)平均數(shù)、眾數(shù)和中位數(shù)不再是同一數(shù)值了,而具有相對(duì)固定的關(guān)系。在尾巴拖在右邊的正偏態(tài)(或右偏態(tài))分布中,眾數(shù)最小,中位數(shù)適中,算術(shù)平均數(shù)最大;在尾巴拖在左邊的負(fù)偏態(tài)(或左偏態(tài))分布中,眾數(shù)最大,中位數(shù)適中,算術(shù)平均數(shù)最小,見后圖。

左偏分布均值

中位數(shù)

眾數(shù)對(duì)稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的關(guān)系例子:某城市抽樣調(diào)查資料如表所示,如何計(jì)算算術(shù)平均數(shù)、中位數(shù)和眾數(shù)?年收入水平組中值居民戶數(shù)向上累計(jì)向下累計(jì)8000以下7000181810008000-100009000749298210000-150001250018027290815000-200001750024051272820000-250002250026077248825000-300002750014091222830000-3500032500539658835000-4000037500269913540000以上42500910009合計(jì)1000解答:算術(shù)平均數(shù)=(7000*18+9000*74+…+37500*26+42500*9)/1000=20022中位數(shù)=15000+(500-272)/240*5000=19750或者=20000-(500-488)/240*5000=19750眾數(shù)=20000+(260-240)/[(260-240)+(260-40)]*5000

=20714或者=25000-(260-140)/[(260-240)+(260-40)]*5000

=20714常用的幾種平均數(shù)概念計(jì)算公式特點(diǎn) 優(yōu)點(diǎn):①容易理解,便于計(jì)算②靈敏度高③穩(wěn)定性好④

缺點(diǎn):①易受極值影響②在偏斜分布和U形分布中,不具有代表性1.算術(shù)平均數(shù)標(biāo)志總量與總體單位總數(shù)的比值 簡(jiǎn)單:加權(quán):常用的幾種平均數(shù)概念 計(jì)算公式 特點(diǎn) 優(yōu)點(diǎn):①靈敏度高②在某種不能計(jì)算的條件下,可以代替

缺點(diǎn):①不易理解②易受極值影響③有“0”值時(shí)不能計(jì)算

2.調(diào)和平均數(shù)標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)簡(jiǎn)單:加權(quán):常用的幾種平均數(shù)概念 計(jì)算公式 特點(diǎn) 優(yōu)點(diǎn):靈敏度高②受極值影響?、圻m宜于各比率之積為總比率的變量求平均缺點(diǎn):①有“0”或負(fù)值時(shí)不能計(jì)算②偶數(shù)項(xiàng)數(shù)列只能用正根3.幾何平均數(shù)(

)幾個(gè)變量值連乘積的幾次根簡(jiǎn)單:加權(quán):常用的幾種平均數(shù)概念 計(jì)算公式 特點(diǎn) 4.中位數(shù)(Me)標(biāo)志值由小到大順序排列,居中間位置的標(biāo)志值。屬于位置平均數(shù) 上限公式:下限公式:優(yōu)點(diǎn):①容易理解,②不受極值影響③適宜于開口組資料和些不能用數(shù)字測(cè)定的事物缺點(diǎn):①靈敏度和計(jì)算功能差②間斷數(shù)Me常用的幾種平均數(shù)概念 計(jì)算公式 特點(diǎn) 5.眾數(shù)(Mo)分配數(shù)列中出現(xiàn)次數(shù)最多的標(biāo)志值。屬于位置平均數(shù) 上限公式:下限公式:優(yōu)點(diǎn):①容易理解,②不受極值影響缺點(diǎn):①靈敏度和計(jì)算功能差②穩(wěn)定性差③具有不唯一性集中趨勢(shì)下的離散程度平均數(shù)反映出集中趨勢(shì),除集中趨勢(shì)外,變量值顯然還有偏離中心值的離散趨勢(shì)。如何衡量離散程度?離中趨勢(shì)

(分散程度)第二節(jié)離中趨勢(shì)的描述一、離中趨勢(shì)和離散指標(biāo)離中趨勢(shì),就是變量分布中各變量值背離中心值的傾向。如果說集中趨勢(shì)是總體或變量分布同質(zhì)性的體現(xiàn),那么離中趨勢(shì)就是總體或變量分布變異性的體現(xiàn)。離散指標(biāo)就是反映變量值變動(dòng)范圍和差異程度的指標(biāo),即反映變量分布中各變量值遠(yuǎn)離中心值或代表值程度的指標(biāo),亦稱為變異指標(biāo)或標(biāo)志變動(dòng)度指標(biāo)。

離散指標(biāo)的種類及作用

用離散指標(biāo)衡量和比較平均指標(biāo)的代表性。用離散指標(biāo)反映經(jīng)濟(jì)活動(dòng)過程的均衡性、穩(wěn)定性和節(jié)奏性。離散指標(biāo)為統(tǒng)計(jì)推斷提供依據(jù)。離散指標(biāo)是衡量平均指標(biāo)代表性的尺度。一般來講,數(shù)據(jù)分布越分散,變異指標(biāo)越大,平均指標(biāo)的代表性越?。粩?shù)據(jù)分布越集中,變異指標(biāo)越小,平均指標(biāo)的代表性越大。常用的變異指標(biāo)有:全距(極差)、平均差、方差和標(biāo)準(zhǔn)差、變異系數(shù)。

二、離散指標(biāo)的測(cè)度(一)全距(Range)全距(R)也稱為極差,是指總體各單位的兩個(gè)極端標(biāo)志值之差,即:

R=最大標(biāo)志值-最小標(biāo)志值

特點(diǎn)(優(yōu)點(diǎn)與缺點(diǎn))(1)簡(jiǎn)明;(2)只反映變異范圍;(3)只受兩個(gè)數(shù)值影響;最容易受極端值影響。沒有反映中間數(shù)值的影響,沒有反映分布情況。第一組:60,70,80,90,100第二組:78,79,80,81,82很明顯,兩個(gè)小組的考試成績(jī)平均分都是80分,但是哪一組的分?jǐn)?shù)比較集中呢?如果用全距指標(biāo)來衡量,則有

R甲=100-60=40(分)

R乙=82-78=4(分)這說明第一組資料的標(biāo)志變動(dòng)度或離中趨勢(shì)遠(yuǎn)大于第二組資料的標(biāo)志變動(dòng)度。例1:有兩個(gè)學(xué)習(xí)小組的統(tǒng)計(jì)學(xué)開始成績(jī)分別為:四分位差是四分位數(shù)中第一個(gè)四分位數(shù)與第三個(gè)四分位數(shù)之差,也稱為內(nèi)距或四分間距,通常用表示,即:(二)四分位差四分位差Q=第三個(gè)四分位數(shù)Q3—第一個(gè)四分位數(shù)Q1優(yōu)缺:計(jì)算簡(jiǎn)單,意義清楚,反映現(xiàn)象的差異程度較粗略和不全面,實(shí)用價(jià)值較小。異眾比率是分布數(shù)列中非眾數(shù)組的頻數(shù)與總頻數(shù)之比,通常用來表示,即:

(三)異眾比率(四)平均差(MeanDeviation)

平均差是總體各單位標(biāo)志值對(duì)其算術(shù)平均數(shù)的離差絕對(duì)值的算術(shù)平均數(shù)。特點(diǎn)(1)反映了全部標(biāo)志值的變動(dòng)情況;(2)受平均數(shù)水平高低、計(jì)量單位(不同性質(zhì)的現(xiàn)象)影響;(3)取絕對(duì)值的方法消除離差正負(fù)號(hào),不便于代數(shù)處理。

平均差的計(jì)算

在資料未分組的情況下,平均差的計(jì)算公式為:

平均差系數(shù)計(jì)算公式:

在資料已分組的情況下,要用加權(quán)平均差公式:

例子:某廠按月收入水平分組的組距數(shù)列如下表中前兩列,計(jì)算平均差。合計(jì)180––––55800

3700職工工資(元)職工人數(shù)(f)組中值(x)

xf

x-

250-270152603900-50750270-290252807000-30750290-3103530010500-10350310-330653202080010650330-3504034013600301200合計(jì)180-55800-3700解:根據(jù)公式列表計(jì)算,得到A.D=

由于平均差采用了離差的絕對(duì)值,不便于運(yùn)算,這樣使其應(yīng)用受到了很大限制。(五)方差與標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差是測(cè)度數(shù)據(jù)變異程度的最重要、最常用的指標(biāo)。方差是各個(gè)數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的平均數(shù),通常以σ2表示。標(biāo)準(zhǔn)差又稱均方差,一般用σ表示。方差和標(biāo)準(zhǔn)差的計(jì)算也分為簡(jiǎn)單平均法和加權(quán)平均法,另外,對(duì)于總體數(shù)據(jù)和樣本數(shù)據(jù),公式略有不同。

設(shè)總體方差為,對(duì)于未經(jīng)分組整理的原始數(shù)據(jù),方差的計(jì)算公式為:對(duì)于分過組的數(shù)據(jù),方差的計(jì)算公式為:1.總體方差和標(biāo)準(zhǔn)差方差的平方根即為標(biāo)準(zhǔn)差,其相應(yīng)的計(jì)算公式為:未分組數(shù)據(jù):分組數(shù)據(jù):

(二)樣本方差和標(biāo)準(zhǔn)差(了解)設(shè)樣本方差為,根據(jù)未分組數(shù)據(jù)和分組數(shù)據(jù)計(jì)算樣本方差的公式分別為:未分組數(shù)據(jù):分組數(shù)據(jù):(二)樣本方差和標(biāo)準(zhǔn)差(了解)根據(jù)未分組數(shù)據(jù)和分組數(shù)據(jù)計(jì)算樣本標(biāo)準(zhǔn)差的公式分別為:未分組數(shù)據(jù):分組數(shù)據(jù):

根據(jù)該行業(yè)通用法則:如果一個(gè)樣本中的14個(gè)數(shù)據(jù)項(xiàng)的方差大于0.005,則該機(jī)器必須關(guān)閉待修。問此時(shí)的機(jī)器是否必須關(guān)閉?

例1:考察一臺(tái)機(jī)器的生產(chǎn)能力,利用抽樣程序來檢驗(yàn)生產(chǎn)出來的產(chǎn)品質(zhì)量,假設(shè)搜集的數(shù)據(jù)如下:解:根據(jù)已知數(shù)據(jù),計(jì)算因此,該機(jī)器工作正常。例2:以下是江蘇省和浙江省2005年年?duì)I業(yè)收入最大的前15個(gè)企業(yè),試用標(biāo)準(zhǔn)差來比較兩省企業(yè)收入的穩(wěn)定程度。江蘇前15名營(yíng)業(yè)收入(萬元)浙江前15名營(yíng)業(yè)收入(萬元)江蘇沙鋼集團(tuán)有限公司3112365浙江物產(chǎn)集團(tuán)3476937熊貓電子集團(tuán)2804390浙江省興合集團(tuán)2261710南京鋼鐵集團(tuán)2788062浙江冶金集團(tuán)2159445江蘇華西集團(tuán)公司2603864廣廈控股創(chuàng)業(yè)投資有限公司2137266蘇寧電器集團(tuán)2246465萬向集團(tuán)2092908太平洋建設(shè)集團(tuán)2122634浙江省能源集團(tuán)有限公司1838372南京斯威特集團(tuán)有限公司1960673橫店集團(tuán)1429810春蘭集團(tuán)1706942雅戈?duì)柤瘓F(tuán)1397123徐州工程機(jī)械集團(tuán)有限公司1700551浙江省建設(shè)投資集團(tuán)1383451華芳集團(tuán)有限公司1691373正泰集團(tuán)1196121江蘇悅達(dá)集團(tuán)1538658寧波電子信息集團(tuán)1194889江蘇國(guó)泰國(guó)際集團(tuán)有限公司1206262杭州娃哈哈集團(tuán)1144323江蘇永鋼集團(tuán)有限公司1166189德力西集團(tuán)1076741江蘇交通控股有限公司1118380奧克斯集團(tuán)1034198躍進(jìn)汽車集團(tuán)1113675華立集團(tuán)1033388江蘇省:

=1925365.533(萬元)

=667382.6891(萬元)浙江省=1657112.133(萬元)

=675072.0375(萬元)從標(biāo)準(zhǔn)差看江蘇企業(yè)比浙江省企業(yè)的營(yíng)業(yè)收入穩(wěn)定解答:例3:試?yán)梅纸M資料計(jì)算標(biāo)準(zhǔn)差職工工資(元)職工人數(shù)(f)組中值(x)

250-270152603900-5037500270-290252807000-3022500290-3103530010500-103500310-3306532020800106500330-35040340136003036000合計(jì)180-55800106000先計(jì)算平均數(shù):

=55800/180=310標(biāo)準(zhǔn)差

=(10600/180)^0.5=24.27(元)營(yíng)業(yè)收入(億元)企業(yè)個(gè)數(shù)(江蘇)(浙江)10-20487520-30262430-4040-5050-6060-7070-8080-9090-100100以上15166878988163111810合計(jì)

144154例4:以下是江蘇省和浙江省2004年年?duì)I業(yè)收入超過10億元企業(yè),試用標(biāo)準(zhǔn)差來比較兩省營(yíng)業(yè)收入超過10億元企業(yè)收入的穩(wěn)定程度。江蘇:先計(jì)算平均數(shù):=43.26(億元)

標(biāo)準(zhǔn)差

=31.52(億元)浙江:=32.98(億元)=26.07(億元)解答:在實(shí)際計(jì)算方差時(shí),可以采用另一種較為簡(jiǎn)便的方法:方差和標(biāo)準(zhǔn)差也是根據(jù)全部數(shù)據(jù)計(jì)算的,它反映了每個(gè)數(shù)據(jù)與其均值相比平均相差的數(shù)值,因此它能準(zhǔn)確地反映出數(shù)據(jù)的離散程度。1、σ與R的關(guān)系2、σ與A.D.的關(guān)系

經(jīng)驗(yàn)表明,當(dāng)分布數(shù)列接近于正態(tài)分布時(shí),R和σ之間存在以下經(jīng)驗(yàn)公式:R為4至6個(gè)σ:當(dāng)標(biāo)志值項(xiàng)數(shù)較少時(shí),R≈4σ

當(dāng)標(biāo)志值項(xiàng)數(shù)較多時(shí),R≈6σ

對(duì)同一資料,所求的平均差一般比標(biāo)準(zhǔn)差要小,即A.D.≤σ標(biāo)準(zhǔn)差與全距、平均差的關(guān)系(六)離散系數(shù)對(duì)于平均水平不同或計(jì)量單位不同的不同組別的變量值,是不能直接用上述離散程度的測(cè)度值直接進(jìn)行比較的。為了消除變量值水平高低和計(jì)量單位不同對(duì)離散程度測(cè)度值的影響,需要計(jì)算離散系數(shù)。人均年收入收入標(biāo)準(zhǔn)差甲城市6000150乙城市12000180離散系數(shù)通常是就標(biāo)準(zhǔn)差來計(jì)算的,因此,也稱為標(biāo)準(zhǔn)差系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo)。計(jì)算公式為:Vσ和Vs分別表示總體離散系數(shù)和樣本離散系數(shù)。

離散系數(shù)要是用于對(duì)不同組別數(shù)據(jù)的離散程度進(jìn)行比較,離散系數(shù)大的說明該組數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說明該組數(shù)據(jù)的離散程度也就小。

【例1】

:甲乙兩個(gè)城市的居民年收入情況表中前三欄的數(shù)據(jù)來看,乙城市不僅人均年收入兩倍于甲城市,而且收入的差距也似乎顯著于甲城市。但通過計(jì)算標(biāo)準(zhǔn)差系數(shù)可以看出:乙城市的實(shí)際收入差距相對(duì)于它的平均收入來說,比甲城市要低的多。或者說,以居民對(duì)收入收入差距所承受的壓力而言,甲城市要比乙城市高得多.人均年收入收入標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差系數(shù)甲城市60001502.5乙城市120001801.5例2:江蘇企業(yè)江蘇企業(yè)的經(jīng)營(yíng)收入比浙江企業(yè)穩(wěn)定浙江企業(yè)【例子】某班級(jí)兩個(gè)寢室同學(xué)的數(shù)學(xué)考試成績(jī)?nèi)缦卤硭?,?jì)算并說明哪個(gè)寢室同學(xué)的考試成績(jī)分布更均勻。有兩個(gè)寢室同學(xué)的數(shù)學(xué)考試成績(jī)數(shù)據(jù)學(xué)生編號(hào)A寢室學(xué)生成績(jī)x1B寢室學(xué)生成績(jī)x212345679590828075606093929086706456

反映平均成績(jī)的代表性,可以計(jì)算變異指標(biāo),進(jìn)行對(duì)比。上例中,可以用三個(gè)指標(biāo)來反映。1、計(jì)算全距A寢室,成績(jī)的全距=95-60=35分B寢室,全距=93-56=37分則B寢室同學(xué)的成績(jī)變異程度大于A寢室。2、計(jì)算平均差或平均差系數(shù)A寢室:平均成績(jī)=77.4平均差=10.7平均差系數(shù)=13.8%B寢室:平均成績(jī)=78.7平均差=13.2平均差系數(shù)=16.8%則B寢室同學(xué)的成績(jī)變異程度大于A寢室。結(jié)論:計(jì)算結(jié)果表明,v1<v2,說明A寢室同學(xué)的成績(jī)分布比B寢室均勻。3、計(jì)算標(biāo)準(zhǔn)差或標(biāo)準(zhǔn)差系數(shù)注意:實(shí)際中直接計(jì)算“標(biāo)準(zhǔn)差”和“標(biāo)準(zhǔn)差系數(shù)”,因?yàn)檫@兩個(gè)指標(biāo)最常用且準(zhǔn)確?!纠印?/p>

常用的幾種標(biāo)志變異指標(biāo)概念 計(jì)算 特點(diǎn) 數(shù)列中最大值與最小值之差1.極差(R)R=最大值-最小值優(yōu)點(diǎn):容易理解,計(jì)算方便缺點(diǎn):不能反映全部數(shù)據(jù)分布狀況2.平均差(A、D)各標(biāo)志值與均值離差絕對(duì)值的算術(shù)平均 簡(jiǎn)單:加權(quán):優(yōu)點(diǎn):反映全部數(shù)據(jù)分布狀況缺點(diǎn):取絕對(duì)值,數(shù)字上不盡合理 概念 計(jì)算 特點(diǎn) 各標(biāo)志值與均值離差平方的平均。方差的平方根(取正根)3.方差(σ2)和標(biāo)準(zhǔn)差(σ) 優(yōu)點(diǎn):反映全部數(shù)據(jù)分布狀況,數(shù)字上合理。缺點(diǎn):受計(jì)量單位和平均水平影響,不便于比較4.標(biāo)準(zhǔn)差系數(shù)(Vσ) 標(biāo)準(zhǔn)差與均值之商,是無量綱的系數(shù) 簡(jiǎn)單:加權(quán):優(yōu)點(diǎn):適宜不同數(shù)據(jù)集的比較缺點(diǎn):對(duì)數(shù)據(jù)結(jié)構(gòu)變化反應(yīng)不靈敏 方差(σ2)和標(biāo)準(zhǔn)差(σ)是應(yīng)用最廣的標(biāo)志變異指標(biāo)是非標(biāo)志的平均數(shù)和標(biāo)準(zhǔn)差

是非標(biāo)志又稱交替標(biāo)志,它是用“是”“否”或“有”“無”來表示的。由于是非標(biāo)志只有兩個(gè)標(biāo)志表現(xiàn),使得研究問題大為簡(jiǎn)化。常用1表示具有某種標(biāo)志表現(xiàn),其單位數(shù)用N1表示,用0表示不具有某種標(biāo)志表現(xiàn),其單位數(shù)用N0表示,全部總體單位數(shù)用N表示。這兩部分單位數(shù)(N1和N0)在總體單位數(shù)(N)中所占的比例,即“是”或“非”的單位數(shù)在全體單位數(shù)中所占比例,稱為“成數(shù)”,分別記為p和q??傮w中具有某種標(biāo)志表現(xiàn)的單位數(shù)的成數(shù)p=N1/N總體中不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)q=N0/N

是非標(biāo)志是非標(biāo)志的算術(shù)平均數(shù)為:是非標(biāo)志的標(biāo)準(zhǔn)差為:是非標(biāo)志的標(biāo)準(zhǔn)差系數(shù):例1:某批產(chǎn)品共500件,其中合格品480件,不合格品20件,要求計(jì)算成數(shù)、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù)。

P=480/500=96%Q=20/500=4%

標(biāo)準(zhǔn)差:(0.96*0.04)^0.5=0.196標(biāo)準(zhǔn)差系數(shù):0.196/0.96=20.41%是非標(biāo)志是非標(biāo)志的均值為p(對(duì)于“是”而言)是非標(biāo)志的方差為p(1-p)=pq。是非標(biāo)志的標(biāo)準(zhǔn)差是非標(biāo)志例子:對(duì)某企業(yè)甲乙兩工人當(dāng)日產(chǎn)品中各抽取10件產(chǎn)品進(jìn)行質(zhì)量檢查,資料如下:?jiǎn)挝唬╩m)零件數(shù)(件)甲工人乙工人9.6以下9.6-9.89.8-10.010.0-10.210.2-10.41233112232合計(jì)1010要求:試比較甲乙兩工人誰生產(chǎn)的零件質(zhì)量較穩(wěn)定。解答:

∴甲工人的零件質(zhì)量比較穩(wěn)定單位(mm)零件數(shù)(件)組中值xxf1xf2甲工人f1乙工人f29.6以下

119.59.59.50.17640.21169.6-9.8229.719.419.40.09680.13529.8-10.0329.929.719.80.00120.007210.0-10.23310.130.330.30.09720.058810.2-10.41210.310.320.60.14440.2312合

計(jì)1010--99.299.60.5160.644第三節(jié)分布形狀的描述一、分布形狀和形狀指標(biāo)形狀指標(biāo)就是反映變量分布具體形狀,即左右是否對(duì)稱、偏斜程度與陡峭程度如何的指標(biāo)。對(duì)稱性陡峭性反映變量分布偏斜程度的指標(biāo),稱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論