統(tǒng)計(jì)資料的綜合.ppt_第1頁
統(tǒng)計(jì)資料的綜合.ppt_第2頁
統(tǒng)計(jì)資料的綜合.ppt_第3頁
統(tǒng)計(jì)資料的綜合.ppt_第4頁
統(tǒng)計(jì)資料的綜合.ppt_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、表示統(tǒng)計(jì)資料的特征數(shù)有哪些? 幾何平均數(shù)與調(diào)和平均數(shù)各適合于什么情況? 計(jì)算樣本方差與總體方差公式有何區(qū)別?,1,3.1 表示集中位置的特征數(shù),3.1.1 平均數(shù),算術(shù)平均數(shù)(Arithmetic average),幾何平均數(shù)(Geometric Mean),調(diào)和平均數(shù),2,定義: 一組n個(gè)觀測(cè)值x1,x2 ,,xn的算術(shù)平均數(shù),定義為,(1)算術(shù)平均數(shù)(Arithmetic average),3,如果資料已經(jīng)分組,組數(shù)為k,用x1,x2 ,,xk 表示各組中點(diǎn),f1,f2,fk 表示相應(yīng)的頻數(shù),那么,(1)算術(shù)平均數(shù)(Arithmetic average),4,表3-1 某校125位大學(xué)一年

2、級(jí)新生體重表,(1)算術(shù)平均數(shù)(Arithmetic average),5,其平均體重:,=, 55.592,(1)算術(shù)平均數(shù)(Arithmetic average),6,(1)算術(shù)平均數(shù)(Arithmetic average),7,在數(shù)據(jù)為環(huán)比類型的問題中,算術(shù)平均數(shù)是不適用的。例如下表是天津市工業(yè)總產(chǎn)值在“十五”期間的逐年增長(zhǎng)率,如求該期間平均增長(zhǎng)率,算術(shù)平均數(shù)是不恰當(dāng)?shù)摹缀纹骄鶖?shù)可以解決這個(gè)問題。,(2)幾何平均數(shù)(Geometric Mean),8,表3-2 天津市工業(yè)總產(chǎn)值,(天津市2005統(tǒng)計(jì)年鑒),(2)幾何平均數(shù)(Geometric Mean),9,定義: 一組n個(gè)數(shù)據(jù)的幾何

3、平均數(shù)定義為,(2)幾何平均數(shù)(Geometric Mean),10,當(dāng)數(shù)據(jù)是相對(duì)變化率,求平均數(shù)時(shí),算術(shù)平均數(shù)也不恰當(dāng)。 例如:甲乙兩地相距120公里,某人乘車往返甲乙兩地之間,去時(shí)速度每小時(shí)20公里,回來時(shí)速度為每小時(shí)30公里,若求平均速度,這時(shí)用算術(shù)平均數(shù)是不對(duì)的,但調(diào)和平均數(shù)可解決此類問題。,(3)調(diào)和平均數(shù),11,在上例中,,(公里/小時(shí)),定義:,一組n個(gè)數(shù)據(jù)的調(diào)和平均數(shù)H,由下式定義,(3)調(diào)和平均數(shù),12,算術(shù)平均數(shù)表示了集中位置特征,它照顧到每一個(gè)值,但它不見得是出現(xiàn)次數(shù)最多的值(甚至也可能不是觀測(cè)值中的一個(gè))。所以有必要研究表示集中位置的其它的特征數(shù)。,3.1.2眾數(shù)(Mo

4、de),13,定義:對(duì)于有頻數(shù)分布的變量,它的眾數(shù)指頻數(shù)最大的變量的值,表3-3 頻數(shù)分布表,對(duì)于已分組且等組距的頻數(shù)分布,根據(jù)最大頻數(shù),可求得眾數(shù)所在組。根據(jù)眾數(shù)定義,可知眾數(shù)不唯一。,3.1.2眾數(shù)(Mode),14,算術(shù)平均數(shù)作為集中位置的特征還有一缺點(diǎn),就是受觀測(cè)值中極端值的影響很大,而一組觀測(cè)值中的極端值常常沒有代表性。中位數(shù)將避免這種影響。,3.1.3 中位數(shù)(Median),15,一組n個(gè)觀測(cè)值按數(shù)值大小排列,處于中央位置的值稱為中位數(shù)以 表示,,,當(dāng)n為奇數(shù),,當(dāng)n為偶數(shù),定義:,即,3.1.3 中位數(shù)(Median),16,第25百分位數(shù)又稱第一個(gè)四分位數(shù)(First Qua

5、rtile) ,用Q1 表示;第50百分位數(shù)又稱第二個(gè)四分位數(shù) (Second Quartile),用Q2表示;第75百分位數(shù) 又稱第三個(gè)四分位數(shù)(Third Quartile),用Q3表示。,中位數(shù)是第50百分位數(shù),一組n個(gè)觀測(cè)值按數(shù)值大小排列如x1,x2,x3,x4 處于p%位置的值稱第p百分位數(shù)。,定義:,3.1.4 百分位數(shù)( Percentile),17,如何計(jì)算百分位數(shù),18,3.2 表示變異(分散)程度的特征數(shù),19,定義 其中xmax和xmin分別為數(shù)據(jù)中的極大值和極小值。,3.2.1極差(或稱全距 Range)R,20,對(duì)于已分組的頻數(shù)分布(組數(shù)為k),定義,平均差M.D.是

6、離差的絕對(duì)值的平均數(shù),即,3.2.2 平均差(Mean Absolute Deviation),21,方差,樣本,對(duì)于已分組的頻數(shù)分布(組數(shù)為k),總體,樣本,總體,3.2.3 方差(Variance),標(biāo)準(zhǔn)差(Standard Deviation),22,標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差,總體標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差,總體標(biāo)準(zhǔn)差,對(duì)于已分組的頻數(shù)分布(組數(shù)為k),標(biāo)準(zhǔn)差的單位與X的單位相同。,3.2.3 方差(Variance),標(biāo)準(zhǔn)差(Standard Deviation),23,定義 變異系數(shù)C,是一個(gè)無量綱的量。它適于用在比較有不同算術(shù)平均數(shù)或有不同量綱的兩組數(shù)據(jù)的情況。例如比較大學(xué)生身高與小學(xué)生身高,或

7、比較130名大學(xué)生身高和體重哪個(gè)變化波動(dòng)范圍比較大時(shí),都可用變異系數(shù)。,3.2.4變異系數(shù)(Coefficient of Variation),24,定義 變異系數(shù)C,是一個(gè)無量綱的量。它適于用在比較有不同算術(shù)平均數(shù)或有不同量綱的兩組數(shù)據(jù)的情況。例如比較大學(xué)生身高與小學(xué)生身高,或比較130名大學(xué)生身高和體重哪個(gè)變化波動(dòng)范圍比較大時(shí),都可用變異系數(shù)。,3.3 表示偏倚情況或程度的特征數(shù),25,3.3.1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置,下圖列舉出了對(duì)稱的、具有左偏態(tài)(負(fù)偏態(tài))和右偏態(tài)(正偏態(tài))的頻數(shù)分布的例子。注意到它們的特點(diǎn)是:,對(duì)稱的分布的眾數(shù)、中位數(shù)和算術(shù)平均數(shù)相同;,具有偏倚性的分

8、布,算術(shù)平均數(shù)突出在外,偏向分布的尾端,而中位數(shù)則介于眾數(shù)與算術(shù)平均數(shù)之間。,偏倚性是表示各觀測(cè)值分布不對(duì)稱情況或程度的。,3.3 表示偏倚情況或程度的特征數(shù),26,圖3-1,3.3.1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置,27,MeMo,MeMo,=Me=Mo,可以看出,對(duì)于單峰的分布,,對(duì)稱態(tài):,左偏態(tài):,右偏態(tài):,3.3.1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置,28,(1)Pearson偏倚系數(shù),Pearson,分布對(duì)稱,則k=0,左偏態(tài),則k0,右偏態(tài),則k0,3.3.2 定量地描述偏倚性,常用的兩個(gè)公式,29,(2)用標(biāo)準(zhǔn)化的三階矩陣g表示,3.3.2 定量地描述偏倚性,常用的兩

9、個(gè)公式,30,3.4 五數(shù)概括法,31,首先將數(shù)據(jù)按遞增順序排列,然后很容易就能確定最小值、3個(gè)四分位數(shù)和最大值了。對(duì)12個(gè)月薪數(shù)據(jù)的樣本,按照遞增順序排列如下: 2210 2255 2350 | 2380 2380 2390 | 2420 2440 2450 | 2550 2630 2825 Q12365 Q22405 Q32500 上述起薪數(shù)據(jù)以五數(shù)概括為:2210,2365,2405,2500,2825。,3.4 五數(shù)概括法,32,盒形圖實(shí)際上是以圖形來概括數(shù)據(jù)。我們將盒形圖延至這一章才講是因?yàn)樗年P(guān)鍵是計(jì)算中位數(shù)和四分位數(shù)Q1和Q3。此外還將用到四分位數(shù)間距IQRQ3Q1 。 盒形圖的畫法步驟如下: (1)畫一個(gè)方盒,其邊界恰好是第1和第3四分位數(shù)。對(duì)于上述的起薪數(shù)據(jù), Q12365, Q32500。 這個(gè)方盒包含了中間的50的數(shù)據(jù)。 (2)在方盒上中位數(shù)的位置畫一條垂線(對(duì)起薪數(shù)據(jù),中位數(shù)為2405)。因此中位數(shù)將數(shù)據(jù)分為相等的兩個(gè)部分。,3.5 盒形圖,33,(3)利用四分位數(shù)間距IQR=Q3Q1,來設(shè)定界限。盒形圖的界限定于低于Q1以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論