用樣本的頻率分布估計(jì)總體分布.ppt_第1頁
用樣本的頻率分布估計(jì)總體分布.ppt_第2頁
用樣本的頻率分布估計(jì)總體分布.ppt_第3頁
用樣本的頻率分布估計(jì)總體分布.ppt_第4頁
用樣本的頻率分布估計(jì)總體分布.ppt_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、復(fù)習(xí)與回顧:,頻率分布直方圖,應(yīng)用,1.求極差,2.決定組距與組數(shù),3.將數(shù)據(jù)分組,4.列頻率分布表,5.畫頻率分布直方圖,頻率分別直方圖與樣本原始數(shù)據(jù)比較: 直方圖可以很容易的表示大量數(shù)據(jù)并且非常直觀,如“峰值”、“對(duì)稱性”; 根據(jù)直方圖可以大致估計(jì)總體的分布情況,但不能保留原來的數(shù)據(jù)。,一個(gè)容量為100的樣本,數(shù)據(jù)的分組和各組的相關(guān)信息如下表,試完成表中每一行的兩個(gè)空格。,0.06,0.16,8,0.06,0.14,16,0.46,思考 : 如果當(dāng)?shù)卣M?85% 以上的居民每月的用水量不超出標(biāo)準(zhǔn),根據(jù)頻率分布表和頻率分布直方圖,你能對(duì)制定月用水量標(biāo)準(zhǔn)提出建議嗎?,0.04,0.08,

2、0.12,0.28,0.50,0.44,0.30,0.16,0.08,頻率分布直方圖如下:,連接頻率分布直方圖中各小長方形上端的中點(diǎn),得到頻率分布折線圖,利用樣本頻率分布對(duì)總體分布進(jìn)行相應(yīng)估計(jì),(3)當(dāng)樣本容量無限增大,組距無限縮小,那么頻率分布直方圖就會(huì)無限接近于一條光滑曲線總體密度曲線。,(2)樣本容量越大,這種估計(jì)越精確。,(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會(huì)有什么變化?假如增至10000呢?,總體密度曲線,月均用水量/t,a,b,(圖中陰影部分的面積,表示總體在某個(gè)區(qū)間 (a, b) 內(nèi)取值的百分比)。,2、用樣本分布直方圖去估計(jì)相應(yīng)的總體分布時(shí),一

3、般樣本容量越大,組距越小,頻率分布折線就會(huì)無限接近總體密度曲線。,1、總體密度曲線反映了總體在各個(gè)范圍內(nèi)取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具。,關(guān)于總體密度曲線的說明:,注:由于樣本是隨機(jī)的,不同的樣本得到的頻率分布折線圖不同;即使對(duì)于同一樣本,不同的分組情況得到的頻率分布折線圖也不同。總之,頻率分布折線圖是隨著抽取的樣本、樣本容量、分組情況的變化而變化的。因此不能由樣本的頻率分布折線圖得到準(zhǔn)確的總體密度曲線。,但不是每個(gè)總體都存在總體密度曲線,如:投擲骰子得到的總體。,莖葉圖,某賽季甲、乙兩名籃球運(yùn)動(dòng)員每場比賽得分的原始記錄如下:,(1)甲運(yùn)動(dòng)員得分: 13,51,

4、23,8,26, 38, 16, 33, 14, 28, 39,(1)乙運(yùn)動(dòng)員得分: 49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36 , 39,莖葉圖,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6 7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,葉就是從莖的旁邊生長出來的數(shù),表示得分的個(gè)位數(shù)。,莖是指中間的一列數(shù),表示得分的十位數(shù),莖葉圖不僅能夠保留原始數(shù)據(jù),而且能夠展示數(shù)據(jù)的分布情況。 從運(yùn)動(dòng)員的成績的分布來看,乙運(yùn)動(dòng)員的成績更好;從葉在莖上的分布情況來看,乙運(yùn)動(dòng)員的得分更集中于峰值附近,說明乙運(yùn)動(dòng)員的發(fā)揮更穩(wěn)定。

5、在樣本數(shù)據(jù)較少時(shí),用莖葉圖表示數(shù)據(jù)的效果較好。它不但可以保留所有信息,而且可以隨時(shí)紀(jì)錄,這對(duì)數(shù)據(jù)的紀(jì)錄和表示都能帶來方便。但當(dāng)樣本數(shù)據(jù)較多時(shí),莖葉圖就顯得不太方便。因?yàn)槊恳粋€(gè)數(shù)據(jù)都要在莖葉圖中占據(jù)一個(gè)空間,如果數(shù)據(jù)很多,枝葉就會(huì)很長。,練習(xí):P71,3,用樣本的數(shù)字特征 估計(jì) 總體的數(shù)字特征,一、眾數(shù)、中位數(shù)、平均數(shù)的概念,中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù)。,眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù)。,眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛

6、。,平均數(shù):一組數(shù)據(jù)的算術(shù)平均數(shù),即,練習(xí): 在一次中學(xué)生田徑運(yùn)動(dòng)會(huì)上,參加男子跳高的17名運(yùn)動(dòng)員的成績?nèi)缦卤硭荆?分別求這些運(yùn)動(dòng)員成績的眾數(shù),中位數(shù)與平均數(shù)。,練習(xí):期末考試后,班長算出了全班40個(gè)人的數(shù)學(xué)成績的平均分M,若把M當(dāng)成一個(gè)同學(xué)的分?jǐn)?shù),與原來的40個(gè)分?jǐn)?shù)一起,算出這41個(gè)分?jǐn)?shù)的平均數(shù)為N,則M : N為 。,練習(xí):當(dāng)5個(gè)整數(shù)從小到大排列時(shí),中位數(shù)是4,如果這5個(gè)數(shù)中的唯一眾數(shù)是6,則這5個(gè)數(shù)之和的最大值是 。,二 、 眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系,1、眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點(diǎn)的橫坐標(biāo)。,0.1,0.2,0.3,0.4,0.5,O 0.5

7、 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.25,2、中位數(shù)在樣本中,有50的個(gè)體小于或等于中位數(shù),也有50的個(gè)體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計(jì)中位數(shù)的值。,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.02,3、平均數(shù)是頻率分布直方圖的“重心”. 是直方圖的平衡點(diǎn)。,X=,n 個(gè)樣本數(shù)據(jù)的平均數(shù)由公式:,頻率分布直方圖中的平均數(shù)的算法:,平均數(shù)=每個(gè)矩形框的面積矩形底邊中點(diǎn)的橫坐標(biāo)之和,0.1,0.2,0.3,0.4,0

8、.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.02,0.04,0.08,0.12,0.28,0.50,0.44,0.30,0.16,0.08,三、三種數(shù)字特征的優(yōu)缺點(diǎn),1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn),但它對(duì)其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征。如上例中眾數(shù)是2.25t,它告訴我們月均用水量為2.25t的居民數(shù)比月均用水量為其它數(shù)值的居民數(shù)多,但它并沒有告訴我們多多少。,2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個(gè)極端值的影響,這在某些情況下是優(yōu)點(diǎn),但它對(duì)極端值的不敏感有時(shí)也會(huì)成為缺點(diǎn)。如上例中假設(shè)有某一用戶月均用水量為10t,那么它所占頻率為0.01,幾乎不影響中位數(shù),但顯然這一極端值是不能忽視的。,3、由于平均數(shù)與每一個(gè)樣本的數(shù)據(jù)有關(guān),所以任何一個(gè)樣本數(shù)據(jù)的改變都會(huì)引起平均數(shù)的改變,這是眾數(shù)、中位數(shù)都不具有的性質(zhì)。也正因如此 ,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,使平均數(shù)在估計(jì)時(shí)可靠性降低。,0.010,0.020,0.030,0.04

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論