2.2 總體分布的估計(jì)_第1頁(yè)
2.2 總體分布的估計(jì)_第2頁(yè)
2.2 總體分布的估計(jì)_第3頁(yè)
2.2 總體分布的估計(jì)_第4頁(yè)
2.2 總體分布的估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)的基本思想方法:,根據(jù)樣本的情況去估計(jì)總體的相應(yīng)情況.,統(tǒng)計(jì)的核心問(wèn)題:,一類是如何從總體中抽取樣本?,另一類是如何根據(jù)對(duì)樣本的整理、計(jì)算、分析,對(duì)總體的情況作出推斷.,抽樣是統(tǒng)計(jì)的第一步,接下來(lái)就要對(duì)樣本進(jìn)行分析,國(guó)際奧委會(huì)2003年6月29日決定,2008年北京奧運(yùn)會(huì)舉辦的日期比原定日期推遲兩周,改在8月8日至8月24日舉行原因是7月末8月初北京地區(qū)得氣溫高于8月中下旬 下表是隨機(jī)抽取的近年來(lái)北京地區(qū)7月25日至8月24日的日最高氣溫,得到如下樣本(單位:C),怎樣通過(guò)上表中的數(shù)據(jù),分析比較兩時(shí)間段的高溫(33)狀況呢?,問(wèn)題引入:,1.頻數(shù)與頻率,頻數(shù)是指一組數(shù)據(jù)中,某范圍內(nèi)的數(shù)據(jù)出

2、現(xiàn)的次數(shù);把頻數(shù)除以數(shù)據(jù)的總個(gè)數(shù),就得到頻率.,2.頻率分布表,當(dāng)總體很大或不便于獲得時(shí),可以用樣本的頻率分布估計(jì)總體的頻率分布.我們把反映總體頻率分布的表格稱為頻率分布表.,頻率分布表:,3.頻率分布條形圖, 各長(zhǎng)方形長(zhǎng)條的寬度要相同. 相鄰長(zhǎng)條的間距要適當(dāng). 長(zhǎng)方形長(zhǎng)條的高度表示取各值的頻率.,由此可得:近年來(lái)北京地區(qū)7月25日至8月10日的高溫天氣的頻率明顯高于8月8日至8月24日.,我國(guó)是世界上嚴(yán)重缺水的國(guó)家之一,城市缺水問(wèn)題較為突出,某市政府為了節(jié)約生活用水,計(jì)劃在本市試行居民生活用水定額管理,即確定一個(gè)居民月用水量標(biāo)準(zhǔn)a,用水量不超過(guò)a的部分按平價(jià)收費(fèi),超出a的部分按議價(jià)收費(fèi)。如果

3、希望大部分居民的日常生活不受影響,那么標(biāo)準(zhǔn)a定為多少比較合理呢 ?,探究:,你認(rèn)為,為了較為合理地確定出這個(gè)標(biāo)準(zhǔn),需要做哪些工作?,我國(guó)是世界上嚴(yán)重缺水的國(guó)家之一,城市缺水問(wèn)題較為突出,某市政府為了節(jié)約生活用水,計(jì)劃在本市試行居民生活用水定額管理,即確定一個(gè)居民月用水量標(biāo)準(zhǔn)a,用水量不超過(guò)a的部分按平價(jià)收費(fèi),超出a的部分按議價(jià)收費(fèi)。如果希望大部分居民的日常生活不受影響,那么標(biāo)準(zhǔn)a定為多少比較合理呢 ?,探究:,采用抽樣調(diào)查的方式獲得樣本數(shù)據(jù) 分析樣本數(shù)據(jù)來(lái)估計(jì)全市居民用水量的分布情況,下表給出100位居民的月均用水量表,分析數(shù)據(jù)的一種基本方法是用圖將它們畫出來(lái),或者用緊湊的表格改變數(shù)據(jù)的排列方

4、式,作圖可以達(dá)到兩個(gè)目的,一是從數(shù)據(jù)中提取信息,二是利用圖形傳遞信息。表格則是通過(guò)改變數(shù)據(jù)的構(gòu)成形式,為我們提供解釋數(shù)據(jù)的新方式,討論:如何分析數(shù)據(jù)?,根據(jù)這些數(shù)據(jù)你能得出用水量其他信息嗎?,為此我們要對(duì)這些數(shù)據(jù)進(jìn)行整理與分析,一頻率分布的概念: 頻率分布是指一個(gè)樣本數(shù)據(jù)在各個(gè)小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布,二畫頻率分布直方圖其一般步驟為 (1)計(jì)算一組數(shù)據(jù)中最大值與最小值的差,即求極差 (2)決定組距與組數(shù) (3)將數(shù)據(jù)分組 (4)列頻率分布表 (5)畫頻率分布直方圖,第一步: 求極差: (數(shù)據(jù)組中最大值與最小值的差距),最大值= 4.3 最小值= 0.2 所

5、以極差= 4.3-0.2 = 4.1,第二步: 決定組距與組數(shù): (強(qiáng)調(diào)取整),當(dāng)樣本容量不超過(guò)100時(shí), 按照數(shù)據(jù)的多少, 常分成512組. 為方便組距的選擇應(yīng)力求”取整”. 本題如果組距為0.5(t). 則,第三步: 將數(shù)據(jù)分組:( 給出組的界限),所以將數(shù)據(jù)分成9組較合適.,0, 0.5), 0.5, 1), 1, 1.5),4, 4.5) 共9組.,第四步: 列頻率分布表.,組距=0.5,0.04,0.08,0.08,0.16,0.3,0.15,0.44,0.22,0.25,0.5,1,2.00,0.02,0.04,0.04,0.08,0.1,0.3,0.15,0.05,第五步: 畫出

6、頻率分布直方圖.,頻率/組距,月均用水量/t,(組距=0.5),小長(zhǎng)方形的面積=?,小長(zhǎng)方形的面積總和=?,月均用水量最多的在哪個(gè)區(qū)間?,探究:同樣一組數(shù)據(jù),如果組距不同,橫軸、縱軸的單位不同,得到的圖的形狀也會(huì)不同.不同的形狀給人以不同的印象,這種印象有時(shí)會(huì)影響我們對(duì)總體的判斷.分別以1和0.1為組距重新作圖,然后談?wù)勀銓?duì)圖的印象.,從圖中我們可以看到,月均用水量在區(qū)間2,2.5)內(nèi)的居民最多,在1.5,2)內(nèi)次之,大部分居民的月均用水量都在1,3)之間.,直方圖能夠很容易地表示大量數(shù)據(jù),非常直觀地表明分布的形狀,使我們能夠看到分布表中看不清楚的數(shù)據(jù)模式,但是直觀圖也丟失了一些信息,例如,原

7、始數(shù)據(jù)不能在圖中表示出了.,頻率分布的條形圖和頻率分布直方圖的區(qū)別,兩者是不同的概念;,橫軸:兩者表示內(nèi)容相同.,思考: 頻率分布條形圖和頻率分布直方圖是兩個(gè)相同的概念嗎? 有什么區(qū)別?,縱軸:兩者表示的內(nèi)容不相同.,頻率分布條形圖的縱軸(長(zhǎng)方形的高)表示頻率;,頻率分布直方圖的縱軸(長(zhǎng)方形的高)表示頻率與組距的比值.其相應(yīng)組距上的頻率等于該組距上長(zhǎng)方形的面積.,S1 計(jì)算數(shù)據(jù)中最大值與最小值的差(極差),確定全距(指整個(gè)取值區(qū)間的長(zhǎng)度) S2 根據(jù)全距,決定組數(shù)和組距(分成的區(qū)間的長(zhǎng)度). S3 分組:通常對(duì)組內(nèi)數(shù)據(jù)所在區(qū)間取左閉右開(kāi)區(qū)間,最后一組取閉區(qū)間. S4 登記頻數(shù),計(jì)算頻率,列出頻

8、率分布表.,算法:,1.頻率分布表,S1 作出頻率分布表,然后作直角坐標(biāo)系,以橫軸表示數(shù)據(jù),縱 軸表示“頻率組距”; S2 把橫軸分為若干段,每一線段對(duì)應(yīng)一個(gè)組的組距, S3 以此線段為底作一矩形,它的高等于該組的頻率/組距,這樣得 出一系列的矩形,每個(gè)矩形的面積恰好是該組上的頻率 這些矩形就構(gòu)成了頻率分布直方圖 所有矩形的面積和為1 ,算法:,2.頻率分布直方圖,圖形的意義:頻率分布直方圖中各小長(zhǎng)方形的面積表示什么?各小長(zhǎng)方形的面積之和為多少?,各小長(zhǎng)方形的面積=頻率,各小長(zhǎng)方形的面積之和=1,寬度:組距,頻率分布折線圖,如果將頻率分布直方圖中各相鄰的矩形的上底邊的中點(diǎn)順次連結(jié)起來(lái),就得到一

9、條折線,我們稱這條折線為本組數(shù)據(jù)的頻率折線圖,練習(xí):投擲一枚均勻骰子44次的記錄是:,現(xiàn)對(duì)這些數(shù)據(jù)進(jìn)行整理,試畫出頻數(shù)分布直方圖,第一步:寫出樣本可能出現(xiàn)的一切數(shù)值,即: 1,2,3,4,5,6 共6個(gè)數(shù)(數(shù)據(jù)分組),第二步:列出頻率分布表:,組距=1,第三步: 畫頻率分布直方圖,小結(jié): 畫頻率分布直方圖的步驟: 第一步: 求極差: (數(shù)據(jù)組中最大值與最小值的差距) 第二步: 決定組距與組數(shù): (強(qiáng)調(diào)取整) 第三步: 將數(shù)據(jù)分組 ( 給出組的界限) 第四步: 列頻率分布表. (包括分組、頻數(shù)、頻率、頻率/組距) 第五步: 畫頻率分布直方圖(在頻率分布表的基礎(chǔ)上繪制,橫坐標(biāo)為樣本數(shù)據(jù)尺寸,縱坐標(biāo)

10、為頻率/組距.),組距:指每個(gè)小組的兩個(gè)端點(diǎn)的距離,組距 組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個(gè)以內(nèi)時(shí), 按數(shù)據(jù)多少常分5-12組。,頻率折線圖的優(yōu)點(diǎn)是它反映了數(shù)據(jù)的變化趨勢(shì)如果將樣本容量取得足夠大,分組的組距取得足夠小,則這條折線將趨于一條曲線,我們稱這一曲線為總體分布的密度曲線,總體密度曲線,總體在區(qū)間 內(nèi)取值的概率,某籃球運(yùn)動(dòng)員在某賽季各場(chǎng)比賽的得分情況如下: 12,15,24,25,31,31,36,36,37,39,44,49,50,1 2 3 4 5,葉:表示個(gè)位數(shù)字,莖:表示十位數(shù)字,莖葉圖,2,5,4,5,1,6,6,7,9,4,9,0,1,從這張圖可以粗略地看出,該運(yùn)動(dòng)員平均得分

11、及中位數(shù)、眾數(shù)都在20到40之間,且分布較對(duì)稱,集中程度高,說(shuō)明其發(fā)揮比較穩(wěn)定,莖葉圖的畫法: 將所有的兩位數(shù)的十位數(shù)字作為“莖”,個(gè)位數(shù)字作為“葉”,莖相同者共用一個(gè)莖,莖按從小到大的順序從上向下列出,共莖的葉一般按從大到小(或從小到大)的順序同行列出 莖葉圖的優(yōu)缺點(diǎn): 優(yōu)點(diǎn)是所有的信息都可以從莖葉圖中得到,便于記錄和表示但莖葉圖表示三位或三位以上的數(shù)據(jù)時(shí)不夠方便,例甲、乙兩籃球運(yùn)動(dòng)員在上賽季 每場(chǎng)比賽的得分如下,試比較這兩位 運(yùn)動(dòng)員的得分水平,甲 12,15,24,25,31,31, 36,36,37,39,44,49,50 乙 8,13,14,16,23,26, 28,33,38,39,51,解:畫出兩人得分的莖葉圖; 從這個(gè)莖葉圖可以看出甲運(yùn)動(dòng)員的得 分大致對(duì)稱,平均得分及中位數(shù)、眾數(shù)都是多分;乙運(yùn)動(dòng)員的得分除一個(gè)外,也大致對(duì)稱,平均得分及中位數(shù)、眾數(shù)都是多分,因此甲運(yùn)動(dòng)員發(fā)揮比

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論