用樣本估計(jì)總體課件_第1頁(yè)
用樣本估計(jì)總體課件_第2頁(yè)
用樣本估計(jì)總體課件_第3頁(yè)
用樣本估計(jì)總體課件_第4頁(yè)
用樣本估計(jì)總體課件_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2.2用樣本估計(jì)總體,復(fù)習(xí)回顧,前面我們研究了通過抽樣來收集數(shù)據(jù)的方法,了解了提高樣本代表性的一些具體方法,數(shù)據(jù)被收集后,必須從中尋找所包含的訊息,以便我們能通過樣本來估計(jì)總體,樣本的特征直接反映了總體的特征,我們通常用樣本來頻率和素質(zhì)特征來評(píng)估總體的特征,聯(lián)合國(guó)報(bào)告曾經(jīng)預(yù)言,21世紀(jì)淡水將成為全世界最緊張的自然資源。我國(guó)是一個(gè)水資源相對(duì)匱乏的國(guó)家,同時(shí)由于經(jīng)濟(jì)發(fā)展所帶來的水污染和用水需矛盾的突顯,水危機(jī)已成為最嚴(yán)峻的現(xiàn)實(shí)問題,極大地阻礙了經(jīng)濟(jì)的發(fā)展。據(jù)統(tǒng)計(jì),由于供水不足,城市工業(yè)每年損失達(dá)到1200億元人民幣;由于城市水污染造成的經(jīng)濟(jì)損失估計(jì)相當(dāng)于國(guó)家當(dāng)年財(cái)政收入的6%;另一方面,飲用水的短

2、缺和水污染也已危及居民的生活和健康,影響到社會(huì)的安定。因此,解決水危機(jī)已被政府提上日程,水價(jià)改革成為解決這一問題的手段之一,2.2.1 用樣本的頻率分布估計(jì)總體分布,黃河斷流,落后的洗車方式,“滴水”成災(zāi),2005年9月,廣州市市政園林局有關(guān)負(fù)責(zé)人在向省政協(xié)“創(chuàng)建節(jié)水型城市”視察團(tuán)匯報(bào)時(shí)表示,為實(shí)現(xiàn)居民生活用水階梯式計(jì)量水價(jià)管理,有關(guān)部門已編制了廣州市居民自來水計(jì)量系統(tǒng)改造實(shí)施方案和階梯式計(jì)量水價(jià)實(shí)施方案,明年開始對(duì)符合條件的居民實(shí)施階梯水價(jià),5年內(nèi)全部實(shí)施。同時(shí),為了改變廣州節(jié)水型用水器具使用率偏低的狀況,市節(jié)水辦計(jì)劃明年實(shí)施用水器具改造。,階梯水價(jià)是指用水單位超出用水計(jì)劃或定額部分的水量,

3、除按實(shí)用水量向城市供水企業(yè)繳納水費(fèi)外,超計(jì)劃用水部分,按以下標(biāo)準(zhǔn)另行向城市供水行政主管部門交納加價(jià)水費(fèi):(一)超計(jì)劃百分之二十以內(nèi)(含百分之二十,下同)水量,超用水量按現(xiàn)行水價(jià)加價(jià)兩倍收費(fèi)。(二)超計(jì)劃百分之二十以上百分之四十以內(nèi)水量,超用水量按現(xiàn)行水價(jià)加價(jià)四倍收費(fèi)。(三)超計(jì)劃百分之四十以上的,超用水量按現(xiàn)行水價(jià)加價(jià)五倍收費(fèi),廣州2006年1月1日廣州市物價(jià)局1日公布,廣州市政府已批準(zhǔn)新水價(jià)從1日起正式實(shí)施。居民生活用水由原來的0.9元/立方米提升到1.32元/立方米,工業(yè)用水和經(jīng)營(yíng)服務(wù)用水也分別由每立方米1.25元和1.85元漲至1.83元和2.71元,綜合水價(jià)達(dá)到1.69元/立方米,但暫

4、時(shí)不實(shí)行階梯水價(jià),針對(duì)這一情況,確定配額水量a為多少時(shí)比較合理?你認(rèn)為為了較為合理的確定這一標(biāo)準(zhǔn),你認(rèn)為需要做哪些工作?,水價(jià)太高,影響居民日常生活,水價(jià)太低,不利于節(jié)約用水.為了確定這一配額a,必須首先了解全市日常用水量的分布情況,由于城市住戶較多,因此我們采用抽查的方式進(jìn)行,下面是對(duì)100戶進(jìn)行抽查的結(jié)果:,樣本容量可以根據(jù)實(shí)際情況適當(dāng)選擇,并不一定越大越好.,這100戶用水量在0.24.3之間,除此之外,我們很難得到其他信息,一次我們必須對(duì)數(shù)據(jù)的潛在信息進(jìn)行分析,在初中,我們學(xué)習(xí)了哪些分析數(shù)據(jù)的方法?,人類辨識(shí)影像的能力要優(yōu)於辨識(shí)文字與數(shù)字的能力 ,因此我們采用圖形的方式來展現(xiàn)數(shù)據(jù)時(shí),常

5、常不我們直接觀察數(shù)據(jù)要來的快。,一幅好的圖勝過一千個(gè)字,下面我們將要學(xué)習(xí)到的是頻率分布表和頻率分布圖,從比例的角度來分析數(shù)據(jù),頻率分布(frequency distribution)的基本步驟是:,1.求極差:,最大數(shù)與最小數(shù)的差,反映了數(shù)據(jù)的變化范圍,4.3-0.2=4.1,2.決定組距和組數(shù),組距和組數(shù)沒有固定的標(biāo)準(zhǔn),常常需要嘗試和選擇的過程,一般數(shù)據(jù)較少(100以內(nèi))時(shí),分成512組,3.數(shù)據(jù)分組:,數(shù)據(jù)的分組也不是越多越好,為了方便,我們力求“取整”,因此,分成9組較合適,以0.5為組距分組時(shí)??梢苑殖?組:,0,0.5),0.5,1.0),4,4.5),當(dāng)樣本容量n很大時(shí),分組數(shù)k應(yīng)

6、該在(1+3.3lgn)附近,4.列頻率分布表,利用 計(jì)算出各組數(shù)據(jù)的頻率,(可以利用EXCEL來完成作圖),5.作頻率分布直方圖,因此所有小長(zhǎng)方形的面積和為1,說明:,1.隨機(jī)性:頻率分布直方圖是由樣本決定,它會(huì)隨著樣本的改變而變化,2.規(guī)律性:根據(jù)頻率與概率的關(guān)系,若固定分組數(shù),隨著樣本用量的增加,各個(gè)頻率段會(huì)穩(wěn)定在總體的相應(yīng)頻率段上,3.特別的,若按9組分組,則頻率直方圖穩(wěn)定于總體密度函數(shù),我們可以用頻率分布折線圖來表示,一般的,隨著樣本容量的增加,作圖時(shí)組數(shù)也相應(yīng)的變大,相應(yīng)的頻率分布折線圖會(huì)越來越接近一條光滑曲線總體密度曲線,總體密度曲線反映了總體在各個(gè)范圍內(nèi)取值的百分比,它比頻率分

7、布直方圖提供更加精細(xì)的信息,例如圖中陰影部分的面積就表示總體在a ,b內(nèi)的百分比,思考:,1.任何一個(gè)總體,它的密度曲線是否一定存在?,3.任何一個(gè)總體的密度曲線是否可以被非常精確的表示出來?,2.任何一個(gè)總體的密度曲線,是否都可以利用函數(shù)來刻畫?,實(shí)施上,任何一個(gè)總體的密度曲線雖然客觀存在,但是很難想函數(shù)圖像一樣被精確的畫出來,我們只能用樣本的頻率分布對(duì)它進(jìn)行估計(jì);一般來說,樣本的容量,估計(jì)就越精確.,除了上面的幾種處理方式外,我們還有一種用來表示數(shù)據(jù)的圖莖葉圖(stem-and-leap display),例 某賽季甲、乙兩名籃球運(yùn)動(dòng)員每場(chǎng)比賽得分情況如下。 甲的得分:12,15,24,2

8、5,31,31,36,36,37,39,44,49,50。 乙的得分:8,13,14,16,23,26,28,33,38,39,51。 上述的數(shù)據(jù)可以用下圖來表示,中間數(shù)字表示得分的十位數(shù),兩邊數(shù)字分別表示兩個(gè)人各場(chǎng)比賽得分的個(gè)位數(shù),從這個(gè)莖葉圖上可以看出,甲運(yùn)動(dòng)員的得分情況是大致對(duì)稱的,中位數(shù)是36;乙運(yùn)動(dòng)員的得分情況除一個(gè)特殊得分外,也大致對(duì)稱,中位數(shù)是26。因此甲運(yùn)動(dòng)員發(fā)揮比較穩(wěn)定,總體得分情況比乙好,十位數(shù),個(gè)位數(shù),個(gè)位數(shù),用莖葉圖表示有兩個(gè)突出的優(yōu)點(diǎn):,但莖葉圖只能表示兩位的整數(shù),雖然可以表示兩個(gè)人的比賽結(jié)果(或兩個(gè)以上的記錄),但沒有直方圖那么直觀、清晰。,2.莖葉圖可以在比賽時(shí)隨

9、時(shí)記錄,方便記錄與表示,1.從統(tǒng)計(jì)圖上沒有信息的損失,所有的信息都可以從這個(gè)莖葉圖中得到,美容業(yè)作為一個(gè)新型的行業(yè),正在迅速的崛起,尤其受到女性的喜愛,請(qǐng)你設(shè)計(jì)一個(gè)方案調(diào)查女性美容的目的,作出頻率分布直方圖和折線圖,匯總并與同學(xué)們交流,練習(xí),2.2.2 用樣本數(shù)字特征估計(jì)總體數(shù)字特征,頻率分布直方圖和頻率分布折線圖雖然能夠很好的反映總體的分布情況,但為了更好的把握總體,我們還需要通過樣本的數(shù)據(jù)對(duì)總體的數(shù)字特征進(jìn)行研究,我們通常用集中趨勢(shì)和離散程度來表示,眾數(shù):就是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù),集中趨勢(shì)用什么表示比較好?離散程度呢?,1集中趨勢(shì)我們可以用眾數(shù)、中位數(shù)、平均數(shù)或加權(quán)平均數(shù)來反映,由圖

10、可以看出月均用水在2.25t(最高的矩形中點(diǎn))的用戶最多,但它沒有告訴我們多多少.,中位數(shù):就是一組數(shù)據(jù)按照從小到大或從大到小的順序進(jìn)行排列時(shí),處于中間位置的數(shù),奇數(shù)個(gè)數(shù)時(shí),中位數(shù)有1個(gè),偶數(shù)個(gè)數(shù)時(shí),中位數(shù)有2個(gè),1 3 5 7 9的中位數(shù)是5,2 6 8 4 5 9的中位數(shù)是5和6,中位數(shù)不受個(gè)別極端數(shù)據(jù)的影響,在某種情況下,這是一個(gè)優(yōu)點(diǎn),但它對(duì)極值的不敏感有時(shí)也會(huì)成為缺點(diǎn),你能舉例說明嗎?,平均數(shù):就是一組數(shù)據(jù)的平均,設(shè)有n個(gè)數(shù)據(jù),x1 ,x2, ,xn,這組數(shù)據(jù)的平均數(shù)為:,特別地,如果上面n個(gè)數(shù)據(jù)中不同數(shù)據(jù)x1,x2,xn的個(gè)數(shù)分別為k1,k2,kn,那么它們的平均數(shù)為,加權(quán)平均數(shù):就

11、是一組數(shù)據(jù)的加權(quán)平均設(shè)有n個(gè)數(shù)據(jù)x1,x2,xn,它們的權(quán)分別為l1,l2,ln,這組數(shù)據(jù)的加權(quán)平均數(shù)為:,加權(quán)是一組數(shù)據(jù)中某一個(gè)數(shù)的頻數(shù),由此可以看出,平均數(shù)是加權(quán)平均數(shù)的一個(gè)特例,也就是說,它們的權(quán)都是1/n,平均數(shù)受每個(gè)數(shù)據(jù)的影響,尤其是極端數(shù)據(jù)對(duì)平均數(shù)影響較大,因此在實(shí)際操作時(shí),常常想方設(shè)法較少誤差,你能舉出具體的例子嗎?,某公司員工的月工資情況如表:,實(shí)例分析,如果你是應(yīng)聘者,你如何看待這些數(shù)據(jù)?,(1)分別計(jì)算該公司員工月工資的平均數(shù)、中位數(shù)和眾數(shù)。 (2)公司經(jīng)理會(huì)選取上面哪個(gè)來代表該公司員工的月工資情況,稅務(wù)官呢?工會(huì)領(lǐng)導(dǎo)呢?,分析:1.根據(jù)平均數(shù)、中位數(shù)的計(jì)算公式,可以算出平

12、均數(shù)為:1373元,中位數(shù)為:800元,眾數(shù)為:700元,2.不同身份的人代表不同階層人的利益,對(duì)公司領(lǐng)導(dǎo)平均數(shù)好,對(duì)稅務(wù)官中位數(shù)比較好,對(duì)工會(huì)領(lǐng)導(dǎo)眾數(shù)即使他的選擇,極差:就是一組數(shù)據(jù)中最大數(shù)與最小數(shù)之間的差,居民用水的極差就是:4.3-0.24.1,2離散程度用極差和標(biāo)準(zhǔn)差或方差來反映,方差:就是一組數(shù)據(jù)中所有數(shù)與平均數(shù)的差的平方和的平均數(shù)設(shè)有n個(gè)數(shù)據(jù)x1,x2,xn,這組數(shù)據(jù)的方差為:,標(biāo)準(zhǔn)差:樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s來表示.,例畫出下列樣本的直方圖,說明它們的異同點(diǎn),(1)5,5,5,5,5,5,5,5,5 (2)4,4,4,5,5,5,6,6,6 (3)3,3,4,4,

13、5,6,6,7,7 (4)2,2,2,2,5,8,8,8,8,解 四組樣本的直方圖為:,說明:,1.平均數(shù)都是:,2.標(biāo)準(zhǔn)差分別為:,0.00,0.82,1.49,2.83,5,3.平均數(shù)是總體的重心所在,標(biāo)均差表明總體的離散程度,其他的信息就丟失了,因此不能完全刻畫總體的全貌.,總體說明,1.樣本眾數(shù)通常用來表示分類變量的中心,容易計(jì)算,但反映總體的信息較少,2.中位數(shù)僅利用了中間數(shù)據(jù)的性質(zhì),當(dāng)樣本數(shù)據(jù)質(zhì)量較差時(shí),應(yīng)該用抗極端數(shù)據(jù)強(qiáng)的數(shù)據(jù)表示中心值.(例如利用計(jì)算機(jī)模擬樣本),3.平均數(shù)比中位數(shù)和眾數(shù)反映了更多的信息,但“極端數(shù)據(jù)”可能使它產(chǎn)生較大的誤差,4.如果樣本平均數(shù)大于樣本中位數(shù),則表示數(shù)據(jù)中存在較多較大的極端數(shù),反之,存在較多較小的極端數(shù),它

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論