版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第十模塊 概率與統(tǒng)計(jì)第四十八講 隨機(jī)抽樣用樣本估計(jì)總體變量間的相互關(guān)系統(tǒng)計(jì)案例回歸課本本1.樣本本及抽樣樣的定義義(1)在在數(shù)理統(tǒng)統(tǒng)計(jì)中稱稱研究對(duì)對(duì)象的全全體為總體,組成總總體的每每一個(gè)基本單元元為個(gè)體,從總體體中抽取取若干個(gè)個(gè)個(gè)體x1,x2,xn,這樣的的n個(gè)個(gè)個(gè)體x1,x2,xn稱為大小為n(容量量為n)的一個(gè)個(gè)樣本.(2)抽抽樣:抽抽樣是為為了獲取總體體的信息息,特別在在客觀實(shí)實(shí)際中對(duì)對(duì)總體的全部個(gè)個(gè)體逐一一進(jìn)行研研究,有有的是不不適宜不可能能或不必必要的.因此,抽樣調(diào)查查是獲取總總體信息息的重要要方法.2.隨機(jī)機(jī)抽樣(1)簡簡單隨機(jī)機(jī)抽樣:從一個(gè)個(gè)總體中中通過逐個(gè)抽取取的方法法從中抽取
2、取一個(gè)樣樣本,且且每次抽抽取時(shí)各各個(gè)個(gè)體體被抽到到的概率率相等,這樣的的抽樣稱稱為簡單隨機(jī)機(jī)抽樣.這樣抽抽出的樣樣本稱為為簡單隨隨機(jī)樣本本.簡單單隨機(jī)抽抽樣的基基本方法法有抽簽法和和隨機(jī)數(shù)數(shù)表法.(2)系系統(tǒng)抽樣樣:系統(tǒng)統(tǒng)抽樣被被稱為等距抽樣樣或機(jī)械械抽樣.它按照照時(shí)間或或空間的的等距間隔隔抽取樣本本,即將將總體分分成幾個(gè)個(gè)部分,然后按按照預(yù)先先定出的的規(guī)則,從每一一部分抽取一個(gè)個(gè)個(gè)體,得到所所需要的的樣本,這種抽抽樣稱為為系統(tǒng)抽抽樣.系系統(tǒng)抽樣樣與簡單單隨機(jī)抽抽樣的聯(lián)聯(lián)系在于于:將總總體均分分后的每每一部分分進(jìn)行抽抽樣時(shí),采用的的是簡單隨機(jī)機(jī)抽樣.(3)分分層抽樣樣:當(dāng)總總體中一一部分個(gè)個(gè)體
3、與另另一部分分個(gè)體有有明顯的差差異且易易于區(qū)別別時(shí),常將將相近的的個(gè)體歸歸成一組組,然后后按照各各部分所所占的比例進(jìn)行抽樣樣,這種種抽樣稱稱為分層抽樣樣.其中所所分成的的各部分分稱為層.分層抽抽樣時(shí),每一個(gè)個(gè)個(gè)體被被抽到的的概率都都是相等的.3.頻率率分布表表頻率率分布直直方圖與與莖葉圖圖(1)頻頻率分布布樣本中所所有數(shù)據(jù)據(jù)(或者者數(shù)據(jù)組組)的頻頻數(shù)和樣樣本容量量的比,就是該該數(shù)據(jù)的的頻率.所有數(shù)數(shù)據(jù)(或或者數(shù)據(jù)據(jù)組)的的頻率的的分布變變化規(guī)律律叫做頻率分布布,可以用用頻率分布布表頻率分布布直方圖圖頻率分分布折線線圖莖莖葉圖等等來表示示.(2)頻頻率分布布折線圖圖:連接接頻率分分布直方方圖中各
4、各小長方方形上端端的中點(diǎn),就得到到頻率分分布折線線圖.(3)總總體密度度曲線如果樣本本容量不不斷增大大,分組組的組距距不斷縮縮小,則則頻率分分布直方方圖實(shí)際際上越來來越接近近于總體在各各小組內(nèi)內(nèi)所取值值的個(gè)數(shù)數(shù)與總數(shù)數(shù)比值的的大小,它可以以用一光滑曲線線來描繪,這條光滑曲線線就叫做總總體密度度曲線.(4)莖莖葉圖表表示數(shù)據(jù)據(jù)有兩個(gè)個(gè)突出的的優(yōu)點(diǎn),其一是是統(tǒng)計(jì)圖圖上沒有有原始數(shù)據(jù)據(jù)的損失,所有信信息都可可以從這這個(gè)莖葉葉圖中得得到,其其二是在在比賽時(shí)時(shí)隨時(shí)記記錄,方方便記錄錄與表示示.4.用樣樣本的數(shù)數(shù)字特征征估計(jì)總總體的數(shù)數(shù)字特征征(1)眾眾數(shù),中中位數(shù),平均數(shù)數(shù)在一組數(shù)數(shù)據(jù)中,出現(xiàn)次次數(shù)最多
5、的數(shù)據(jù)叫叫做這組組數(shù)據(jù)的的眾數(shù).將一組數(shù)數(shù)據(jù)按大大小依次次排列,把處在在中間位置的一一個(gè)數(shù)據(jù)據(jù)(或中中間兩個(gè)個(gè)數(shù)據(jù)的的平均數(shù)數(shù))叫做做這組數(shù)數(shù)據(jù)的中中位數(shù).如果n個(gè)個(gè)數(shù),x1,x2,xn,那么(x1+x2+xn)叫做這n個(gè)數(shù)的的平均數(shù)數(shù).總體中所所有個(gè)體體的平均均數(shù)叫做做總體平均均數(shù).樣本中所所有個(gè)體體的平均均數(shù)叫做做樣本平均均數(shù),如果在在n個(gè)數(shù)數(shù)據(jù)中,x1出現(xiàn)了f1次,x2出現(xiàn)f2次,xk出現(xiàn)fk次(這里里f1+f2+fk=n),那么(x1f1+x2f2+xkfk),叫做這這n個(gè)數(shù)數(shù)的加權(quán)權(quán)平均數(shù)數(shù).5.兩個(gè)個(gè)變量的的相關(guān)關(guān)關(guān)系(1)當(dāng)當(dāng)自變量量的取值值一定時(shí),因變變量的取取值帶有有隨機(jī)性,
6、這兩個(gè)個(gè)變量之之間的關(guān)關(guān)系叫做做相關(guān)關(guān)關(guān)系.如果一個(gè)個(gè)變量的的值由小小變大時(shí)時(shí),另一一個(gè)變量量的值也也在由小小到大,這種相相關(guān)稱為為正相關(guān);反之,如果一一個(gè)變量量的值由由小變大大時(shí),另另一個(gè)變變量的值值在由大大到小,這種關(guān)關(guān)系稱為為負(fù)相關(guān).變量間間的這種種關(guān)系與與函數(shù)關(guān)關(guān)系不同同,它是是一種非非確定關(guān)關(guān)系.(2)散散點(diǎn)圖:表示具具有相關(guān)關(guān)系系的兩個(gè)變變量的一一組數(shù)據(jù)據(jù)的圖形形叫做散散點(diǎn)圖.6.回歸歸直線方方程(1)一一般地,設(shè)x和和y是具具有相關(guān)關(guān)關(guān)系的的兩個(gè)變變量,且且對(duì)應(yīng)于于n個(gè)觀觀測值的的n個(gè)點(diǎn)點(diǎn)大致分分布在一一條直線線的附近近,若所所求的直直線方程程為我們將這這個(gè)方程程叫做回歸直線線方
7、程,a,b叫做回歸系數(shù)數(shù),相應(yīng)的的直線叫叫做回歸直線線.(2)最最小二乘乘法使離差平平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2為最小的的方法,叫做最最小二乘乘法.7.回歸歸分析(1)回回歸直線線方程=bx+a中中,上述方程程對(duì)應(yīng)的的直線叫叫做回歸直線線,而對(duì)兩兩個(gè)變量量所進(jìn)行行的上述述統(tǒng)計(jì)分分析叫做做線性回歸歸分析.相關(guān)系數(shù)數(shù)用相關(guān)系數(shù)數(shù)來描述線線性相關(guān)關(guān)關(guān)系的的強(qiáng)弱.當(dāng)r0時(shí),兩個(gè)變變量正相關(guān);當(dāng)r0時(shí),兩個(gè)變變量負(fù)相關(guān),r的絕絕對(duì)值越越接近1,表明明兩個(gè)變變量的線線性相關(guān)關(guān)性越強(qiáng),r的絕絕對(duì)值接接近于0,表明明兩個(gè)變變量之間間幾乎不存在線性相關(guān)關(guān)關(guān)系.
8、通常當(dāng)當(dāng)|r|大于r0.05時(shí),認(rèn)為為兩個(gè)變變量有很很強(qiáng)的線線性相關(guān)關(guān)關(guān)系,因而求求回歸直直線方程程才有意意義.數(shù)據(jù)點(diǎn)和和它在回回歸直線線上相應(yīng)應(yīng)位置的的差異(y1-i)是隨機(jī)機(jī)誤差效效應(yīng),稱稱i=yi-i為殘差,將所得得值平方方后加起起來,用用數(shù)學(xué)符符號(hào)表示示為(yi-i)2稱為殘差平方方和,它代表表了隨機(jī)機(jī)誤差的的效應(yīng).8.獨(dú)立立性檢驗(yàn)驗(yàn)(1)分分類變量量的定義義如果某種種變量的的不同“值”表示個(gè)體體所屬的的不同類類別,像像這樣的的變量稱稱為分類變量量.(2)22列列聯(lián)表一般地,假設(shè)有有兩個(gè)分分類變量量X和Y,它們們的值域域分別為為x1,x2和y1,y2,其樣樣本頻數(shù)數(shù)列聯(lián)表表(稱為為22
9、列聯(lián)表表)為K2=用用它的大大小可以以決定是是否拒絕絕原來的的統(tǒng)計(jì)假假設(shè)H0,如果K2值較大,就拒絕絕H0,即拒絕絕事件A與與B無關(guān)關(guān).考點(diǎn)陪練練1.(2010重慶)某某單位有有職工750人人,其中中青年職職工350人,中年職職工250人,老年職職工150人,為了了了解該單單位職工工的健康康情況,用分層層抽樣的的方法從從中抽取取樣本.若樣本本中的青青年職工工為7人人,則樣樣本容量量為()A.7B.15C.25D.35解析:設(shè)設(shè)樣本容容量為n,則依依題意有有n=7,n=15,選B.答案:B2.(2010湖北)將將參加夏夏令營的的600名學(xué)生生編號(hào)為為:001,002,600.采用用系統(tǒng)抽抽樣方法
10、法抽取一一個(gè)容量量為50的樣本本,且隨隨機(jī)抽得得的號(hào)碼碼為003.這這600名學(xué)生生分住在在三個(gè)營營區(qū),從從001到300的第第營區(qū)區(qū),從301到到495在第營區(qū),從496到600在在第營營區(qū),三三個(gè)營區(qū)區(qū)被抽中中的人數(shù)數(shù)依次為為()A.26,16,8B.25,17,8C.25,16,9D.24,17,9解析:依依題意及及系統(tǒng)抽抽樣的意意義可知知,將這這600名學(xué)生生按編號(hào)號(hào)依次分分成50組,每每一組各各有12名學(xué)生生,第k(kN*)組抽中中的號(hào)碼碼是3+12(k-1).令令3+12(k-1)300,得得k,因此第第營區(qū)區(qū)被抽中中的人數(shù)數(shù)是25;令3003+12(k-1)495得10.828,
11、所以我我們有99.9%的把把握說,A,B兩藥對(duì)對(duì)該病的的治愈率率之間有有顯著差差別.方法與與技巧上上述結(jié)論論是對(duì)所所有服用用A藥或或B藥的的病人而而言的,絕不要要誤以為為只對(duì)100個(gè)個(gè)病人成成立.這這就體現(xiàn)現(xiàn)了統(tǒng)計(jì)計(jì)的意義義,即由由樣本推推斷出全全體.技法二數(shù)數(shù)形結(jié)結(jié)合思想想【典例2】為為了了了解中學(xué)學(xué)生的身身高情況況,對(duì)某某中學(xué)同同齡的若若干女生生的身高高進(jìn)行測測量,將將所得數(shù)數(shù)據(jù)整理理后,畫畫出頻率率分布直直方圖如如圖所示示,已知知圖中從從左到右右15組的頻頻率分別別為0.05,0.10,0.15,0.15,0.30,68組組的頻數(shù)數(shù)分別為為7,5,3,第二小小組的頻頻數(shù)為6.(1)畫畫出
12、頻率率分布表表;(2)試試問這組組數(shù)據(jù)中中的中位位數(shù)在哪哪個(gè)身高高的范圍圍內(nèi)?(3)如如果本次次測試身身高在157cm以以上(包包括157cm)的的為良好好,試估估計(jì)該校校女生身身高良好好率是多多少?解題切切入點(diǎn)通通過第二二組的頻頻數(shù)和頻頻率先求求出學(xué)生生總數(shù),其他問問題就十十分容易易解決了了,主要要考查同同學(xué)們對(duì)對(duì)頻率分分布表和和頻率分分布直方方圖的掌掌握情況況,考查查識(shí)圖讀圖的的能力,以及靈靈活運(yùn)用用圖表表解決實(shí)實(shí)際問題題的能力力.解(1)因?yàn)闉榈诙M組的頻數(shù)數(shù)是6,頻率是是0.1,所以以學(xué)生總總數(shù)為60.1=60,所以15組的的頻數(shù)分分別為3,6,9,9,18;68組組的頻率率分別為為頻率分布布表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 管道焊接工藝標(biāo)準(zhǔn)化方案
- 暗能量與宇宙學(xué)前沿理論探索
- 2026屆四川省成都市雙流區(qū)雙流棠湖中學(xué)語文高三第一學(xué)期期末調(diào)研試題含解析
- 河南省汝州市實(shí)驗(yàn)中學(xué)2026屆生物高三上期末監(jiān)測試題含解析
- 2026年上海久事智慧體育有限公司招聘備考題庫附答案詳解
- 2026年臺(tái)州市水利水電勘測設(shè)計(jì)院有限公司招聘5人備考題庫及答案詳解一套
- 2026屆泰安市重點(diǎn)中學(xué)高三語文第一學(xué)期期末綜合測試模擬試題含解析
- 2026年中化學(xué)開發(fā)建設(shè)有限公司招聘備考題庫完整答案詳解
- 2026年云南惠民勞務(wù)服務(wù)有限公司關(guān)于客戶聯(lián)絡(luò)中心坐席人員招聘10人備考題庫附答案詳解
- 甘肅省師范大學(xué)附屬中學(xué)2026屆高三生物第一學(xué)期期末質(zhì)量檢測模擬試題含解析
- 切削液回收及處理合同模板
- 2023年移動(dòng)綜合網(wǎng)絡(luò)資源管理系統(tǒng)技術(shù)規(guī)范功能分冊(cè)
- 幼兒園大班班本課程-邂逅水墨課件
- 智慧農(nóng)貿(mào)市場解決方案-智慧農(nóng)貿(mào)市場系統(tǒng)
- 借款服務(wù)費(fèi)合同
- 出生證明與預(yù)防接種聯(lián)辦
- 土石方工程冬季施工方案
- 全球十大嚴(yán)重核事故課件
- 天貓超市考試題及答案
- ADS中文入門教程
- JJF 1366-2012溫度數(shù)據(jù)采集儀校準(zhǔn)規(guī)范
評(píng)論
0/150
提交評(píng)論