版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十二章統(tǒng)計(jì)12.1抽樣方法知識(shí)導(dǎo)學(xué)1.抽簽法:(1)將總體中的所有個(gè)體編號(hào)(號(hào)碼可以從1到N);(2)將1到N這N個(gè)號(hào)碼寫(xiě)在形狀、大小相同的號(hào)簽上(號(hào)簽可以用小球、卡片、紙條等制作);(3)將號(hào)簽放在同一箱中,并攪拌均勻;(4)從箱中每次抽出1個(gè)號(hào)簽,并記錄其編號(hào),連續(xù)抽取k次;(5)從總體中將與抽到的簽的編號(hào)相一致的個(gè)體取出.2.隨機(jī)數(shù)表法:(1)對(duì)總體中的個(gè)體進(jìn)行編號(hào)(每個(gè)號(hào)碼位數(shù)一致);(2)在隨機(jī)數(shù)表中任選一個(gè)數(shù)作為開(kāi)始;(3)從選定的數(shù)開(kāi)始按一定的方向讀下去,得到的數(shù)碼若不在編號(hào)中,則跳過(guò);若在編號(hào)中,則取出;如果得到的號(hào)碼前面已經(jīng)取出,也跳過(guò);如此繼續(xù)下去,直到取滿(mǎn)為止;根據(jù)選定的號(hào)碼抽取樣本.3.系統(tǒng)抽樣(等距抽樣):(1)采用隨機(jī)的方式將總體中的個(gè)體編號(hào);(2)將整個(gè)的編號(hào)按一定的間隔(設(shè)為k)分段,當(dāng)(N為總體中的個(gè)體數(shù),n為樣本容量)是整數(shù)時(shí),;當(dāng)不是整數(shù)時(shí),從總體中剔除一些個(gè)體,使剩下的總體中個(gè)體的個(gè)數(shù)N能被n整除,這時(shí),并將剩下的總體重新編號(hào);(3)在第一段中用簡(jiǎn)單隨機(jī)抽樣確定起始的個(gè)體編號(hào);(4)將編號(hào)為的個(gè)體抽出.4.分層抽樣:(1)將總體按一定標(biāo)準(zhǔn)分層;(2)計(jì)算各層的個(gè)體數(shù)與總體的個(gè)數(shù)的比;(3)按各層個(gè)體數(shù)占總體的個(gè)體數(shù)的比確定各層應(yīng)抽取的樣本容量;(4)在每一層進(jìn)行抽樣(可用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣).二.疑難知識(shí)導(dǎo)析1.簡(jiǎn)單隨機(jī)抽樣是從總體中逐個(gè)不放回地抽取.2.簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣都是一種等概率抽樣,即每個(gè)個(gè)體被抽到的可能性都是相同的.3.簡(jiǎn)單隨機(jī)抽樣適用于總體中個(gè)體較少的情況;系統(tǒng)抽樣適用于總體中個(gè)體數(shù)較多的情形;分層抽樣用于總體由幾個(gè)差異明顯的部分組成的情況.分層抽樣時(shí),在每一層內(nèi)進(jìn)行抽樣時(shí)可根據(jù)具體情況,采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣.在使用分層抽樣時(shí),在每一層內(nèi)抽樣的比例相同.三.經(jīng)典例題導(dǎo)講[例1]某工廠生產(chǎn)A,B,C,D四種不同型號(hào)的產(chǎn)品,產(chǎn)品數(shù)量之比依次為2:3:5:1,現(xiàn)用分層抽樣方法抽出一個(gè)容量為n的樣本,樣本中A型號(hào)有16件,那么此樣本容量n是多少?錯(cuò)解:樣本容量16=2(件)錯(cuò)因:混淆了A型號(hào)產(chǎn)品與樣本容量的比例關(guān)系.正解:在分層抽樣中,每一層所抽的個(gè)體數(shù)的比例與總體中各層個(gè)體數(shù)的比例是一致的,所以,樣本容量為答:此樣本容量為88件.[例2]從1002名學(xué)生中選取100名進(jìn)行抽樣檢查.請(qǐng)用系統(tǒng)抽樣法設(shè)計(jì)一種方案,敘述其步驟.解:(1)將1002名學(xué)生進(jìn)行編號(hào),號(hào)碼分別為1,2,……,1002;(2)用隨機(jī)數(shù)表法剔除2個(gè)個(gè)體,并將剩下的學(xué)生重新編號(hào),號(hào)碼分別為1,2,……1000;(3)將1000個(gè)號(hào)碼平均分成100組,并在第一組1,2,……,10中用簡(jiǎn)單隨機(jī)抽樣法確定一個(gè)號(hào)碼(如);將號(hào)碼為的個(gè)體抽出.[例3]某學(xué)校有2005名學(xué)生,從中選取20人參加學(xué)生代表大會(huì),采用簡(jiǎn)單隨機(jī)抽樣方法進(jìn)行抽樣,是用抽簽法還是隨機(jī)數(shù)表法?如何具體實(shí)施?分析:由于學(xué)生人數(shù)較大,制作號(hào)簽比較麻煩,所以決定用隨機(jī)數(shù)表法解:采用隨機(jī)數(shù)表法實(shí)施步驟:對(duì)2005名同學(xué)進(jìn)行編號(hào),0000-2004在隨機(jī)數(shù)表中隨機(jī)地確定一個(gè)數(shù)作為開(kāi)始,如21行45列的數(shù)字9開(kāi)始的4位:9706;依次向下讀數(shù),5595,4904,………,如到最后一行,轉(zhuǎn)向左邊的四位數(shù)字號(hào)碼,并向上讀,凡不在0000-2004范圍內(nèi)的,則跳過(guò),遇到已讀過(guò)的數(shù)也跳過(guò),最后得到號(hào)碼為:0011,0570,1449,1072,1338,0076,1281,1866,1349,0864,0842,0161,1839,0895,1326,1454,0911,1642,0598,1855的學(xué)生組成容量為20的樣本.[例4]某工廠有3條生產(chǎn)同一產(chǎn)品的流水線,每天生產(chǎn)的產(chǎn)品件數(shù)分別是3000件,4000件,8000件.若要用分層抽樣的方法從中抽取一個(gè)容量為150件產(chǎn)品的樣本,應(yīng)該如何抽樣?解:總體中的個(gè)體數(shù)N=3000+4000+8000=15000樣本容量n=150抽樣比例為所以應(yīng)該在第一條流水線生產(chǎn)的產(chǎn)品中隨機(jī)抽取3000=30件產(chǎn)品在第二條流水線生產(chǎn)的產(chǎn)品中隨機(jī)抽?。?000=40件產(chǎn)品在第三條流水線生產(chǎn)的產(chǎn)品中隨機(jī)抽?。?000=50件產(chǎn)品這里因?yàn)槊織l流水線所生產(chǎn)的產(chǎn)品數(shù)都較多,所以,在每條流水線的產(chǎn)品中抽取樣品時(shí),宜采用系統(tǒng)抽樣方法四.典型習(xí)題導(dǎo)練1.為了解某班50名同學(xué)的會(huì)考及格率,從中抽取10名進(jìn)行考查分析,則在這次考查中,考查的總體內(nèi)個(gè)體總數(shù)為樣本容量為.2.采用系統(tǒng)抽樣從含有2000個(gè)個(gè)體的總體(編號(hào)為0000,0001,……,1999)中抽取一個(gè)容量為100的樣本,則第一段的編號(hào)為若在第一段中用簡(jiǎn)單隨機(jī)抽樣得到起始個(gè)體編號(hào)為0013,則前6個(gè)入樣編號(hào)為.3.某市為了了解職工的家庭生活狀況,先將職工所在的國(guó)民經(jīng)濟(jì)行業(yè)分成13類(lèi),然后每個(gè)行業(yè)抽的職工家庭進(jìn)行調(diào)查,這種抽樣方法是.4.用分層抽樣的方法在一個(gè)企業(yè)中抽取一個(gè)樣本容量為50的樣本,其中在管理營(yíng)銷(xiāo)部門(mén)抽了15人,技術(shù)部門(mén)10人,其余在生產(chǎn)工人中抽取,已知該企業(yè)有生產(chǎn)工人375人,那么這個(gè)企業(yè)共有多少職工?5.采用簡(jiǎn)單隨機(jī)抽樣從含有5個(gè)人的身高的總體中抽取一個(gè)容量為2的樣本,寫(xiě)出全部樣本,并計(jì)算各個(gè)樣本的平均值,各樣本平均值的平均值.12.2頻率分布直方圖、折線圖與莖葉圖一、知識(shí)導(dǎo)學(xué)1.頻率分布表:反映總體頻率分布的表格.2.一般地,編制頻率分布表的步驟如下:(1)求全距,決定組數(shù)和組距,組距=;(2)分組,通常對(duì)組內(nèi)數(shù)值所在區(qū)間取左閉右開(kāi)區(qū)間,最后一組取閉區(qū)間;(3)登記頻數(shù),計(jì)算頻率,列出頻率分布表.頻率(分布)直方圖:利用直方圖反映樣本的頻率分布規(guī)律.一般地,作頻率分布直方圖的方法為:(1)把橫軸分成若干段,每一線段對(duì)應(yīng)一個(gè)組的組距;(2)以此線段為底作矩形,它的高等于該組的,這樣得出一系列的矩形;(3)每個(gè)矩形的面積恰好是該組上的頻率.頻率折線圖:如果將頻率分布直方圖中各相鄰的矩形的上底邊的中點(diǎn)順次連接起,就得到一條折線,稱(chēng)這條折線為本組數(shù)據(jù)的頻率折線圖.制作莖葉圖的方法是:將所有兩位數(shù)的十位數(shù)字作為“莖”,個(gè)位數(shù)字作為“葉”,莖相同者共用一個(gè)莖,莖按從小到大的順序從上向下列出,共莖的葉一般按從大到?。ɑ驈男〉酱螅┑捻樞蛲辛谐?二、疑難知識(shí)導(dǎo)析在編制頻率分布表時(shí),要選擇適當(dāng)?shù)慕M距和起始點(diǎn)才可以使頻率分布表更好地反映數(shù)據(jù)的分布情況.在編制頻率分布表時(shí),如果取全距時(shí)不利于分組(如不能被組數(shù)整除),可適當(dāng)增大全距,如在左右兩端各增加適當(dāng)范圍(盡量使兩端增加的量相同).頻率折線圖的優(yōu)點(diǎn)是它反映了數(shù)據(jù)的變化趨勢(shì),如果將樣本容量取得足夠大,分組的組距取得足夠小,則這條折線將趨于一條曲線,我們稱(chēng)這一曲線為總體分布的密度曲線.莖葉圖對(duì)于分布在0~99的容量較小的數(shù)據(jù)比較合適,此時(shí),莖葉圖比直方圖更詳盡地表示原始數(shù)據(jù)的信息.在莖葉圖中,莖也可以放兩位,后面位數(shù)多可以四舍五入后再制圖.三、典型例題導(dǎo)講[例1]一個(gè)社會(huì)調(diào)查機(jī)構(gòu)就某地居民的月收入調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫(huà)了樣本的頻率分布直方圖(如下圖).為了分析居民的收入與年齡、學(xué)歷、職業(yè)等方面的關(guān)系,要從這10000人用再用分層抽樣方法抽出100人作進(jìn)一步調(diào)查,則在(元)月收入段應(yīng)抽出人.解析:由直方圖可得(元)月收入段共有人,按分層抽樣應(yīng)抽出人.故答案25點(diǎn)評(píng):頻率分布直方圖中,關(guān)健要理解圖中數(shù)據(jù)的意義,特別是圖中每個(gè)小矩形的面積才是這一組距內(nèi)個(gè)體的頻率.[例2]從有甲乙兩臺(tái)機(jī)器生產(chǎn)的零件中各隨機(jī)抽取15個(gè)進(jìn)行檢驗(yàn),相關(guān)指標(biāo)的檢驗(yàn)結(jié)果為:甲:534,517,528,522,513,516,527,526,520,508,533,524,518,522,512乙:512,520,523,516,530,510,518,521,528,532,507,516,524,526,514畫(huà)出上述數(shù)據(jù)的莖葉圖錯(cuò)解:甲乙80787632102466887642202013468433024錯(cuò)因:對(duì)于兩位數(shù)是將兩位數(shù)的十位數(shù)字作為“莖”,個(gè)位數(shù)字作為“葉”,莖相同者共用一個(gè)莖,莖按從小到大的順序從上向下列出,共莖的葉一般按從大到小(或從小到大)的順序同行列出,對(duì)于三位數(shù)字,應(yīng)該把前兩位數(shù)字作為莖,最后一位數(shù)字作為葉,然后從圖中觀察數(shù)據(jù)的分布情況,而不是仍考慮兩位數(shù),盡管此題的效果一樣.正解:用前兩位數(shù)作為莖,莖葉圖為甲乙8507876325102466887642205201346843530254從圖中可以看出,甲機(jī)床生產(chǎn)的零件的指標(biāo)分布大致對(duì)稱(chēng),平均分在520左右,中位數(shù)和眾數(shù)都是522,乙機(jī)床生產(chǎn)的零件的指標(biāo)分布也大致對(duì)稱(chēng),平均分也在520左右,中位數(shù)和眾數(shù)分別是520和516,總的看,甲的指標(biāo)略大一些.[例3]在繪制頻率分布直方圖的第三個(gè)矩形時(shí),矩形高度與這個(gè)矩形的寬度(組距)有關(guān);與樣本容量n無(wú)關(guān);與第三個(gè)分組的頻數(shù)有關(guān);與直方圖的起始點(diǎn)無(wú)關(guān).以上結(jié)論中正確的共有()A.0個(gè)B.1個(gè)C.2個(gè)D.3個(gè)錯(cuò)解:D.錯(cuò)因:起始點(diǎn)與組距均影響第三組的頻數(shù),所以矩形高度與以上各因素均有關(guān),①③正確,正解:C.[例4]根據(jù)中國(guó)銀行的外匯牌價(jià),2005年第一季度的60個(gè)工作日中,歐元的現(xiàn)匯買(mǎi)入價(jià)(100歐元的外匯可兌換的人民幣)的分組與各組頻數(shù)如下:〔1050,1060〕:1,〔1060,1070〕:7,〔1070,1080〕:20,〔1080,1090〕:11,〔1090,1100〕:13,〔1100,1110〕:6,〔1110,1120〕:2.(1)列出歐元的現(xiàn)匯買(mǎi)入價(jià)的頻率分布表;(2)估計(jì)歐元的現(xiàn)匯買(mǎi)入價(jià)在區(qū)間1065~1105內(nèi)的頻率;(3)如果歐元的現(xiàn)匯買(mǎi)入價(jià)不超過(guò)x的頻率的估計(jì)值為0.95,求此x解:(1)歐元的現(xiàn)匯買(mǎi)入價(jià)的頻率分布表為:分組頻數(shù)頻率[1050,1060﹚10.017[1060,1070﹚70.117[1070,1080﹚200.333[1080,1090﹚110.183[1090,1100﹚130.217[1100,1110﹚60.100[1110,1120﹚20.033合計(jì)601.000(2)歐元現(xiàn)匯買(mǎi)入價(jià)在區(qū)間1065~1105內(nèi)的頻率的估計(jì)值為(3)因?yàn)?.017+0.117+0.333+0.183+0.217=0.867〈0.95,0.017+……+0.217+0.100=0.967〉0.95,所以在[1100,1110]內(nèi),且滿(mǎn)足0.867+0.100即歐元現(xiàn)匯買(mǎi)入價(jià)不超過(guò)1108.3的頻率的估計(jì)為0.95[例5]初一年級(jí)某班期中考試的數(shù)學(xué)成績(jī)統(tǒng)計(jì)如下:分?jǐn)?shù)段10090—9980--8970--7960--690--59人數(shù)26122172如果80分以上(包括80分)定為成績(jī)優(yōu)秀,60分以上(包括60分)定為成績(jī)及格.那么,在這個(gè)班級(jí)的這次成績(jī)統(tǒng)計(jì)中,成績(jī)不及格的頻率是多少?成績(jī)及格的頻率是多少?成績(jī)優(yōu)秀的頻率是多少?解:被統(tǒng)計(jì)的對(duì)象(參加這次考試的本班學(xué)生)共有2+6+12+21+7+2=50個(gè).60分以上的有48個(gè),80分以上的有20個(gè),所以成績(jī)不及格的頻率是,成績(jī)及格的頻率是,成績(jī)優(yōu)秀的頻率是.說(shuō)明要計(jì)算一組數(shù)據(jù)中某個(gè)對(duì)象的頻率,要先計(jì)算數(shù)據(jù)的總的個(gè)數(shù),再計(jì)算符合這個(gè)對(duì)象要求的數(shù)據(jù)的個(gè)數(shù).某個(gè)對(duì)象可以是一個(gè)確定的數(shù)據(jù),也可以是在某一范圍內(nèi)數(shù)據(jù)的總數(shù).[例6]在英語(yǔ)單詞frequency和英語(yǔ)詞組relativefrequency中,頻數(shù)最大的各是哪個(gè)字母?它們的頻數(shù)和頻率各是多少?解:在frequency和英語(yǔ)詞組relativefrequency中,頻數(shù)最大的字母都是e,在單詞frequency中,e的頻數(shù)是2,頻率是;在詞組relativefrequency中,e的頻數(shù)是4,頻率是.點(diǎn)評(píng):在兩組數(shù)據(jù)中,同一個(gè)對(duì)象的頻數(shù)相等,但頻率不一定相等,頻數(shù)大,不一定頻率大.在同一組數(shù)據(jù)中,某兩個(gè)對(duì)象的頻數(shù)相等,頻率也相等;頻數(shù)大,頻率也大.典型習(xí)題導(dǎo)練1.為了了解某地區(qū)高三學(xué)生的身體發(fā)育情況,抽查了該地區(qū)100名年齡為歲的男生體重,得到頻率分布直方圖如下:根據(jù)上圖可得這100名學(xué)生中體重在的學(xué)生人數(shù)是().A.20B.30C.40D.50一個(gè)容量為800的樣本,某組的頻率為6.25%,則這一組的頻數(shù)是某校隨機(jī)抽取了20名學(xué)生,測(cè)量得到的視力數(shù)據(jù)如下:4.7,4.2,5.0,4.1,4.0,4.9,5.1,4.5,4.8,5.2,5.0,4.0,4.5,4.8,4.7,4.8,4.6,4.9,5.3,4.0列出頻率分布表(共分5組)估計(jì)該校學(xué)生的近視率(視力低于4.9)用一個(gè)容量為200的樣本制作頻率分布直方圖時(shí),共分13組,組距為6,起始點(diǎn)為10,第4組的頻數(shù)為25,則直方圖中第4個(gè)小矩形的寬和高分別是多少?200名學(xué)生某次考試的成績(jī)的分組及各組頻率如下表:分組頻數(shù)21130528520則及格率,優(yōu)秀率()的估計(jì)分別是6.某地隨機(jī)檢查了140名成年男性紅細(xì)胞(L),數(shù)據(jù)的分組及頻率如下表:分組頻數(shù)頻率分組頻數(shù)頻率21761311425232127合計(jì)140(1)完成上面的頻率分布表(2)根據(jù)上面的圖表,估計(jì)成年男性紅細(xì)胞數(shù)在正常值(4.0~5.5)內(nèi)的百分比7.名著《簡(jiǎn)愛(ài)》的中英文版本中,第一節(jié)部分內(nèi)容每句句子所含單詞(字)數(shù)如下:英文句子所含單詞數(shù)10,52,56,40,79,9,23,11,10,21,30,31;中文句子所含字?jǐn)?shù)11,79,7,20,63,33,45,36,87,9,11,37,17,18,71,75,51.(1)作出這些數(shù)據(jù)的莖葉圖;(2)比較莖葉圖,你能得到什么結(jié)論?12.3平均數(shù)、方差與標(biāo)準(zhǔn)差一、知識(shí)導(dǎo)學(xué)1.n個(gè)數(shù)據(jù),,…….的平均數(shù)或平均值一般記為=.2.一般地,若取值的頻率分別為,則其平均數(shù)為.3.把一組數(shù)據(jù)的最大值與最小值的差稱(chēng)為極差.一般地,設(shè)一組樣本數(shù)據(jù),其平均數(shù)為,則稱(chēng)為這個(gè)樣本的方差,算術(shù)平方根為樣本的標(biāo)準(zhǔn)差,分別簡(jiǎn)稱(chēng)樣本方差,樣本標(biāo)準(zhǔn)差.二、疑難知識(shí)導(dǎo)析1.平均數(shù),中位數(shù)和眾數(shù)都是總體的數(shù)字特征,從不同角度反映了分布的集中趨勢(shì),平均數(shù)是最常用的指標(biāo),也是數(shù)據(jù)點(diǎn)的“重心”位置,它易受極端值(特別大或特別小的值)的影響,中位數(shù)位于數(shù)據(jù)序列的中間位置,不受極端值的影響,在一組數(shù)據(jù)中,可能沒(méi)有眾數(shù),也可能有多個(gè)眾數(shù).2.方差和標(biāo)準(zhǔn)差是總體的數(shù)字特征,反映了分布的分散程序(波動(dòng)大?。?,標(biāo)準(zhǔn)差也會(huì)受極端值(特別大或特別小的值)的影響.3.分布的分散程序還可以用極差來(lái)描述,但較粗略.4.樣本方差也可以用公式計(jì)算.三、經(jīng)典例題導(dǎo)講[例1]某人5次上班途中所花的時(shí)間(單位:分鐘)分別為已知這組數(shù)據(jù)的平均數(shù)為10,方差為2,則的值為()A.1B.2C.3D.4解:由平均數(shù)公式為10,得,則,又由于方差為2,則得所以有,故選D.[例2]數(shù)據(jù)是一名運(yùn)動(dòng)員的次射擊的命中環(huán)數(shù),則他的平均命中環(huán)數(shù)的估計(jì)是().A.樣本平均數(shù)均值B.樣本極差C.樣本方差D.樣本平均差A(yù)D=錯(cuò)解:C.錯(cuò)因:后三個(gè)選項(xiàng)都表示了樣本的波動(dòng)程度,不能用于總體平均值的估計(jì).正解:A.[例3]某房間中10個(gè)人的平均身高為1.74米,身高為1.85米的第11個(gè)人,進(jìn)入房間后,這11個(gè)人的平均身高是多少?解:原來(lái)的10個(gè)人的身高之和為17.4米,所以,這11個(gè)人的平均身高為=1.75.即這11個(gè)人的平均身高為1075米[例4]若有一個(gè)企業(yè),70%的人年收入1萬(wàn),25%的人年收入3萬(wàn),5%的人年收入11萬(wàn),求這個(gè)企業(yè)的年平均收入及年收入的中位數(shù)和眾數(shù)解:年平均收入為1(萬(wàn));中位數(shù)和眾數(shù)均為1萬(wàn)[例5]下面是某快餐店所有工作人員的收入表:老板大廚二廚采購(gòu)員雜工服務(wù)生會(huì)計(jì)3000元450元350元400元320元320元410元(1)計(jì)算所有人員的月平均收入;(2)這個(gè)平均收入能反映打工人員的月收入的一般水平嗎?為什么?(3)去掉老板的收入后,再計(jì)算平均收入,這能代表打工人員的月收入的水平嗎?(4)根據(jù)以上計(jì)算,以統(tǒng)計(jì)的觀點(diǎn)對(duì)(3)的結(jié)果作出分析解:(1)平均收入(3000+450+350+400+320+320+410)=750元(2)這個(gè)平均收入不能反映打工人員的月收入水平,可以看出打工人員的收入都低于平均收入,因?yàn)槔习迨杖胩貏e高,這是一個(gè)異常值,對(duì)平均收入產(chǎn)生了較大的影響,并且他不是打工人員(3)去掉老板后的月平均收入(450+350+400+320+320+410)=375元.這能代表打工人員的月收入水平(4)由上可見(jiàn),個(gè)別特殊數(shù)據(jù)可能對(duì)平均值產(chǎn)生大的影響,因此在進(jìn)行統(tǒng)計(jì)分析時(shí),對(duì)異常值要進(jìn)行專(zhuān)門(mén)討論,有時(shí)應(yīng)剔除之四、典型習(xí)題導(dǎo)練在一次知識(shí)競(jìng)賽中,抽取20名選手,成績(jī)分布如下:成績(jī)678910人數(shù)分布12467則選手的平均成績(jī)是()A.4B.4.4C.8D.8.82.8名新生兒的身長(zhǎng)(cm)分別為50,51,52,55,53,54,58,54,則新生兒平均身長(zhǎng)的估計(jì)為,約有一半的新生兒身長(zhǎng)大于等于,新生兒身長(zhǎng)的最可能值是.3.某醫(yī)院急診中心關(guān)于其病人等待急診的時(shí)間記錄如下:等待時(shí)間(分鐘)人數(shù)48521用上述分組資料計(jì)算得病人平均等待時(shí)間的估計(jì)值=,病人等待時(shí)間的標(biāo)準(zhǔn)差的估計(jì)值=4.樣本的平均數(shù)為5,方差為7,則3的平均數(shù)、方差,標(biāo)準(zhǔn)差分別為5.下面是一個(gè)班級(jí)在一次測(cè)驗(yàn)時(shí)的成績(jī)(已按從小到大的次序排列),分別計(jì)算男生和女生的成績(jī)和平均值,中位數(shù)以及眾數(shù),試問(wèn)中位數(shù)的含義是什么?對(duì)比兩個(gè)平均值和中位數(shù),你分析一下這個(gè)班級(jí)的學(xué)習(xí)情況男生:55,55,61,65,68,71,72,73,74,75,78,80,81,82,87,94女生:53,66,70,71,73,73,75,80,80,82,82,83,84,85,87,88,90,93,94,976.某工廠甲,乙兩個(gè)車(chē)間包裝同一產(chǎn)品,在自動(dòng)包裝傳送帶上每隔30min抽一包產(chǎn)品,稱(chēng)其重量是否合格,分別記錄抽查數(shù)據(jù)如下:甲車(chē)間:102,101,99,103,98,99,98;乙車(chē)間:110,105,90,85,75,115,110.(1)這樣的抽樣是何種抽樣方法?(2)估計(jì)甲、乙兩車(chē)間的均值與方差,并說(shuō)明哪個(gè)車(chē)間的產(chǎn)品較穩(wěn)定.12.4線性回歸方程一、知識(shí)導(dǎo)學(xué)變量之間的常見(jiàn)關(guān)系有如下兩類(lèi):一類(lèi)是確定性函數(shù)關(guān)系,變量之間的關(guān)系可以用函數(shù)表示;一類(lèi)是相關(guān)關(guān)系,變量之間有一定的聯(lián)系,但不能完全用函數(shù)來(lái)表達(dá)能用直線方程近似表示的相關(guān)關(guān)系叫做線性相關(guān)關(guān)系一般地,設(shè)有(x,y)的n對(duì)觀察數(shù)據(jù)如下:…………當(dāng)a,b使取得最小值時(shí),就稱(chēng)為擬合這n對(duì)數(shù)據(jù)的線性回歸方程,將該方程所表示的直線稱(chēng)為回歸直線.4.線性回歸方程中的系數(shù)滿(mǎn)足:由此二元一次方程組便可依次求出的值:(*)5.一般地,用回歸直線進(jìn)行擬合的一般步驟為:(1)作出散點(diǎn)圖,判斷散點(diǎn)是否在一條直線附近;(2)如果散點(diǎn)在一條直線附近,用公式(*)求出,并寫(xiě)出線性回歸方程.二、疑難知識(shí)導(dǎo)析1.現(xiàn)實(shí)世界中兩個(gè)變量的關(guān)系中更多的是相關(guān)關(guān)系而不是確定性關(guān)系,許多物理學(xué)中公式看起來(lái)是確定性關(guān)系,實(shí)際上由于公式的使用范圍,測(cè)量誤差等的影響,試驗(yàn)得到的數(shù)據(jù)之間是相關(guān)關(guān)系.2.用最小二乘估計(jì)方法計(jì)算得到的使函數(shù)達(dá)到最小3.還有其他尋找較好的回歸直線的原則(如使y方向的偏差和最小,使各點(diǎn)到回歸直線的距離之和最小等)比較相關(guān)關(guān)系絕對(duì)值的大小可以比較一組變量之間哪兩個(gè)變量有更強(qiáng)的(線性)相關(guān)關(guān)系.“最好的”直線方程中“最好”可以有多種解釋?zhuān)簿陀胁煌那蠼夥椒?,現(xiàn)在廣泛采用的最小二乘法所用的思想是找到使散點(diǎn)到直線在垂直方向上的距離的平方和最小的直線,用這個(gè)方法,的求解最簡(jiǎn)單三、經(jīng)典例題導(dǎo)講[例1]有如下一組y與x的數(shù)據(jù)-3-2-10123y9410149問(wèn)y與x的(樣本)相關(guān)系數(shù)r是多少?這是否說(shuō)明y與x沒(méi)有關(guān)系?錯(cuò)解:所以相關(guān)系數(shù)r=0,即y與x沒(méi)有關(guān)系.錯(cuò)因:相關(guān)系數(shù)r=0并不是說(shuō)明y與x沒(méi)有關(guān)系,而是說(shuō)明y與x沒(méi)有線性相關(guān)關(guān)系,但有可能有非線性相關(guān)關(guān)系.正解:所以相關(guān)系數(shù)r=0,即y與x沒(méi)有線性相關(guān)關(guān)系,但有可能有非線性相關(guān)關(guān)系.此題中y與x之間存在著的二次相關(guān)關(guān)系的.[例2]某工廠在2004年的各月中,一產(chǎn)品的月總成本y(萬(wàn)元)與月產(chǎn)量x(噸)之間有如下數(shù)據(jù):x4.164.244.384.564.724.965.185.365.65.745.966.14y4.384.564.64.834.965.135.385.555.715.896.046.25若2005年1月份該產(chǎn)品的計(jì)劃產(chǎn)量是6噸,試估計(jì)該產(chǎn)品1月份的總成本.分析:可將此問(wèn)題轉(zhuǎn)化為下面三個(gè)問(wèn)題:(1)畫(huà)出散點(diǎn)圖,根據(jù)散點(diǎn)圖,大致判斷月總成本y與月產(chǎn)量之間是否有線性相關(guān)關(guān)系;(2)求出月總成本y與月產(chǎn)量x之間的線性回歸方程;若2005年1月份該產(chǎn)品的計(jì)劃產(chǎn)量是6噸,試估計(jì)該產(chǎn)品1月份的總成本.錯(cuò)解:省去第一步,即把判斷判斷月總成本y與月產(chǎn)量之間是否有線性相關(guān)關(guān)系的過(guò)程舍去,想當(dāng)然其具有線性相關(guān)關(guān)系,直接代入公式,求出線性回歸方程.錯(cuò)因:此題的月總成本y與月產(chǎn)量x之間確實(shí)是有線性相關(guān)關(guān)系,若不具有則會(huì)導(dǎo)致錯(cuò)誤.因此判斷的過(guò)程不可少.正解:(1)散點(diǎn)圖見(jiàn)下面,從圖中可以看到,各點(diǎn)大致在一條直線附近,說(shuō)明x與y有較強(qiáng)的線性相關(guān)關(guān)系.(2)代入公式(*)得:a=0.9100,b=0.6477,線性回歸方程是:y=0.9100x+0.6477.(3)當(dāng)x=6.0時(shí),y=0.9100(萬(wàn)元),即該產(chǎn)品1月份的總成本的估計(jì)值為6.11萬(wàn)元.[例3]變量與有線性回歸方程,現(xiàn)在將的單位由變?yōu)榈膯挝挥?變?yōu)?,則在新的回歸方程中..錯(cuò)解:0.1錯(cuò)因:由且的值變?yōu)樵瓉?lái)的,的值變?yōu)樵瓉?lái)的可得的值應(yīng)為原來(lái)的.正解:0.01[例4]
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 邢臺(tái)施工考試題庫(kù)及答案
- 美術(shù)改革模擬試題及答案
- 開(kāi)封市公共基礎(chǔ)輔警考試筆試題庫(kù)及答案
- 醫(yī)院感染監(jiān)測(cè)規(guī)范考題附答案
- 公立醫(yī)院編外招聘試題及答案
- 植物生理判斷題附答案
- 主管護(hù)師考試試題練附答案
- 民營(yíng)企業(yè)會(huì)計(jì)試題帶答案
- 會(huì)計(jì)初級(jí)考試題目及答案
- 驗(yàn)光員測(cè)試題(含答案)
- 廣東省佛山市南海區(qū)2025-2026學(xué)年上學(xué)期期末八年級(jí)數(shù)學(xué)試卷(含答案)
- 【地理】期末重點(diǎn)復(fù)習(xí)課件-2025-2026學(xué)年八年級(jí)地理上學(xué)期(人教版2024)
- 2026年鄉(xiāng)村治理體系現(xiàn)代化試題含答案
- 通風(fēng)設(shè)備采購(gòu)與安裝合同范本
- 化工設(shè)備清洗安全課件
- 2026元旦主題班會(huì):馬年猜猜樂(lè)新春祝福版 教學(xué)課件
- 光伏收購(gòu)合同范本
- 2025海洋水下機(jī)器人控制系統(tǒng)行業(yè)市場(chǎng)需求及發(fā)展趨勢(shì)分析投資評(píng)估規(guī)劃報(bào)告
- T∕ZZB 1815-2020 塑料 汽車(chē)配件用再生聚碳酸酯(PC)專(zhuān)用料
- 2025~2026學(xué)年吉林省吉林市一中高一10月月考語(yǔ)文試卷
- 天津市南開(kāi)中學(xué)2025-2026學(xué)年高一上數(shù)學(xué)期末調(diào)研模擬試題含解析
評(píng)論
0/150
提交評(píng)論