下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)基礎(chǔ)知識(shí)一、總體與樣本(一)總體與個(gè)體在一個(gè)統(tǒng)計(jì)問題中,稱研究對(duì)象的全體為總體,構(gòu)成總體的每個(gè)成員稱為個(gè)體。若關(guān)心的是研究對(duì)象的某個(gè)數(shù)量指標(biāo),那么將每個(gè)個(gè)體具有的數(shù)量指標(biāo)稱為個(gè)體,這樣一來,總體就是某數(shù)量指標(biāo)值的全體(即一堆數(shù)),這一堆數(shù)有一個(gè)分布,從而總體可用一個(gè)分布描述,簡(jiǎn)單地說,總體就是一個(gè)分布。統(tǒng)計(jì)學(xué)的主要任務(wù)就是:(1)研究總體是什么分布?(2)這個(gè)總體(即分布)的均值、方差(或標(biāo)準(zhǔn)差)是多少?[例L3T](1)對(duì)某產(chǎn)品僅考察其合格與否,記合格品為0,不合格品為1,那么:總體二{該產(chǎn)品的全體}二{由0或1組成的一堆數(shù)},這一堆數(shù)的分布是什么呢?若記1在總體中所占比例為P,則該總體可用二點(diǎn)分布b(l,p)(n=l的二項(xiàng)分布)表示:X01P比如,有兩個(gè)工廠生產(chǎn)同一產(chǎn)品,甲廠的不合格品率,乙廠的不合格品率,甲乙兩廠所生產(chǎn)的產(chǎn)品(即兩個(gè)總體)分別用如下兩個(gè)分布描述:X甲01PX乙01P如此認(rèn)識(shí)總體,既能看到總體的本質(zhì),又能看到不同總體的差別。(2)考察某橡膠件的抗張強(qiáng)度,它可用0到8上一個(gè)實(shí)數(shù)表示,這時(shí)總體可用區(qū)間[0,8)上的一個(gè)概率分布表示。國(guó)內(nèi)外橡膠業(yè)對(duì)其抗張強(qiáng)度有較多研究,認(rèn)為橡膠件的抗張強(qiáng)度服從正態(tài)分布,該總體常稱為正態(tài)總體。這時(shí)統(tǒng)計(jì)要研究的問題是:正態(tài)均值是多少?正態(tài)分布方差是多少?又如若對(duì)橡膠件進(jìn)行技術(shù)改進(jìn),如通過改進(jìn)配料,提高了該橡膠件抗張強(qiáng)度的均值。這時(shí)我們要研究的問題是:技術(shù)改進(jìn)前后的正態(tài)均值有多大改變?(3)用非對(duì)稱分布(即偏態(tài)分布)描述的總體也是常見的。比如某型號(hào)電視機(jī)壽命的全體所構(gòu)成的總體就是一個(gè)偏態(tài)分布(二)樣本從總體中抽取部分個(gè)體所組成的集合稱為樣本。樣本中的個(gè)體有時(shí)也稱為樣品,樣本中所包含的個(gè)體的個(gè)數(shù)稱為樣本量,常用n表示。人們從總體中抽取樣本是為了認(rèn)識(shí)總體,即從樣本推斷總體,如推斷總體是什么類型的分布?總體均值為多少?總體的標(biāo)準(zhǔn)差是多少?為了使此種統(tǒng)計(jì)推斷有所依據(jù),推斷結(jié)果有效,對(duì)樣本的抽取應(yīng)有所要求。滿足下面兩個(gè)條件的樣本稱為簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱隨機(jī)樣本。(1)隨機(jī)性??傮w中每個(gè)個(gè)體都有相同的機(jī)會(huì)入樣。比如,按隨機(jī)性要求抽出5個(gè)樣品,記為,則其中每一個(gè)個(gè)體的分布都應(yīng)與總體分布相同。只要隨機(jī)抽樣就可保證此點(diǎn)實(shí)施。(2)獨(dú)立性。從總體中抽取的每個(gè)個(gè)體對(duì)其他個(gè)體的抽取無任何影響。假如總體是無限的,獨(dú)立性容易實(shí)現(xiàn);若總體很大,特別地,與樣本量n相比是很大時(shí),即使總體是有限的,此種抽樣獨(dú)立性也可得到基本保證。綜上兩點(diǎn),隨機(jī)樣本可以看做n個(gè)相互獨(dú)立的、同分布的隨機(jī)變量,每一個(gè)個(gè)體的分布與總體分布相同。今后討論的樣本都是指滿足這些要求的簡(jiǎn)單隨機(jī)樣本。在實(shí)際中抽樣時(shí),也應(yīng)按此要求從總體中進(jìn)行抽樣。這樣獲得的樣本能夠很好地反映實(shí)際總體。圖1.3-3顯示兩個(gè)不同的總體,圖上用虛線畫出的曲線是兩個(gè)未知總體。若是按隨機(jī)性和獨(dú)立性要求進(jìn)行抽樣,則機(jī)會(huì)大的地方(概率密度值大)被抽出的樣品就多;而機(jī)會(huì)少的地方(概率密度值小),被抽出的樣品就少。分布愈分散,樣本也很分散;分布愈集中,樣本也相對(duì)集中。抽樣切忌受到干擾,特別是人為干擾。某些人為的傾向性會(huì)使所得樣本不是簡(jiǎn)單隨機(jī)樣本,從而使最后的統(tǒng)計(jì)推斷失效。若是從總體X中獲得的樣本,那么是獨(dú)立同分布的隨機(jī)變量。樣本的觀測(cè)值用表示,這也是我們常說的數(shù)據(jù)。有時(shí),為了方便起見,不分大寫與小寫,樣本及其觀測(cè)值都用表示,今后將采用這一方法表示。[例1.3-2]樣本的例子及表示方法。(1)某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重為345g的午餐罐頭。由于生產(chǎn)中眾多因素的干擾,每只罐頭凈重都有差別,現(xiàn)從生產(chǎn)線上隨機(jī)抽10個(gè)罐頭,稱其凈重,得:344336345342340338344348344346這就是樣本量為10的一個(gè)樣本,它是來自該生產(chǎn)線上罐頭凈重這個(gè)總體的一個(gè)樣本。(2)某型號(hào)的20輛汽車記錄了各自每加侖汽油行駛的里程數(shù)(單位:km)如下:29.827.628.328.727.930.129.928.028.727.928.529.527.226.928.427.928.030.029.629.1這是來自該型號(hào)汽車每加侖汽油行駛里程這個(gè)總體的一個(gè)樣本,樣本量是20o(3)(分組樣本)對(duì)363個(gè)零售商店調(diào)查其周零售額(單位:千元)的結(jié)果如下表1.3-1所示:表1.3-1周零售額的調(diào)查結(jié)果(單位:千元)零售額(1,5](5,10](10,20](20,30]商店數(shù)這是一個(gè)樣本量為363的樣本,對(duì)應(yīng)的總體是該地區(qū)全部零售商店的周零售額。這個(gè)樣本與前兩個(gè)樣本不同,它僅給出樣本所在區(qū)間,沒有給出具體的零售額。這樣做雖會(huì)失去一些信息,但要準(zhǔn)確獲得每個(gè)零售店的周零售額并非易事,能做到的是把區(qū)間再縮小一些。這種樣本稱為分組樣本。在樣本量n很大時(shí),比如幾百甚至上千個(gè),羅列所有數(shù)據(jù)非常不便,且使人眼花繚亂,不得要領(lǐng),這時(shí)可把樣本作初步整理轉(zhuǎn)化為分組樣本并加以表達(dá),這樣可立即給人一個(gè)大致的印象。以后在作頻率直方圖時(shí),也要用到這個(gè)方法。(4)(有序樣本)設(shè)是從某總體隨機(jī)抽取的一個(gè)樣本。將它們按從小到大的順序排列為,這便是有序樣本。比如,在本例中(I)的樣本量為10的樣本,經(jīng)排序可得如下的有序樣本:從有序樣本可獲得一些有用信息。比如,樣本中的最小值為,最大值為,兩者之差,即樣本極差。這些量對(duì)我們認(rèn)識(shí)生產(chǎn)線都是有幫助的。二、頻數(shù)(頻率)直方圖(一)直方圖的作法為研究一批產(chǎn)品的質(zhì)量情況,需要研究它的某個(gè)質(zhì)量特性(這里為了敘述簡(jiǎn)單起見,僅討論一個(gè)質(zhì)量特性,有必要時(shí)也可以同時(shí)討論多個(gè)質(zhì)量特性)X的變化規(guī)律。為此,從這批產(chǎn)品(總體)中抽取一個(gè)樣本(設(shè)樣本量為n),對(duì)每個(gè)樣本產(chǎn)品進(jìn)行該特性的測(cè)量(觀測(cè))后得到一組樣本觀測(cè)值,記為,這便是我們通常說的數(shù)據(jù)。為了研究數(shù)據(jù)的變化規(guī)律,需要對(duì)數(shù)據(jù)進(jìn)行一定的加工整理。直方圖是為研究數(shù)據(jù)變化規(guī)律而對(duì)數(shù)據(jù)進(jìn)行加工整理的一種基本方法。下面用一個(gè)例子來說明直方圖的概念及其作法。[例1.3-3]食品廠用自動(dòng)裝罐機(jī)生產(chǎn)罐頭食品,從一批罐頭中隨機(jī)抽取100個(gè)進(jìn)行稱量,獲得罐頭的凈重?cái)?shù)據(jù)如下:342352346344343339336342347340347346346345344350348352340356339348338342347347344343349341346344344344343345345350353345352350345343347354350343350344342335349348344347341346341342為了解這組數(shù)據(jù)的分布規(guī)律,對(duì)數(shù)據(jù)作如下整理:(1)找出這組數(shù)據(jù)中的最大值,及最小值,計(jì)算它們的差R=-,R稱為極差,也就是這組數(shù)據(jù)的取值范圍。在本例中=356,,=332,從而R=356-332=24o(2)根據(jù)數(shù)據(jù)個(gè)數(shù),即樣本量n,決定分組數(shù)k及組距h。一批數(shù)據(jù)究竟分多少組,通常根據(jù)n的多少而定,不過這也不是絕對(duì)的,表1.3-2是可以參考的分組數(shù)。表1.3?2直方圖分組組數(shù)選用表樣本量推薦組數(shù)50-100101-250250以上6-107-1210-20選擇k的原則是要能顯示出數(shù)據(jù)中所隱藏的規(guī)律,組數(shù)不能過多,但也不能太少。每一組的區(qū)間長(zhǎng)度,稱為組距。組距可以相等,也可以不相等。組距相等的情況用得比較多,不過也有不少情形在對(duì)應(yīng)于數(shù)據(jù)最大及最小的一個(gè)或兩個(gè)組,使用與其他組不相等的組距。對(duì)于完全相等的組距,通常取組距h為接近R/k的某個(gè)整數(shù)值。在本例中,n=100,取k=9,R/k=24/9=2.7,故取組距h=3。(3)確定組限(即每個(gè)區(qū)間的端點(diǎn))及組中值。為了避免一個(gè)數(shù)據(jù)可能同時(shí)屬于兩個(gè)組,因此通常將各組的區(qū)間確定為左開右閉的:通常要求,。在等距分組時(shí),而每一組的組中值。在本例中取=331.5,則每組的組限及組中值。⑷計(jì)算落在每組的數(shù)據(jù)的頻數(shù)及頻率確定分組后,統(tǒng)計(jì)每組的頻數(shù),即落在組中的數(shù)據(jù)個(gè)數(shù)以及頻率,列出每組的頻數(shù)、頻率表。(5)作頻數(shù)頻率直方圖在橫軸上標(biāo)上每個(gè)組的組限,以每一組的區(qū)間為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 制造企業(yè)生產(chǎn)車間庫存管理制度
- 河北美術(shù)會(huì)考試題及答案
- 中級(jí)消防試題及答案
- 審計(jì)準(zhǔn)則自考試題及答案
- 儀器儀表簡(jiǎn)答題庫及答案
- 電解質(zhì)測(cè)定試題及答案
- 小學(xué)音樂一年級(jí)上冊(cè)《春節(jié)序曲》欣賞教學(xué)方案
- 法醫(yī)職稱考試試題及答案
- 小學(xué)英語五年級(jí)下冊(cè) Module 7 Unit 2“I‘ll be home at seven o’clock.”教學(xué)設(shè)計(jì)-基于主題意義探究的將來時(shí)態(tài)運(yùn)用與時(shí)間規(guī)劃意識(shí)培養(yǎng)
- 數(shù)與萬物·智啟新程-小學(xué)高段數(shù)學(xué)開學(xué)導(dǎo)引課教學(xué)設(shè)計(jì)
- 采購主管年終工作總結(jié)
- 電力公司安全第一課課件
- 物業(yè)現(xiàn)場(chǎng)管理培訓(xùn)課件
- 數(shù)據(jù)訪問控制策略分析報(bào)告
- 2025年市場(chǎng)監(jiān)管局招聘崗位招聘面試模擬題及案例分析解答
- 單杠引體向上教學(xué)課件
- 子宮內(nèi)膜異位癥病因課件
- GB/T 18910.103-2025液晶顯示器件第10-3部分:環(huán)境、耐久性和機(jī)械試驗(yàn)方法玻璃強(qiáng)度和可靠性
- 經(jīng)圓孔翼腭神經(jīng)節(jié)射頻調(diào)節(jié)術(shù)
- 夢(mèng)雖遙追則能達(dá)愿雖艱持則可圓模板
- 配件售后管理制度規(guī)范
評(píng)論
0/150
提交評(píng)論