版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、,1.總體和樣本,一、總體和樣本,例 某鋼鐵廠某天生產(chǎn)10000根鋼筋,規(guī)定強(qiáng)度小于52kg/mm2的算作次品,如何來求這批鋼筋的次品率?是否需要測量每根鋼筋的強(qiáng)度呢?,一般來說是不需要的. 只要從這10000根鋼筋中抽取一部分,比如100根,測量這100根鋼筋的強(qiáng)度,就可以推斷出整批鋼筋的次品率了,這就是抽樣檢驗(yàn).,事實(shí)上,全面檢驗(yàn)是有困難的 有些檢驗(yàn)是有破壞性的,如使用壽命; 產(chǎn)品數(shù)量大,或檢驗(yàn)成本太高,人力、物力、時(shí)間不允許等 例如:有一批棉花,需要檢查纖維的長度,我們 當(dāng)然不可能去測量每一根棉花纖維的長度。 數(shù)理統(tǒng)計(jì)提供了一整套方法,保證可以通 抽樣檢驗(yàn)做出可靠的科學(xué)結(jié)論。,直觀地說,
2、 被觀察對象的全體稱作總體;總體的每一基本單元稱作個(gè)體或樣品;從總體中抽出的一部分個(gè)體組成一個(gè)樣本,樣本中所含個(gè)體的個(gè)數(shù)稱作樣本的容量或大小。 如前例所說,10000根鋼筋的強(qiáng)度是總體,每一根鋼筋的強(qiáng)度是一個(gè)個(gè)體,抽查的100根鋼筋的強(qiáng)度是一個(gè)樣本,它的容量是100。,更確切的說,對這批鋼筋,我們關(guān)心的是它的強(qiáng)度的分布,如強(qiáng)度低于52kg/mm2的比例是多少. 設(shè) X 表示“任一根鋼筋的強(qiáng)度”,X 是一個(gè)隨機(jī)變量. 它的概率分布就反映了這批鋼筋的強(qiáng)度的分布,即把總體看做一個(gè)隨機(jī)變量。,從總體中抽取一個(gè)個(gè)體就是做一次隨機(jī)試驗(yàn),而“任取 n 根鋼筋,測其強(qiáng)度”就是做 n 次隨機(jī)試驗(yàn),得到容量為 n
3、 的樣本. 因?yàn)槌槿∈请S機(jī)的,故可以樣本看做 n個(gè)隨機(jī)變量 。 當(dāng)試驗(yàn)是同重復(fù)獨(dú)立試驗(yàn)時(shí), 與總體 有相的分布,這樣的樣本稱作簡單隨機(jī)樣本。,一般,對有限總體,放回抽樣所得到的樣本為簡單隨機(jī)樣本,但使用不方便,常用不放回抽樣代替.而代替的條件是,(1) 與總體X 有相同的分布,(2) 相互獨(dú)立,簡單隨機(jī)樣本,N / n 10.,總體中個(gè)體總數(shù),樣本容量,由定義, 若總體 是離散型隨機(jī)變量,其分布律為 則樣本 的聯(lián)合分布為 若 是連續(xù)型隨機(jī)變量,其分布密度為 則樣本 的聯(lián)合分布密度是,二、頻率分布表與直方圖,一、頻率分布表 設(shè)總體 是離散型隨機(jī)變量, 是一組樣本值,取到的值為 ,并且取到 的個(gè)數(shù)
4、分別為 ,則樣本容量 ,我們稱 為 出現(xiàn)的頻數(shù),而 出現(xiàn)的頻率為 顯然,,例1 對100塊焊接完的電路板進(jìn)行檢查,每塊板上焊點(diǎn)不光滑的個(gè)數(shù)的頻數(shù)分布表和頻率分布表如下圖所示,從上表可大體知道這批電路板的不光滑情況,可近似地作為“每塊板上不光滑點(diǎn)個(gè)數(shù)” X 的分布律.,二、直方圖,當(dāng)總體是連續(xù)型隨機(jī)變量時(shí),可采用直方圖來處理數(shù)據(jù)(樣本值). 設(shè) 為給定的一組樣本值,處理步驟如下: 1)簡化數(shù)據(jù),令 由于數(shù)據(jù)總在某個(gè)某個(gè)數(shù)值 上下波動(dòng),可以選取適當(dāng)?shù)某?shù) ,把樣本值化為位數(shù)較少的整數(shù),為方面起見,化簡后的數(shù)值 仍記為 .,2) 求 中的最大最小值. 記 3) 分組. a) 確定組數(shù)和組距. 選定組
5、數(shù) ,取組距 一般情況下, 應(yīng)取數(shù)據(jù)的最小單位的整數(shù)倍. b) 確定各組的上下界. 取第一組的下界 應(yīng)略小于 ,使得 落入第一組內(nèi),即 然后令,為了使每個(gè)數(shù)據(jù)都落入組內(nèi),應(yīng)使分點(diǎn) 比樣本值多一位小數(shù). 計(jì)算頻率,記 為落入第 個(gè)區(qū)間的頻數(shù),則頻 率為 畫直方圖. 以 為底, 為高畫小長方形. 顯然,所有小長方形面積之和等于1:,樣本直方圖與密度函數(shù) 的關(guān)系?,根據(jù)大數(shù)定律, 近似等于隨機(jī)變量 落入?yún)^(qū)間 內(nèi) 的概率,即 設(shè) 的密度函數(shù)為 ,則 如果 在區(qū)間 內(nèi)連續(xù),下面舉例說明畫直方圖的全過程及注意事項(xiàng),例 2 某食品廠為加強(qiáng)質(zhì)量管理,在某天生產(chǎn)的一大批罐頭中抽查了100個(gè),測得內(nèi)裝食品的凈重?cái)?shù)
6、據(jù)如下(單位:g):,解 1) 簡化數(shù)據(jù). 取c=340, d=1. 令 . 簡化后的數(shù)據(jù)如下圖,2) 求最大值和最小值. 由上表知,最小值為-8,最大值為18. 3) 分組 a)確定組數(shù)和組距. 考慮到樣本容量 n=100, 取組數(shù) m=10. 由于(18+8)/10=2.6, 取組距 . b) 確定各組的上、下界. 取 , 依次得 -5.5, -2.5, 0.5, 3.5, 6.5, 9.5, 12.5, 15.5, 18.5. 4) 計(jì)算頻率 5) 畫直方圖. 注意 .,三、經(jīng)驗(yàn)分布函數(shù),對給定的一組樣本值,將它們按從小到大的順序排列: 對任意實(shí)數(shù) ,定義 稱 為經(jīng)驗(yàn)分布函數(shù).,例如,給
7、定樣本值5, 3, 7, 5, 4. 將它們從小到大重新排列: 3, 4, 5, 5, 7. 經(jīng)驗(yàn)分布函數(shù)為,記 , 發(fā)生的概率 . 根據(jù)貝努利大數(shù)定律, 對任意的 , 有 事實(shí)上,可以證明下述更強(qiáng)的結(jié)論:,根據(jù)經(jīng)驗(yàn)分布函數(shù)的定義,,中不大于x的個(gè)數(shù)),定理(格列汶科) 設(shè)總體 的分布函數(shù)為 , 當(dāng) ,經(jīng)驗(yàn)分布函數(shù) 以概率1關(guān)于 一致 地收斂于 , 即 注:上述定理表明,當(dāng)樣本容量 充分大時(shí), 樣本取值的分布相當(dāng)準(zhǔn)確的反映總體的分布.,統(tǒng)計(jì)是從手中已有的資料-樣本值,去推斷總體的情況-總體分布F(x)的性質(zhì).,總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷
8、總體.,樣本是聯(lián)系二者的橋梁,由樣本值去推斷總體情況,需要對樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來.,四、統(tǒng)計(jì)量和抽樣分布,1. 統(tǒng)計(jì)量,這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量. 它是完全由樣本決定的量.,幾個(gè)常見統(tǒng)計(jì)量,樣本均值,樣本方差,它反映了總體均值 的信息,它反映了總體方差 的信息,樣本k階原點(diǎn)矩,樣本k階中心矩,k=1,2,它反映了總體k 階矩 的信息,它反映了總體k 階 中心矩的信息,2. 順序統(tǒng)計(jì)量,定義 : 設(shè),為取自總體X的樣本,,將其按大小順序排序,則稱 X(k) 為第 k 個(gè)次序統(tǒng)計(jì)量( No.k Order Sta
9、tistic),特別地,稱,為最小順序統(tǒng)計(jì)量(Minimum order Statistic),稱,為最大順序統(tǒng)計(jì)量(Maximum order Statistic) 。,稱,為偶數(shù),為奇數(shù),為樣本中位數(shù).,稱 為樣本極差,反映了樣本的離散程度,也反映了總體的離散程度.,3. 抽樣分布,統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個(gè)分布叫做統(tǒng)計(jì)量的“抽樣分布” .,抽樣分布就是通常的隨機(jī)變量函數(shù)的分布. 只是強(qiáng)調(diào)這一分布是由一個(gè)統(tǒng)計(jì)量所產(chǎn)生的. 研究統(tǒng)計(jì)量的性質(zhì)和評(píng)價(jià)一個(gè)統(tǒng)計(jì)推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).,抽樣分布,精確抽樣分布,漸近分
10、布,(小樣本問題中使用),(大樣本問題中使用),五. 統(tǒng)計(jì)三大分布,記為,分布,1、,定義: 設(shè) 相互獨(dú)立, 都服從正態(tài) 分布N(0,1), 則稱隨機(jī)變量: 所服從的分布為自由度為 n 的 分布.,分布是由正態(tài)分布派生出來的一種分布.,分布的密度函數(shù)為,來定義.,其中伽瑪函數(shù) 通過積分,請看演示,c2 分布,由 分布的定義,不難得到:,1.設(shè) 相互獨(dú)立, 都服從正態(tài)分布,則,2. 設(shè) 且X1,X2相互 獨(dú)立,則,這個(gè)性質(zhì)叫 分布的可加性.,應(yīng)用中心極限定理可得,若,的分布近似正態(tài)分布N(0,1).,則可以求得, E(X)=n, D(X)=2n,若,定理(柯赫倫定理)設(shè) 相互獨(dú)立, 都服從正態(tài)分
11、布N(0,1),T的密度函數(shù)為:,記為Tt(n).,所服從的分布為自由度為 n的 t 分布.,定義: 設(shè)XN(0,1) , Y , 且X與Y相互獨(dú)立,則稱變量,2、t 分布,當(dāng)n充分大時(shí),其圖形類似于標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的圖形.,由定義可見,,3、F分布,定義: 設(shè) X與Y相互獨(dú)立,則稱統(tǒng)計(jì)量,服從自由度為n1及 n2 的F分布,n1稱為第一自由度,n2稱為第二自由度,記作 FF(n1,n2) .,F(n2,n1),即它的數(shù)學(xué)期望并不依賴于第一自由度n1.,若XF(n1,n2), X的概率密度為,請看演示,F分布,t分布與F分布的關(guān)系,由t分布的定義,設(shè),其中,且X,Y獨(dú)立,故,當(dāng)總體為正態(tài)分
12、布時(shí),教材上給出了幾個(gè)重要的抽樣分布定理. 這里我們不加證明地?cái)⑹? 除定理2外,其它幾個(gè)定理的證明都可以在教材上找到.,六、幾個(gè)重要的抽樣分布定理,定理 1 (樣本均值的分布),定理 2 (樣本方差的分布),定理 3,與,相互獨(dú)立,定理 4 (兩總體樣本均值差的分布),與,相互獨(dú)立,定理 5 (兩總體樣本方差比的分布),若,則,例1 從正態(tài)總體,中,抽取了,n = 20的樣本,(1) 求,(2) 求,例2 設(shè)r.v. X 與Y 相互獨(dú)立,X N(0,16), Y N(0,9) , X1, X2 , X9 與Y1, Y2 , Y16 分別是取自 X 與 Y 的簡單隨機(jī)樣本,求 的分布.,例3
13、設(shè)總體,為總體 X,3. 單個(gè)次序統(tǒng)計(jì)量的分布,定理1:設(shè)總體X的密度函數(shù)為 f (x) ,分布函數(shù)為 F(x) , 為樣本,則第 k 個(gè)次序 統(tǒng)計(jì)量的密度函數(shù)為,推論1 :最大次序統(tǒng)計(jì)量 的概率密度函數(shù)為,推論2 :最小次序統(tǒng)計(jì)量 的概率密度函數(shù)為,圖 5-8 x (k) 的取值示意圖,樣本的每一分量小于等于 x 的概率為 F (x) , 落入?yún)^(qū)間 ( x , x + x 概率為F(x+ x)-F(x),落入?yún)^(qū)間 (x+ x, b的概率為 1-F(x+x) ,而將 n 個(gè)分量分成這樣的三組,總的分法有,種,于是,若以 Fk (x) 記 的分布函數(shù),則由多項(xiàng)分布可得,兩邊同除以 x , 并令
14、x0 , 即有,定理2:設(shè)總體X的密度函數(shù)為 f(x) ,分布函數(shù)為 F(x) , 為樣本,則第 k 個(gè)次序統(tǒng)計(jì) 量 和第 r 個(gè)次序統(tǒng)計(jì)量 的聯(lián)合概率密度函數(shù)為,上述5個(gè)抽樣分布定理很重要, 要牢固掌握.,七、下側(cè)分位數(shù),(一)總體分位數(shù),定義1.5.4: 設(shè)總體 X 的分布函數(shù)為 F (x) ,滿足,的 x稱為 X 的 -下側(cè)分位數(shù),如下圖所示。,例如, =0.975,而,所以, Z0.975 =1.96.,對標(biāo)準(zhǔn)正態(tài)分布變量Z,對給定的 (01),PXx =,七、上側(cè)分位數(shù),PUu =,例如, =0.05,而,PU1.645 =0.05,所以, u0.05 =1.645.,位數(shù)都在書后附表中可以查到。,這里要注意到如下幾個(gè)有用的事實(shí)。,2)對于 T t (n) ,同樣地,由密度函數(shù)的對稱性 可知,即得,3)對于 F分布,由于,所以,即,的點(diǎn)u/2稱為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù)。,u/2可由PUu/2= /2,即 (u /2) =1- /2,反查標(biāo)準(zhǔn)正態(tài)分布表得到,,PU1.96=0.05 /2,例如,求u0.05/2,,得u0.05/2=1.96,雙側(cè)分位數(shù),標(biāo)準(zhǔn)正態(tài)分布的分位數(shù),在實(shí)際問題中, 常取0.1、0.05、0.01.,常用到下面幾個(gè)臨界值:,u0.05 =1.645, u0.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)藥商品物流員崗前技能評(píng)估考核試卷含答案
- 紫膠蒸發(fā)工安全教育模擬考核試卷含答案
- 焊材配拌粉工常識(shí)競賽考核試卷含答案
- 2024年涿鹿縣招教考試備考題庫附答案
- 2024年莎車縣事業(yè)單位聯(lián)考招聘考試真題匯編附答案
- 2024年金陵科技學(xué)院馬克思主義基本原理概論期末考試題附答案
- 2024年鄭州航空工業(yè)管理學(xué)院輔導(dǎo)員考試參考題庫附答案
- 2024年許昌市遴選公務(wù)員考試真題匯編附答案
- 旅游行業(yè)導(dǎo)游服務(wù)標(biāo)準(zhǔn)操作手冊(標(biāo)準(zhǔn)版)
- 2025年井研縣事業(yè)單位聯(lián)考招聘考試真題匯編附答案
- 2025成人腸造口護(hù)理指南課件
- 電焊工安全宣講課件
- 水泵基礎(chǔ)知識(shí)培訓(xùn)課件教學(xué)
- 內(nèi)鏡院感培訓(xùn)課件
- 2026中征(北京)征信有限責(zé)任公司招聘13人考試題庫附答案
- 期末重點(diǎn)易錯(cuò)知識(shí)點(diǎn)復(fù)習(xí)(課件)-2025-2026學(xué)年一年級(jí)上冊數(shù)學(xué)北師大版
- 2026年楊凌職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫含答案詳解
- 2025云南昆明元朔建設(shè)發(fā)展有限公司第二批收費(fèi)員招聘9人筆試考試參考題庫及答案解析
- 國開本科《國際法》期末真題及答案2025年
- 2025年榆林神木市信息產(chǎn)業(yè)發(fā)展集團(tuán)招聘備考題庫(35人)及完整答案詳解1套
- 2025新疆能源(集團(tuán))有限責(zé)任公司共享中心招聘備考題庫(2人)帶答案詳解(完整版)
評(píng)論
0/150
提交評(píng)論