版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
有限數(shù)據(jù)統(tǒng)計處理2023/2/251第一頁,共四十四頁,2022年,8月28日總體、個體和樣本:總體(Population):調(diào)查研究的事物或現(xiàn)象的全體個體(Itemunit):組成總體的每個元素樣本(Sample):從總體中所抽取的部分個體樣本容量(Samplesize):樣本中所含個體的數(shù)量2023/2/252第二頁,共四十四頁,2022年,8月28日示例:有限數(shù)據(jù)的統(tǒng)計處理總體樣本甲樣本容量平均值500g乙平行測定3次平行測定4次丙平行測定4次有限數(shù)據(jù)的處理:計算估計顯著性檢驗沒有系統(tǒng)誤差,=T有系統(tǒng)誤差,T2023/2/253第三頁,共四十四頁,2022年,8月28日§3.1.1期望值和方差數(shù)據(jù)集中趨勢的表示:對一B物質(zhì)客觀存在量為T的分析對象進(jìn)行分析,得到n個個別測定值x1、x2、x3、???
xn,平均值A(chǔ)verage中位數(shù)Median有限次測量:測量值向平均值集中無限次測量:測量值向總體平均值
集中——數(shù)據(jù)集中趨勢和分散程度的表示2023/2/254第四頁,共四十四頁,2022年,8月28日數(shù)據(jù)分散程度的表示:極差RRange相對極差R偏差Deviation平均偏差Meandeviation相對平均偏差relativemeandeviation標(biāo)準(zhǔn)偏差standarddeviation相對標(biāo)準(zhǔn)偏差(變異系數(shù))Relativestandarddeviation(Coefficientofvariation,CV)2023/2/255第五頁,共四十四頁,2022年,8月28日總體標(biāo)準(zhǔn)偏差與標(biāo)準(zhǔn)偏差的比較:總體標(biāo)準(zhǔn)偏差標(biāo)準(zhǔn)偏差無限次測量,對總體平均值的離散有限次測量對平均值的離散自由度計算一組數(shù)據(jù)分散度的獨立偏差數(shù)自由度的理解:例如,有三個測量值,求得平均值,也知道x1和x2與平均值的差值,那么,x3與平均值的差值就是確定的了,不是一個獨立的變數(shù)。2023/2/256第六頁,共四十四頁,2022年,8月28日平均值的標(biāo)準(zhǔn)偏差:平均值的總體標(biāo)準(zhǔn)偏差對有限次測量S(x)的物理意義:在有限次測量中,每個測量值平均所具有的標(biāo)準(zhǔn)偏差。2023/2/257第七頁,共四十四頁,2022年,8月28日對有限次測量:1、增加測量次數(shù)可以提高精密度。2、增加(過多)測量次數(shù)的代價不一定能從減小誤差得到補(bǔ)償。結(jié)論:測量次數(shù)2023/2/258第八頁,共四十四頁,2022年,8月28日§3.1.2參數(shù)估計矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計2023/2/259第九頁,共四十四頁,2022年,8月28日一、點估計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計例如:用樣本均值作為總體未知均值的估計值就是一個點估計2.點估計沒有給出估計值接近總體未知參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等概念要點:2023/2/2510第十頁,共四十四頁,2022年,8月28日被估計的總體參數(shù)總體參數(shù)符號表示用于估計的樣本統(tǒng)計量一個總體均值方差兩個總體均值之差方差比2023/2/2511第十一頁,共四十四頁,2022年,8月28日估計量的優(yōu)良性準(zhǔn)則無偏性:估計量的數(shù)學(xué)期望等于被估計的總體參數(shù)P(X)XCA無偏有偏2023/2/2512第十二頁,共四十四頁,2022年,8月28日AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)
有效性:一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量,樣本相比均值是一個更有效的估計量。2023/2/2513第十三頁,共四十四頁,2022年,8月28日一致性:隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X)X2023/2/2514第十四頁,共四十四頁,2022年,8月28日二、區(qū)間估計1.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍給出總體參數(shù)落在這一區(qū)間的概率例如:總體均值落在50~70之間,置信度為95%樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限概念要點:2023/2/2515第十五頁,共四十四頁,2022年,8月28日置信區(qū)間估計內(nèi)容:2
已知2未知均值方差置信區(qū)間2023/2/2516第十六頁,共四十四頁,2022年,8月28日問題:在
的某個范圍
內(nèi)包含的概率有多大?對有限次測量1、概率2、區(qū)間界限,多大區(qū)間置信水平Confidencelevel置信度DegreeofconfidenceProbabilitylevel置信區(qū)間Confidenceinterval置信界限Confidencelimit必然的聯(lián)系這個問題涉及兩個方面:2023/2/2517第十七頁,共四十四頁,2022年,8月28日總體平均值的置信區(qū)間概率區(qū)間大小例:
包含在區(qū)間幾率相對大幾率相對小幾率為100%無意義平均值的置信區(qū)間的問題2023/2/2518第十八頁,共四十四頁,2022年,8月28日總體未知參數(shù)落在區(qū)間內(nèi)的概率表示為(1-為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率常用的置性水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平:
2023/2/2519第十九頁,共四十四頁,2022年,8月28日區(qū)間與置信水平:均值的抽樣分布(1-)%區(qū)間包含了
%的區(qū)間未包含1-aa/2a/22023/2/2520第二十頁,共四十四頁,2022年,8月28日影響區(qū)間寬度的因素:1. 數(shù)據(jù)的離散程度,用來測度樣本容量,置信水平(1-),影響Z的大小2023/2/2521第二十一頁,共四十四頁,2022年,8月28日落在總體均值某一區(qū)間內(nèi)的樣本x_XX=Zx95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x2023/2/2522第二十二頁,共四十四頁,2022年,8月28日總體均值的置信區(qū)間(2已知)1.假定條件總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n
30)2.使用正態(tài)分布統(tǒng)計量Z總體均值在1-置信水平下的置信區(qū)間為2023/2/2523第二十三頁,共四十四頁,2022年,8月28日正態(tài)總體實例:總體均值的區(qū)間估計解:已知X~N(,0.152),x=21.4,n=9,1-=0.95,Z/2=1.96
總體均值的置信區(qū)間為我們可以95%的概率保證該種零件的平均長度在21.3~21.5mm之間【例】某種零件長度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取9件,測得其平均長度為21.4mm。已知總體標(biāo)準(zhǔn)差
=0.15mm,試建立該種零件平均長度的置信區(qū)間,給定置信水平為0.95。2023/2/2524第二十四頁,共四十四頁,2022年,8月28日非正態(tài)總體實例:總體均值的區(qū)間估計解:已知x=26.0,=6,n=100,1-=0.95,Z/2=1.96我們可以95%的概率保證平均每天參加鍛煉的時間在24.8~27.2分鐘之間【例】某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26.0分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36小時)。2023/2/2525第二十五頁,共四十四頁,2022年,8月28日1.假定條件總體方差(2)未知總體必須服從正態(tài)分布使用t分布統(tǒng)計量3.總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(2未知)2023/2/2526第二十六頁,共四十四頁,2022年,8月28日t分布曲線:無限次測量,得到有限次測量,得到st
分布曲線u分布曲線2023/2/2527第二十七頁,共四十四頁,2022年,8月28日1-1/21/2-t,ft,f
t分布值表自由度f=(n-1)顯著水平0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.850.671.651.962.58P=1-,置信度,顯著水平6次測量,隨機(jī)誤差落在±2.57范圍內(nèi)的概率為95%。無限次測量,隨機(jī)誤差落在±1.96
范圍內(nèi)的概率為95%。2023/2/2528第二十八頁,共四十四頁,2022年,8月28日t分布值表自由度f=(n-1)顯著水平0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.850.671.651.962.58還原為u分布單位為單位為2023/2/2529第二十九頁,共四十四頁,2022年,8月28日實例(2未知):總體均值的區(qū)間估計解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.064。我們可以95%的概率保證總體均值在46.7~53.3之間【例】從一個正態(tài)總體中抽取一個隨機(jī)樣本,n=25,其均值`x=50.0,標(biāo)準(zhǔn)差s=8。建立總體均值m
的95%的置信區(qū)間。2023/2/2530第三十頁,共四十四頁,2022年,8月28日§3.2一般的統(tǒng)計檢驗問題:是由隨機(jī)誤差引起,或存在系統(tǒng)誤差?顯著性檢驗顯著性差異非顯著性差異系統(tǒng)誤差校正隨機(jī)誤差正常顯著性檢驗(1)對含量真值為T的某物質(zhì)進(jìn)行分析,得到平均值(2)用兩種不同的方法、或兩臺不同的儀器、或兩個不同的實驗室對同一樣品進(jìn)行分析,得到平均值但,但§3.2.1平均值檢驗2023/2/2531第三十一頁,共四十四頁,2022年,8月28日1-1/21/2-t,ft,f1.平均值與標(biāo)準(zhǔn)值的比較t檢驗法:假設(shè)不存在系統(tǒng)誤差,那么是由隨機(jī)誤差引起的,測量誤差應(yīng)滿足t分布,根據(jù)計算出的t值應(yīng)落在指定的概率區(qū)間里。否則,假設(shè)不滿足,表明存在著顯著性差異。t檢驗法的步驟:1、根據(jù)算出t值;2、給出顯著性水平或置信度3、將計算出的t值與表上查得的t值進(jìn)行比較,若習(xí)慣上說表明有系統(tǒng)誤差存在。表示落在為中心的某一指定概率之外。在一次測定中,這樣的幾率是極小的,故認(rèn)為是不可能的,拒絕接受。2023/2/2532第三十二頁,共四十四頁,2022年,8月28日【例】某化驗室測定CaO的質(zhì)量分?jǐn)?shù)為30.43%的某樣品中CaO的含量,得如下結(jié)果:問此測定有無系統(tǒng)誤差?(給定=0.05)解查表比較:說明和T有顯著差異,此測定有系統(tǒng)誤差。假設(shè):
=T2023/2/2533第三十三頁,共四十四頁,2022年,8月28日u檢驗法:
u檢驗法與t檢驗的不同在于用u分布,而不是用t分布?!纠?/p>
某煉鐵廠生產(chǎn)的鐵水,從長期經(jīng)驗知道它的碳含量服從正態(tài)分布,T為4.55%,為0.08%?,F(xiàn)在又生產(chǎn)了5爐鐵水,其碳含量分別為4.28%,4.40%,4.42%,4.35%,4.37%。試問均值有無變化?(給定=0.05)解假設(shè):=T查表比較:結(jié)論:均值比原來的降低了。(表明生產(chǎn)過程有差異)問題:如果分析方法存在系統(tǒng)誤差,這個結(jié)論可靠嗎?2023/2/2534第三十四頁,共四十四頁,2022年,8月28日2、兩組平均值的比較兩個實驗室對同一標(biāo)樣進(jìn)行分析,得到:和假設(shè)不存在系統(tǒng)誤差,那么:是由于隨機(jī)誤差引起的,應(yīng)滿足自由度
f=(n1+n2–2)的t
分布,2023/2/2535第三十五頁,共四十四頁,2022年,8月28日兩組平均值的比較的方法:1、F檢驗法檢驗兩組實驗數(shù)據(jù)的精密度S1和S2之間有無顯著差異:查表精密度無顯著差異。2、t
檢驗確定兩組平均值之間有無顯著性差異3、查表4、比較非顯著差異,無系統(tǒng)誤差具體計算見教材的例題。2023/2/2536第三十六頁,共四十四頁,2022年,8月28日置信度95%時部分F值(單邊)
置信度90%時部分F值(雙邊)4.284.394.534.765.1464.955.055.195.415.7956.096.166.396.596.9448.949.019.129.289.55319.3319.3019.2519.1619.00265432
f大
f小2023/2/2537第三十七頁,共四十四頁,2022年,8月28日§3.2.2離群值檢驗掩蓋(masking):真正的異常點未被識別
淹沒(swamping):正常點誤判為異常的離群點
2023/2/2538第三十八頁,共四十四頁,2022年,8月28日離群值檢驗的兩類方法:⒈技術(shù)判別法即在實驗過程中,人們根據(jù)常識或經(jīng)驗,判別由于震動、誤讀等原因造成的壞值;或根據(jù)物理的或化學(xué)的性質(zhì),進(jìn)行技術(shù)分析,以判別偏差較大的數(shù)據(jù)是否確系異常值。此種方法的特點,可隨時發(fā)現(xiàn),隨時剔除。⒉統(tǒng)計判別法統(tǒng)計判別法的基本思想在于,給定一置信概率,并由此確定一個置信限,凡超過此限的誤差,就認(rèn)為它不屬于隨機(jī)誤差范圍,系屬異常數(shù)據(jù),應(yīng)予剔除。2023/2/2539第三十九頁,共四十四頁,2022年,8月28日統(tǒng)計學(xué)方法證明,當(dāng)測定次數(shù)非常多(例如大于20時,總體標(biāo)準(zhǔn)偏差與總體平均偏差有下列關(guān)系=0.79790.80。43,偏差超過4的測量值可以舍棄。其步驟為:(1)將可疑值除外,求其余數(shù)據(jù)的平均值和平均偏差;(2)求可疑值x與平均值之間的差的絕對值(3)判斷舍棄。2023/2/2540第四十頁,共四十四頁,2022年,8月28日(2)
Q檢驗法(1)將測量的數(shù)據(jù)按從小至大順序排列:(2)計算測定值的極差R
。(3)計算可疑值與相鄰值之差(應(yīng)取絕對值)d。(4)計算Q值:(5)比較:舍棄。Q值表測定次數(shù)n345678910Q0.900.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.492023/2/2541第四十一頁,共四十四頁
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年冷飲師(冰淇淋制作工藝)試題及答案
- 2025年高職電子信息(高頻實操技術(shù))試題及答案
- 2026年生態(tài)廊道建設(shè)項目評估報告
- 2025年高職第二學(xué)年(民航運輸服務(wù))航班調(diào)度階段測試題及答案
- 2026年智能馬桶泡沫盾系統(tǒng)項目評估報告
- 2026年智能環(huán)境監(jiān)測設(shè)備 (空氣質(zhì)量)項目公司成立分析報告
- 多模態(tài)影像融合在神經(jīng)內(nèi)鏡手術(shù)中的應(yīng)用
- 2025年高職寵物養(yǎng)護(hù)與馴導(dǎo)(狗狗坐下訓(xùn)練)試題及答案
- 2025年中職(航空貨運專業(yè))貨運代理基礎(chǔ)試題及答案
- 2025年中職(康復(fù)技術(shù))言語康復(fù)訓(xùn)練試題及答案
- 復(fù)旦大學(xué)招生面試常見問題及回答要點
- 危險化學(xué)品兼容性矩陣表
- 道路交通法律課件
- 老年人營養(yǎng)不良篩查與營養(yǎng)支持方案
- 2025年中國潛孔鉆機(jī)行業(yè)細(xì)分市場研究及重點企業(yè)深度調(diào)查分析報告
- 搶劫案件偵查課件
- 食品經(jīng)營場所及設(shè)施設(shè)備清洗消毒和維修保養(yǎng)制度
- DB14T2163-2020 《信息化項目軟件運維費用測算指南》
- 二氧化碳爆破施工技術(shù)方案
- 名詞單數(shù)變復(fù)數(shù)教案
- 國考題庫文件下載及答案詳解(歷年真題)
評論
0/150
提交評論