版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第六章抽樣調(diào)查與總體均值估計,主要內(nèi)容 1、復習點估計 2、抽樣誤差 3、區(qū)間估計正常值范圍 4、統(tǒng)計軟件應用,參數(shù)估計在統(tǒng)計方法中的地位,參數(shù)估計的方法,總體均值估計,總體比例估計,可以估計的總體參數(shù),點估計,樣本值 (點估計),平均,比例,p,X,1、點估計(point estimate) :用樣本均值數(shù)直接作為總體均數(shù)的估計值。 點估計是用相應樣本平均直接作為其總體平均的估計值。 樣本比例估計總體比例 如用 估計、S估計等。其方法雖簡單,但未考慮抽樣誤差的大小。,抽樣誤差,隨機誤差是由偶然的原因造成的誤差。 抽樣造成的誤差不可避免,但可以控制和估計。如樣本量越大則誤差越小。,用EXCEL
2、實驗,從班級成績中抽出樣本計算平均值,與班級平均值的差異就是誤差。,演示無偏估計的意義,用EXCEL對班級成績多次抽樣,計算每次抽樣的平均值。 計算多次抽樣的樣本平均值的再平均。 發(fā)現(xiàn)離總的全班有平均值差異很小。,抽樣誤差:由于抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異。 抽樣誤差:樣本均值估計總體均值時產(chǎn)生的誤差。,稱為抽樣誤差,區(qū)間估計是按預先給定的概率(1)所確定的包含未知總體參數(shù)的一個范圍。該范圍稱為參數(shù)的可信區(qū)間或置信區(qū)間(confidence interval, CI); 預先給定的概率(1)稱為可信度或置信度(confidence level),常取95%或99%。 可信區(qū)間通常由
3、兩個數(shù)值即可信限/置信限(confidence limit, CL)構成。其中較小的值稱可信下限(lower limit, L),較大的值稱可信上限(upper limit, U),一般表示為LU。,用區(qū)間表示正常值,估計區(qū)間,男女年齡組體重(千克)身高(厘米)體重(千克)身高(厘米)3.5歲13.9-17.695.0-103.113.5-17.294.0-101.84.0歲14.8-18.798.7-107.214.3-18.397.6-105.74.5歲15.7-19.9102.1-111.015.0-19.4100.9-109.35.0歲16.6-21.1105.3-114.515.7-
4、20.4104.0-112.85.5歲17.4-22.3108.4-117.816.5-21.6106.9-116.26.0歲18.4-23.6111.2-121.017.3-22.9109.7-119.67.0歲20.2-26.5116.6-126.819.1-26.0115.1-126.28.0歲22.2-30.0121.6-132.221.4-30.2120.4-132.49.0歲24.3-34.0126.5-137.824.1-35.3125.7-138.710.0歲26.8-38.7131.4-143.627.2-40.9131.5-145.116歲:體重:年齡x2816公斤身高:年
5、齡x677101厘米,正常范圍(normal range value),在臨床醫(yī)學上成年人血壓的正常值范圍是:收縮壓90-139mmHg, 舒張壓60-89mmHg; 脈壓差正常范圍是30-40 mmHg 。,中國人平均正常血壓參考值(mmHg),人的血壓正常范圍(normal range value),網(wǎng)絡搜索,化驗的正常值,肝功能化驗結(jié)果正常值如下: 用區(qū)間表示 ALT(谷丙轉(zhuǎn)氨酶)正常值:男5-40 U/L, 女5-35 U/L。 AST(谷草轉(zhuǎn)氨酶)正常值:8-40 U/L。 AST/ALT(谷草/谷丙)正常值:1.0-2.0。 GGT(谷氨酰轉(zhuǎn)移酶)正常值:男 11-50 U/L,
6、女 7-32 U/L。 ALP(堿性磷酸酶)正常值:成人40-150 U/L。 TBILI(總膽紅素)正常值:3.0-20.0 umol/L。 DBILI(直接膽紅素)正常值:1.7-8.0 umol/L。 PT(凝血酶原時間)正常值:11-14秒。,IBILI(間接膽紅素)正常值:3.4-13.5 umol/L。 PTA(凝血酶原活動度)正常值:80-100。 TP(總蛋白)正常值:成人坐立位:64-83 g/L; 成人臥位:60-78 g/L。 AFP(甲胎蛋白)正常值: 50g/L。 ALB(白蛋白)正常值:35-52g/L。 IgG(免疫球蛋白G)正常值:12.871.35g/L。 G
7、LB(球蛋白)正常值:22-38 g/L。 IgA(免疫球蛋白A)正常值:2.350.34g/L。 ALB/GLB(白球比)正常值:1.3-2.5。 IgM(免疫)正常值:1.080.24g/L。 GLU(葡萄糖)正常值:3.9-6.1 mmol/L。 C3(補體3)正常值:1.140.27g/L。 BUN(尿素氮)正常值:2.9-8.2 mmol/L。,C4(補體4)正常值:553109mg/L。 CHE(膽堿性酯酶)正常值:5000-12000 U/L。 CK(肌酸激酶)正常值:24.0195.0。 CHOL(總膽固醇)正常值:3.356.45。 TRIG(甘油三酯)正常值:0.481.7
8、1。 CRE(肌酐)正常值:男 62-115 umol/L, 女 53-97umol/L。 URIC(尿酸):男 208-428 umol/L, 女155-357umol/L。 LDH-L(乳酸脫氫酶)正常值:109245。 T淋巴細胞亞群 CD3正常值:0.56-0.76。 T淋巴細胞亞群 CD4正常值:0.38-0.52 。 T淋巴細胞亞群CD5正常值:0.22-0.32。,點估計與區(qū)間估計,點估計是一個數(shù)值, 置信區(qū)間提供了更多的變化信息,點估計,置信下限,置信上限,置信區(qū)間寬度,區(qū)間估計 (interval estimate),在點估計的基礎上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由
9、樣本統(tǒng)計量加減估計誤差而得到 根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量 比如,某班級平均分數(shù)在7585之間,置信水平是95%,一般公式,所有估計區(qū)間的一般公式,點估計 (臨界值)(標準誤差),點估計 (2)(標準誤差),意義: 雖然不能知道某市全體成人脈搏均數(shù)的確切數(shù)值,但有95%的把握說該市全體成人脈搏均數(shù)在73.9次/分 - 75.1次/分之間,有99%的把握說該市全體成人脈搏均數(shù)在 73.7次/分 - 75.3次/分之間。 換句話說,做出該市成人脈搏均數(shù)為73.9次/分 - 75.1次/分的結(jié)論,說對的概率是95%,說錯的概率是5%; 做出該市成人脈搏
10、均數(shù)為73.7次/分 - 75.3次/分的結(jié)論,說對的概率是99%,說錯的概率是1%。,區(qū)間估計的圖示,將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 表示為 (1 - 為是總體參數(shù)未在區(qū)間內(nèi)的比例 常用的置信水平值有 99%, 95%, 90% 相應的 為0.01,0.05,0.10,置信水平(confidence level),由樣本統(tǒng)計量所構造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間 統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間 用一個具體的樣本所構造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真
11、值 我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個 總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的,置信區(qū)間 (confidence interval),置信區(qū)間與置信水平,Intervals and Level of Confidence,Confidence Intervals,Intervals extend from to,(1-)x100%of intervals constructed contain ; ()x100% do not.,Sampling Distribution of the Mean,x,x1,x2,
12、總體平均的抽樣估計,用樣本均值,估計總體均值,抽樣估計誤差為,抽樣誤差,是無法直接求出得,,因為,是未知的,,換一個思考方法,是已知的,將求,的問題,轉(zhuǎn)換為求,稱為極限誤差(邊際誤差),抽樣誤差的最大限,置信區(qū)間的半徑。,假若已經(jīng)求出極限誤差,則,展開不等式得,得到了總體均值,估計區(qū)間,總體均值 =,樣本均值,是的無偏估計,設總體的標準差為,由中心極限定理得,服從正態(tài)分布,由,得到極限誤差,由中心極限定理,用樣本標準差s代替 查正態(tài)分布表得到,可以計算極限誤差,用代替時,嚴格地講,統(tǒng)計量,服從自由度為n-1的分布,大樣本時用正態(tài)分布近似計算,統(tǒng)計用的樣本一般都 是大樣本。大于。服從,EXCEL
13、計算置信區(qū)間,影響區(qū)間寬度的因素,1.總體數(shù)據(jù)的離散程度,用 來測度 樣本容量n, 置信水平 (1 - ),影響 z 的大小,總體比例(成功率)的估計,有些社會隨機現(xiàn)象中只有兩個結(jié)果:成功與失敗,成功 失敗 射擊 命中 不中 考試 及格 不及格 產(chǎn)品 合格 不合格 選舉 同意 不同意,總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比 不同性別的人與全部人數(shù)之比 合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比 總體比例可表示為 樣本比例可表示為,比例(proportion),當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似 推斷總體比例的理論基礎,樣本比例的抽樣分布,樣本比例的數(shù)學期望 樣本比例的方差,樣本比例的抽樣分布(數(shù)學期望與方差),是非標志的標準差,是非標志的平均數(shù)為P。,由于標準差有良好的數(shù)學性質(zhì),相比較而言,它的應用最為廣泛。,返回,由中心極限定理知:,例:某廠對一批產(chǎn)品的質(zhì)量進行檢驗,抽樣取200只,樣品優(yōu)質(zhì)率85%,計算置信度95%時總體優(yōu)質(zhì)率估計區(qū)間,有人問皮爾遜他所記得最早的事,他說我不記得那時是幾歲,但
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨境包裹運輸協(xié)議2025
- 朝陽單招考試題目及答案
- 礦山救護工試題及答案
- 2025-2026九年級道德與法治上學期期末測試
- 衛(wèi)生院應急值守管理制度
- 中學生教室衛(wèi)生管理制度
- 落實美發(fā)店衛(wèi)生管理制度
- 行車室衛(wèi)生管理制度
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院廉政管理制度
- 寢室值日衛(wèi)生制度
- 四川省遂寧市2026屆高三上學期一診考試英語試卷(含答案無聽力音頻有聽力原文)
- 福建省寧德市2025-2026學年高三上學期期末考試語文試題(含答案)
- 建筑施工行業(yè)2026年春節(jié)節(jié)前全員安全教育培訓
- 2026屆高考語文復習:小說人物形象復習
- 2026及未來5年中國防病毒網(wǎng)關行業(yè)市場全景調(diào)查及發(fā)展前景研判報告
- 2026年山東省煙草專賣局(公司)高校畢業(yè)生招聘流程筆試備考試題及答案解析
- 八年級下冊《昆蟲記》核心閱讀思考題(附答案解析)
- 煤礦復產(chǎn)安全培訓課件
- 2025年中職藝術設計(設計理論)試題及答案
- 2026屆高考歷史二輪突破復習:高考中外歷史綱要(上下兩冊)必考??贾R點
- 鐵路交通法律法規(guī)課件
評論
0/150
提交評論