定量資料的參數估計與假設檢驗基礎演示文稿_第1頁
定量資料的參數估計與假設檢驗基礎演示文稿_第2頁
定量資料的參數估計與假設檢驗基礎演示文稿_第3頁
定量資料的參數估計與假設檢驗基礎演示文稿_第4頁
定量資料的參數估計與假設檢驗基礎演示文稿_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

定量資料的參數估計與假設檢驗基礎演示文稿本文檔共40頁;當前第1頁;編輯于星期六\3點43分優(yōu)選定量資料的參數估計與假設檢驗基礎本文檔共40頁;當前第2頁;編輯于星期六\3點43分抽樣研究與統(tǒng)計推斷從總體中隨機抽取一定量的觀察單位作為樣本進行抽樣研究,然后由樣本信息(統(tǒng)計量)推斷總體特征(參數)的過程,稱為統(tǒng)計推斷(statisticalinference)。這種研究方法稱為抽樣研究。本文檔共40頁;當前第3頁;編輯于星期六\3點43分抽樣研究實驗某研究者于2007年對安徽省高校2160名大學生進行了社會支持的抽樣調查研究,其主觀支持分滿足正態(tài)分布?,F(xiàn)從該正態(tài)分布總體中隨機抽取20個個體組成樣本,共抽取100次,分別計算每次抽樣的樣本均數、標準差,結果見表4-1。本文檔共40頁;當前第4頁;編輯于星期六\3點43分本文檔共40頁;當前第5頁;編輯于星期六\3點43分樣本均數的抽樣分布具有以下特征樣本均數之間存在不同(why?)樣本均數與總體均數間存在差異;(why?)樣本均數的分布是以總體均數為中心,呈現(xiàn)近似正態(tài)分布;樣本均數的變異程度(=0.901)明顯小于原個體變量之間的變異(=4.102)。back本文檔共40頁;當前第6頁;編輯于星期六\3點43分圖4-1100個樣本均數的直方圖本文檔共40頁;當前第7頁;編輯于星期六\3點43分如果沒有個體變異……NoVariation!NoSamplingError!本文檔共40頁;當前第8頁;編輯于星期六\3點43分如果沒有抽樣研究……NoRandomsampling!NoSamplingError!本文檔共40頁;當前第9頁;編輯于星期六\3點43分抽樣誤差的定義100次抽樣得到了不同的結果,原因何在?個體變異隨機抽樣不同大學生的社會支持分不同每次抽到的大學生人幾乎不同抽樣誤差本文檔共40頁;當前第10頁;編輯于星期六\3點43分

由于個體變異的存在,在抽樣研究中產生樣本統(tǒng)計量和總體參數之間的差異,稱為抽樣誤差(samplingerror)。各種統(tǒng)計量都有抽樣誤差,這里我們以均數為研究對象抽樣誤差的定義本文檔共40頁;當前第11頁;編輯于星期六\3點43分抽樣誤差的表現(xiàn)抽樣誤差的表現(xiàn)樣本均數和總體均數間的差別樣本均數和樣本均數間的差別本文檔共40頁;當前第12頁;編輯于星期六\3點43分抽樣誤差的重要性總體同質個體、個體變異總體參數未知樣本代表性、抽樣誤差隨機抽樣

樣本統(tǒng)計量已知統(tǒng)計推斷風險本文檔共40頁;當前第13頁;編輯于星期六\3點43分抽樣誤差的規(guī)律性

既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的?

本文檔共40頁;當前第14頁;編輯于星期六\3點43分中心極限定理從均數為μ,標準差為σ的正態(tài)總體中隨機抽樣,樣本均數服從均數為μ,標準差為的正態(tài)分布。從均數為μ,標準差為σ的任意總體中隨機抽樣,當樣本含量足夠大時,樣本均數近似服從均數為μ,標準差為的正態(tài)分布。

本文檔共40頁;當前第15頁;編輯于星期六\3點43分標準誤的定義樣本統(tǒng)計量(如均數)也服從一定的分布;與描述觀測值離散趨勢的指標類似,樣本統(tǒng)計量的標準差就反映了從某個總體中隨機抽樣所得樣本之均數分布的離散程度。用樣本統(tǒng)計量的標準差來反映抽樣誤差的大小。又稱標準誤(standarderror)。本文檔共40頁;當前第16頁;編輯于星期六\3點43分標準誤的計算計算公式為其中,為總體標準差,n為抽樣的樣本例數在研究工作時,由于總體標準差常常未知,可以利用樣本標準差近似估計本文檔共40頁;當前第17頁;編輯于星期六\3點43分標準誤的意義反映了樣本統(tǒng)計量(樣本均數,樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小。標準誤越大,說明樣本統(tǒng)計量(樣本均數,樣本率)的離散程度越大,即用樣本統(tǒng)計量來直接估計總體參數越不可靠。反之亦然。標準誤的大小與標準差有關,在例數n一定時,從標準差大的總體中抽樣,標準誤較大;而當總體一定時,樣本例數越多,標準誤越小。說明我們可以通過增加樣本含量來減少抽樣誤差的大小。本文檔共40頁;當前第18頁;編輯于星期六\3點43分樣本均數的抽樣分布規(guī)律中心極限定理從均數為μ,標準差為σ的正態(tài)總體中隨機抽樣,樣本均數服從均數為μ,標準差為的正態(tài)分布。從均數為μ,標準差為σ的任意總體中隨機抽樣,當樣本含量足夠大時,樣本均數近似服從均數為μ,標準差為的正態(tài)分布。

本文檔共40頁;當前第19頁;編輯于星期六\3點43分t分布的演化根據中心極限定理的內容,當樣本含量足夠大時,對從均數為μ,標準差為σ的任意總體中隨機抽樣所得的樣本均數進行標準化變換,有本文檔共40頁;當前第20頁;編輯于星期六\3點43分t分布的演化由于總體標準差往往是未知的,此時往往用樣本標準差代替總體標準差,這里,ν為自由度,取值為n-1由W.S.Gosset提出本文檔共40頁;當前第21頁;編輯于星期六\3點43分

f(t)

=∞(標準正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3自由度分別為1、5、∞時的

t分布t分布的圖形本文檔共40頁;當前第22頁;編輯于星期六\3點43分t分布的性質t分布為一簇單峰分布曲線,高峰在0的位置上,說明從正態(tài)總體中隨機抽樣所得樣本計算出的t值接近0的可能性較大。t分布以0為中心,左右對稱。分布的高峰位置比u分布低,尾部高。t分布與自由度有關,自由度越小,t分布的峰越低,而兩側尾部翹得越高;自由度逐漸增大時,t分布逐漸逼近標準正態(tài)分布;當自由度為無窮大時,t分布就是標準正態(tài)分布。每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表。本文檔共40頁;當前第23頁;編輯于星期六\3點43分t界值表單側:

P(t<=-tα,ν)=α或

P(t>=tα,ν)=α雙側:

P(t<=-tα,ν)+P(t>=tα,ν)=α

即:P(-tα,ν<t<tα,ν)=1-α[例]查t界值表得t值表達式

t0.05,10=2.228(雙側)

t0.05,10=1.812(單側)-tt0本文檔共40頁;當前第24頁;編輯于星期六\3點43分統(tǒng)計推斷所謂統(tǒng)計推斷(statisticalinference),是指如何抽樣,以及如何用樣本性質推斷總體特征。參數估計(parameterestimation)假設檢驗(hypothesistesting)本文檔共40頁;當前第25頁;編輯于星期六\3點43分參數估計點估計(PointEstimation)區(qū)間估計

(IntervalEstimation)本文檔共40頁;當前第26頁;編輯于星期六\3點43分參數估計之一:點估計用樣本統(tǒng)計量作為總體參數的估計例4-2

在例4-1編者2007年對安徽省高校2160名大學生進行了社會支持的調查研究中,某班級30名同學主觀支持得分的平均數為18.89,標準差為4.079,試估計安徽省高校大學生主觀支持的平均得分。本例中某班級大學生主觀支持平均得分=18.89分,按照點值估計,則安徽省高校大學生主觀支持得分的總體均數μ為18.89分。

本文檔共40頁;當前第27頁;編輯于星期六\3點43分點估計的缺陷μ=?分σ=?分

x1,x2,x3,x4……

N

=18.75分S=4.68分x1,x2,x3…x10

=18.91分S=4.72分x1,x2,x3…x10

=18.88分

S=4.81分x1,x2,x3…x10樣本含量n=10本文檔共40頁;當前第28頁;編輯于星期六\3點43分區(qū)間估計可信區(qū)間的定義總體均數可信區(qū)間的計算均數之差的可信區(qū)間可信區(qū)間的要素正確理解可信區(qū)間的含義本文檔共40頁;當前第29頁;編輯于星期六\3點43分區(qū)間估計例4-3根據例4-2中某班級30名同學主觀支持得分的平均數為18.89,標準差為4.079,試估計安徽省高校大學生主觀支持得分均值的95%可信區(qū)間。本文檔共40頁;當前第30頁;編輯于星期六\3點43分區(qū)間估計的實質假設某個總體的均數為μ,需要找到兩個量A和B,使得在一個比較高的可信度下(如95%),區(qū)間(A,B)能包含μ。即P(A<μ<B)=0.95本文檔共40頁;當前第31頁;編輯于星期六\3點43分可信區(qū)間的定義按一定的概率或可信度(1-α)用一個區(qū)間來估計總體參數所在的范圍,該范圍通常稱為參數的可信區(qū)間或者置信區(qū)間(confidenceinterval,CI),預先給定的概率(1-α)稱為可信度或者置信度(confidencelevel),常取95%或99%。可信區(qū)間(CL,CU)是一開區(qū)間

CL、CU

稱為可信限本文檔共40頁;當前第32頁;編輯于星期六\3點43分均數的(1-α)100%可信區(qū)間-t/2,v0t/2,v

1-/2/2本文檔共40頁;當前第33頁;編輯于星期六\3點43分均數的95%可信區(qū)間σ

未知且n較小時(n≤50):按t分布σ

已知或σ

未知但n足夠大(n>50),按Z分布本文檔共40頁;當前第34頁;編輯于星期六\3點43分總體均數單側的可信區(qū)間

例4-4

從某高校隨機抽取并測量了40名男大學生的肺活量,得到肺活量均值為3901ml,標準差為457ml,試估計該校男大學生肺活量均值的95%可信區(qū)間。故該高校男大學生肺活量均值的95%可信區(qū)間為:高于3779.2ml。本文檔共40頁;當前第35頁;編輯于星期六\3點43分例:【例4.1】隨機抽取某地25名正常成年男子,測得該樣本的脈搏均數為73.6次/分,標準差為6.5次/分,求該地正常成年男子脈搏總體均數95%的可信區(qū)間?!纠?.2】某市2001年120名7歲男童的身高=123.62(cm),標準差s=4.75(cm),計算該市7歲男童總體均數90%的可信區(qū)間。本文檔共40頁;當前第36頁;編輯于星期六\3點43分可信區(qū)間的兩個要素可信度(Confidence):準確性,可靠性,即1-α。一般取90%,95%,可人為控制精確性(Precision):區(qū)間的大小,越小越好。必須二者兼顧本文檔共40頁;當前第37頁;編輯于星期六\3點43分可信區(qū)間的寬度及影響因素均數的95%可信區(qū)間為則其寬度為本文檔共40頁;當前第38頁;編輯于星期六\3點43分可信區(qū)間的寬度可信度越大,可信區(qū)間越寬,說明用該區(qū)間來估計總體參數(總體均數)越可靠。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論