版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
抽樣法第11章(統(tǒng)計學(xué)原理-大學(xué)課件)第一節(jié)抽樣法的意義和作用一、抽樣法的特點抽樣法在統(tǒng)計調(diào)查和統(tǒng)計分析中都有廣泛的應(yīng)用。抽樣法是按照隨機原則從全部研究對象中抽取一部分單位進行觀察,并依據(jù)所獲得的數(shù)據(jù)對全部研究對象的數(shù)量特征做出具有一定可靠性的估計判斷,從而達(dá)到對全部研究對象的認(rèn)識的一種統(tǒng)計方法。2抽樣法的基本特點:(1)根據(jù)部分實際資料對全部總體的數(shù)量特征作出估計。通過抽樣調(diào)查,取得部分單位的實際材料,據(jù)以計算抽樣的綜合指標(biāo),然后對于總體的規(guī)模、水平、結(jié)構(gòu)指標(biāo)作出估計。3(2)按隨機的原則從全部總體中抽選樣本單位。(3)抽樣推斷的抽樣誤差可以事先計算并反加以控制。抽樣推斷是以部分資料推算全體,雖然存在一定的抽樣誤差,但它可以事先通過一定資料加以計算,并且能夠采取一定的組織措施來控制這個誤差范圍,保證抽樣準(zhǔn)斷的結(jié)果達(dá)到一定的可靠程度。4二、抽樣法的作用第一,對某些不可能進行全面調(diào)查而又要了解其全面情況的社會經(jīng)濟現(xiàn)象,必須應(yīng)用抽樣法。如,工業(yè)生產(chǎn)中檢驗?zāi)承┊a(chǎn)品的質(zhì)量時,常常具有破壞性。如輪胎的里程檢驗、燈泡的壽命檢驗,紗布的強力檢驗、炮彈的殺傷力檢驗等。有些現(xiàn)象的總體過大,單位過于分散,進行全面調(diào)查實際上是不可能的,例如要檢驗水庫的魚苗數(shù),森林的木材積蓄絲等。5第二,對某些社會經(jīng)濟現(xiàn)象雖然可以進行全面調(diào)查.但抽樣法仍然有其獨到的作用,例如:抽樣調(diào)查可以節(jié)省人力、費用,提高調(diào)查的經(jīng)濟效果。抽樣調(diào)查可以節(jié)省時間,提高調(diào)查的時效性。抽樣調(diào)查由于調(diào)查單位少,調(diào)查隊伍經(jīng)過專門訓(xùn)練,可以增加調(diào)查項目,取得比較詳細(xì)的資料,并且提高資料的準(zhǔn)確性。6第三,抽樣調(diào)查和全面調(diào)查同時進行,可以發(fā)揮相互補充和檢查質(zhì)量的作用。第四,抽樣法可以用于工業(yè)生產(chǎn)過程的質(zhì)量控制。第五,利用抽樣法原理,還可以對于某種總體的假設(shè)進行檢驗,來判斷這種假設(shè)的真?zhèn)?,決定行動的取舍。7三、抽樣法的理論基礎(chǔ)(一)大數(shù)法則就數(shù)量關(guān)系來說,抽樣推斷是建立在概率論的大數(shù)法則基礎(chǔ)上,大數(shù)法則的一系列定理為抽樣推斷提供了數(shù)學(xué)依據(jù)。8大數(shù)法則即關(guān)于大量的隨機現(xiàn)象具有穩(wěn)定性質(zhì)的法則。它說明如果被研究的總體是由大量的相互獨立的隨機因素所構(gòu)成,而且每個因素對總體的影響都相對地小,那么對這些大量因素加以綜合平均的結(jié)果,因素的個別影響將相互抵消,而顯現(xiàn)出它們共同作用的傾向,使總體具有穩(wěn)定的性質(zhì)。9聯(lián)系到抽樣推斷來看,大數(shù)法則證明:如果隨機變量總體存在著有限的平均數(shù)和方差,則對于充分大的抽樣單位數(shù)n,可以幾乎趨近于l的概率,來期望抽樣平均數(shù)與總體平均數(shù)的絕對離差為任意小,即對于任意的正數(shù)。有:10(二)中心極限定理大數(shù)法則論證了抽樣平均數(shù)趨近于總體平均數(shù)的趨勢,這為抽樣推斷提供了重要的依據(jù)。但是,抽樣平均數(shù)和總體平均數(shù)的離差究竟有多大?離差不超過一定范圍的概率究競有多少?這個離差的分市怎樣?大數(shù)法則并沒有在這方面給出什么信息。這個問題要利用另一重要的定理,即中心極限定理來研究。中心極限定理證明:如果總體變量存在有限的平均數(shù)和方差,那么不論這個總體變量的分布如何,隨著抽樣單位數(shù)n的增加,抽樣平均數(shù)的分布便趨近于正態(tài)分布。11INTRODUCTIONTOINFERENTIALSTATISTICS Statisticalinferenceistheprocessofmakinggeneralizationabouta populationfromasle. Sincemostofthecharacteristicsofapopulationcanbedescribedby parameters,inferentialstatisticsprimarilydealswiththeestimationofanunknownpopulationparameterfromthecorrespondingslestatistic.withtheverificationwhetherabelieforhypothesisaboutaparameterissupportedbythesleevidence.EstimationHypothesistesting(E.g.:Weestimateprobabilitymeasuresfromrelativefrequencies.)(E.g.:Webelievethattheprobabilityofaneventis0.2andusingjustaslewewanttofindoutwhetherthisisareasonableassumption.)12Ex1:Supposeweareinterestedinthefollowingpopulation:X={1,2,3,4,5).Sincethisisaverysmallpopulation(Nx=
5),itiseasytoobservethewholepopulation,toillustrateitwitharelativefrequencyhistogramandtofindtheparameters,likethepopulationmeanandthepopulationvariance.and(Checkthedetails.) Thekeyconceptbehindthesestatisticalproceduresistheprobabilitydistribution,calledslingdistribution,ofaslestatistic.Asummaryofallpossiblevaluesofastatisticalongwiththecorrespondingprobabilities.131234512345Thoughthesecalculationswerereallysimple,assumethat,forsomereason,wedonotobservethewholepopulation,butdrawallpossibleslesofsizetwo(n=2)withreplacement.Thereare25possiblesles.Theyareshowninthefirstrowandfirstcolumnofthetablebelow.1stdraw(x1)2nddraw(x2)1.0Computetheslemeanfromeachofthesesles.(E.g.:Ifx1=1andx2=4,x-baris2.5.)2.53.52.02.53.01.52.02.53.03.52.02.53.03.54.03.03.54.04.53.01.54.04.55.0Theseslemeanvaluesformasecondpopulation,X-bar1.(Checkthedetails.)14Repeatpartbassumingthistimethatslingiswithoutreplacement.123451-1.52.02.53.021.5-2.53.03.532.02.5-3.54.042.53.03.5-4.553.03.54.04.5-1stdraw(x1)2nddraw(x2)Theseslemeanvaluesformathirdpopulation,X-bar2.(Sinceslesaredrawnwithoutreplacement,thesamenumbercannotturnuptwice.)15ComparetheX,X-bar1andX-bar2populationstoeachother.XX-bar1X-bar2Size(N)52520Mean(μ)333Variance(σ2)210.75X-bar1andX-bar2arelargerpopulationsthanX.X,X-bar1andX-bar2havethesamemean.XhasthebiggestvarianceandX-bar2hasthesmallest.
TheseresultssuggestthatItiseasierto‘guess’X-bar2thanX-bar1orX.16Apartfromtheirmeansandvariances,theX-bar1andX-bar2populationscanalsobecharacterizedbytheirshapes.Notehowever,thatand(TheserelationshipsbetweenthevariancesofX,X-bar1andX-bar2arevalidingeneral.)TheserelativefrequencyhistogramsaregraphicalrepresentationsoftheX-bar1andX-bar2slingdistributions.Apparently,bothslingdistributionsaresymmetricalaroundμ=3.Nevertheless,theyaredifferentfromeachother,andbothofthemaredifferentfromthedistributionofX.17 Howtotakeasle?Inthisexletheoriginalpopulation,X,isverysmall,sowecouldeasilycalculatethepopulationmean,μx.Therewasnorealneedtodrawsles. Inpractice,however,thetargetpopulationisusuallymuchlarger.Thepopulationaboutwhichwewanttodrawinferences.Sinceitmightbeimpossibleorimpracticaltoobservethewholepopulation,wedrawasle.Itisnotnecessarilythesamethanthesledpopulation,i.e.thepopulationfromwhichweactuallytakethesle. Theslemustberepresentative,i.e.itmusthavesimilarattributesthanthepopulationitself. Inordertoobtainreliableinformationfromasle Thetargetandsledpopulationsshouldbeverysimilar,or thesameifpossible.18Evenasmallsleislikelytogiveusfairlyaccurateinformationaboutthepopulation.(E.g.theslemeancanbeexpectedtobeclosetothepopulationmean.) Ifthesleitemsareselectedrandomly,thesleislikea‘scaled-down’versionofthepopulation,unlessweareveryunlucky. Ifthesleisnotrandomlyselected,itislikelytoproducemisleading, biasedresults,evenifthesleisrelativelylarge. (E.g.Ifwewereattemptingtoestimatemeanearnings,butwefailedtoslepeopleinmoreaffluentsuburbs,theslemeanwouldalmostcertainlyunderestimatethetruepopulationmean.)19ThisexlesuggeststhatIfweintendtouseaslestatisticforstatisticalinference,firstwehavetostudyitsslingdistribution.(Ex1) Westudiedallpossibleslesofsize2drawnwithreplacement.Therewere25differentsles.Ifweselectonlyoneofthem,butmakesurethatallthesesleshavethesamechanceofbeingselected,thenslingisassuredtobesimplerandomsling.Ifwedrawjustonesleandithappenstobex1=1andx2=3,x-baris2.SincethetruemeanofXis3,theerroris1.Thisisaslingerror. Slestatistics,likee.g.X-bar,arerandomvariablessincetheir actualvaluesvarydependingonwhichparticularsleisselected.The25possibleslesofsize2had9differentslemeanvalues:1.0,1.5,2.0,2.5,3.0,3.5,4.0,4.5and5.0.SAMPLINGDISTRIBUTIONS20TheresultsfromEx1canbegeneralizedasfollows. Theslingdistributionoftheslemeanscalculatedfromrandomslesofthesamesizehavethefollowingcharacteristics: 1)i.e.theexpectedvalueoftheslemeanisthemeanofthesledpopulation.Theslemeanfromarandomsleisourbestguessofthetruepopulationmean. 2)grantedthatslingiswithreplacement,orfromarelativelylarge,maybeinfinite,population.(Thepopulationisconsideredtobelargecomparedtothesleifn/N<0.10,i.e.nislessthan10%ofN.)OtherwiseFinitepopulationcorrectionfactor. Likeprobabilitydistributionsingeneral,aslingdistributioncanbe describedbyitsthreeimportantproperties: mean,standarddeviationandshape.21Asfortheshapeoftheslingdistributionoftheslemean,itdependsonthedistributionofthesledpopulationandontheslesize. Thestandarddeviationoftheslemean(oranyotherstatistic)is calledstandarderror.Sincethemeanoftheslemeanisμ,thestandarddeviationoftheslemeanmeasurestheaveragedistancebetweentheslemeanandthepopulationmean.Namely:3) Ifthepopulation(X)isnormallydistributed,X-barisalso normallydistributed,regardlessoftheslesize. Ifthepopulation(X)isnotnormallydistributed,orwedonot knowwhetheritisnormal,wecanrelyonthe CentralLimitTheorem(CLT):Iftheslesizeislarge(sayn30),X-barisapproximatelynormallydistributed,regardlessoftheshapeofthepopulation.Themorebell-shapedthepopulationor/andthelargertheslesize,thebetterthisapproximationis.22Ex2: Anautomaticmachineinamanufacturingprocessisoperatingproperlyifthelengthsofanimportsub-componentarenormallydistributed,withmeanμ
=117cmandstandarddeviationσ
=2.1cm.Findtheprobabilitythatonerandomlyselectedunithasalengthofgreaterthan120cm.Findtheprobabilitythatifthreeunitsarerandomlyselected,theirmeanlengthexceeds120cm.Xi.e.X:N(117,2.1)nSinceXisnormallydistributed,X-barisalsonormal,and
X-bar
:N(117,1.212)23Theprobabilityofrandomlyselectingoneunitlongerthan120cmis7.64%,whiletheprobabilityofselectingthreeunitswithanaveragelengthofgreaterthan120cmisonly0.68%.
24第二節(jié)總體和樣本1、全及總體和抽樣總體2、全及指標(biāo)和抽樣指標(biāo)3、樣本容量和樣本個數(shù)251、全及總體和抽樣總體全及總體是所要研究的對象,又稱母體,簡稱總體,它是指所要認(rèn)識的,具有某種共同性質(zhì)的許多單位的集合體。全及總體單位數(shù)(N)一般很大。26抽樣總體(又稱子樣)抽樣總體則是所要觀察的對象。簡稱樣本、子樣,是從全及總體中隨機抽取出來,代表全及總體的那部分單位的集合體。樣本的單位數(shù)(n)總是有限的。全及總體和抽樣總體兩者是既有區(qū)別而又有聯(lián)系的不同范疇。27樣本容量抽樣總體的單位數(shù),通常用小寫英文字母n來表示。隨著樣本容量的增大,樣本對總體的代表性越來越高,并且當(dāng)樣本單位數(shù)足夠多時,樣本平均數(shù)愈接近總體平均數(shù)。28樣本的特點在一次抽樣調(diào)查中,全及總體是唯一確定的,樣本是不確定的,具有隨機性。一個全及總體可能抽出很多個樣本,可能樣本的個數(shù)與樣本容量和抽樣方法有關(guān)。29如:N=4n=2(考慮順序)重置抽樣時:樣本個數(shù)=16若改變樣本單位數(shù),取n=3,則,樣本個數(shù)=4×4×4=64應(yīng)用數(shù)學(xué)排列計算公式:N個元素中任取n個元素組成的可重復(fù)排列30如:N=4n=2(考慮順序)不重置抽樣時:樣本個數(shù)=12若改變樣本單位數(shù),取n=3,則樣本個數(shù)=4×3×2=24應(yīng)用數(shù)學(xué)排列計算公式:N個元素中任取n個元素組成的不可重復(fù)排列31如:N=4n=2(不考慮順序)不重置抽樣時:樣本個數(shù)=6若改變樣本單位數(shù),取n=3,則樣本個數(shù)=(4×3×2)/(3×2)=4應(yīng)用數(shù)學(xué)組合計算公式:N個元素中任取n個元素組成的不可重復(fù)排列32如:N=4n=2(不考慮順序)重置抽樣時:樣本個數(shù)=10若改變樣本單位數(shù),取n=3,則樣本個數(shù)=(6×5×4)/(3×2)=20應(yīng)用數(shù)學(xué)排列組合計算公式:N個元素中任取n個元素組成的不可重復(fù)排列33判斷題從全部總體單位中按照隨機原則抽取部分單位組成樣本,只可能組成一個樣本。()答案:×一個全及總體可能抽出很多個樣本34判斷題在抽樣推斷中,作為推斷的總體和作為觀察對象的樣本都是確定的、唯一的。()答案:×總體唯一,樣本不唯一352.參數(shù)和統(tǒng)計量(全及指標(biāo)和抽樣指標(biāo))參數(shù)(全及指標(biāo))(parameter)根據(jù)全及總體各個單位的標(biāo)志值或標(biāo)志屬性計算的,反映總體某種屬性或特征的綜合指標(biāo)稱為全及指標(biāo)。全及指標(biāo)值具有唯一性。常用的全及指標(biāo)有總體平均數(shù)()(或總體成數(shù)P)、總體標(biāo)準(zhǔn)差σ(或總體方差σ2)。36不同性質(zhì)的總體,需要計算不同的全及指標(biāo)。對于變量總體,由于各單位的標(biāo)志可以用數(shù)量來表示,所以可以計算總體平均數(shù)。37對于屬性總體,由于各單位的標(biāo)志不可以用數(shù)量來表示,只能計算比重結(jié)構(gòu)指標(biāo),稱為總體成數(shù)。用大寫英文字母P來表示,它說明總體中具有某種標(biāo)志表現(xiàn)的單位數(shù)在總體中所占的比重。設(shè)總體N個單位中,有N1個單位具有某種標(biāo)志表現(xiàn)的,N0個單位不具有某種標(biāo)志表現(xiàn),N1+N0=N,P為總體中具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的比重,Q為不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的比重,則總體成數(shù)為38此外,全及指標(biāo)還有總體標(biāo)準(zhǔn)差和總體方差,它們都是測度總體標(biāo)志值離散程度的指標(biāo)。39●統(tǒng)計量(抽樣指標(biāo))由抽樣總體各單位標(biāo)志值計算出來反映樣本特征,用來估計全及指標(biāo)的綜合指標(biāo)稱為統(tǒng)計量(抽樣指標(biāo))。40統(tǒng)計量的特點統(tǒng)計量(抽樣指標(biāo))是隨機變量,取值不唯一。統(tǒng)計量是樣本變量的函數(shù),用來估計總體參數(shù),因此與總體參數(shù)相對應(yīng)。41統(tǒng)計量的計算統(tǒng)計量有樣本平均數(shù)(或抽樣成數(shù))樣本標(biāo)準(zhǔn)差(或樣本方差)42成數(shù)(P)具有某種性質(zhì)的單位數(shù)占總體單位數(shù)的比重。成數(shù)是(0,1)分布的平均數(shù)43如:某一批產(chǎn)品的合格率是90%,這里的合格率即是成數(shù)=0.9。合格率=合格品數(shù)量/產(chǎn)品總數(shù)量44成數(shù)方差()成數(shù)方差:成數(shù)標(biāo)準(zhǔn)差的平方某一批產(chǎn)品的合格率是90%,則合格率的方差為:p=90%=0.945第三節(jié)抽樣估計的一般原理一、抽樣估計的優(yōu)良標(biāo)準(zhǔn)由于抽樣指標(biāo)作為統(tǒng)計量,它是一個隨機變量,隨著抽取的樣本不同,便有不同估計值。因此要判斷一種估計量的好壞,僅從某一次試驗的結(jié)果來衡量是不可能的,而應(yīng)該從多次重復(fù)試驗中,看這種估計量是否在某種意義上說最接近于被估計參數(shù)的真值。一般地說,用抽樣指標(biāo)估計總體指標(biāo)應(yīng)該有三個要求。滿足了這個要求的,就可以認(rèn)為是合理的估計或優(yōu)良的估計。46(一)無偏性
用抽樣指標(biāo)估計總體指標(biāo)要求抽樣指標(biāo)的平均數(shù)等于被估計的總體指標(biāo)。就是說,雖然每一次的抽樣指標(biāo)和未知的總體指標(biāo)可能不相同,但在多次反復(fù)的估計中各個抽樣指標(biāo)的平均數(shù)應(yīng)該等于總體指標(biāo),即抽樣指標(biāo)的估計平均說來是沒有偏誤的。抽樣平均數(shù)是無偏估計量,即抽樣平均數(shù)的平均數(shù)等于總體平均數(shù)。47(二)一致性
用抽樣指標(biāo)估計總體指標(biāo)要求當(dāng)樣本的單位數(shù)充分大時,抽樣指標(biāo)也充分地靠近總體指標(biāo)。換句話說,隨著樣本的單位數(shù)n的無限增大,抽樣指標(biāo)和未知的總體指標(biāo)之間的絕對離差為任意小的可能性也趨于必然性。
48
49(三)有效性
用抽樣指標(biāo)估計總體要求作為優(yōu)良估計量的方差應(yīng)該比其他估計量的方差小,即用抽樣平均數(shù)和總體某一變量來估計總體平均數(shù),雖然兩者都是無偏的估計量,而且在每一次的估計中兩種估計量和總體平均數(shù)都可能有離差,但樣本平均數(shù)更靠近在總體平均數(shù)的周圍,平均說來它的離差比較小,所以對比來說,抽樣平均數(shù)是更為優(yōu)良的估計量。樣本平均數(shù)作為估計量的有效性,我們在下面講抽樣平均誤差計算時再加以說明。50二、抽樣誤差抽樣誤差是指由于隨機抽樣的偶然因素使樣本不足以代表總體,而引起抽樣指標(biāo)和全及指標(biāo)之間的絕對離差。也稱為隨機誤差。它不包括登記誤差,也不包括系統(tǒng)性誤差。51抽樣中,誤差的來源有許多方面。其中一類是登記性誤差,即在調(diào)查過程中由于主客觀原因而引起登記上的差錯所造成的誤差。另一類是代表性的誤差,即樣本各單位的結(jié)構(gòu)情況不足以代表總體特征者。代表性誤差的發(fā)生,有以下兩種情況:一種是由于違反抽樣調(diào)查的隨機原則,如有意地多選較好的單位或較壞的單位進行調(diào)查,這樣,所據(jù)以計算的抽樣指標(biāo)必然出現(xiàn)偏高或偏低現(xiàn)象,造成系統(tǒng)性的誤差。52系統(tǒng)性的誤差和登記性的誤差都是抽樣工作中的組織問題,應(yīng)該采取措施預(yù)防發(fā)生或把它減少到最小限度。另一種情形,即使遵守隨機原則,由于被抽選的樣本有各種各樣,只要被抽中的樣本其內(nèi)部各單位被研究標(biāo)志的構(gòu)成比例和總體有所出入,就會出現(xiàn)或大或小的偶然性的代表性誤差。這種偶然性的代表性誤差是無法消除的,是抽樣誤差。
53三種誤差的區(qū)別:抽樣誤差:抽樣指標(biāo)和全及指標(biāo)之間的絕對離差,不可避免,可以控制。登記誤差:由于觀察、測量、登記、計算造成的誤差,可以避免。系統(tǒng)性誤差:由于有意識選取調(diào)查單位造成的系統(tǒng)偏差。理論上可以避免。54單選題抽樣誤差是指()。
A.在調(diào)查過程中由于觀察、測量等差錯所引起的誤差
B.在調(diào)查中違反隨機原則出現(xiàn)的系統(tǒng)誤差
C.隨機抽樣而產(chǎn)生的代表性誤差
D.人為原因所造成的誤差答案:C55影響抽樣誤差的因素總體各單位標(biāo)志值的差異程度在其他條件不變的情況下,總體標(biāo)志的變異程度愈小則抽樣誤差也愈小。
樣本的單位數(shù)在其他條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差就愈??;反之抽樣單位數(shù)少了,則抽樣誤差就要增大。56抽樣調(diào)查的組織形式這是因為不同的抽樣組織所抽出的樣本對于總體的代表性不相同。我們常常利用不同的抽樣誤差作出判斷各種抽樣組織估計有效性的比較標(biāo)準(zhǔn)。
571、抽樣平均誤差μ反映抽樣誤差一般水平的指標(biāo)。實質(zhì)含義是指抽樣平均數(shù)(或成數(shù))的標(biāo)準(zhǔn)差,反映了抽樣指標(biāo)與總體指標(biāo)的平均離差程度。58單選題
抽樣平均誤差是()。A.全及總體的標(biāo)準(zhǔn)差B.樣本的標(biāo)準(zhǔn)差C.抽樣指標(biāo)的標(biāo)準(zhǔn)差D.抽樣誤差的平均差答案:C59抽樣平均誤差μ的作用作用:說明樣本指標(biāo)代表性的大小。平均誤差μ大,說明樣本指標(biāo)對總體指標(biāo)的代表性低;反之則說明樣本指標(biāo)對總體指標(biāo)代表性高。60判斷題抽樣平均均誤差反映抽樣的可能誤差范圍,實際上每次的抽樣誤差可能大于抽樣平均誤差,也可能小于抽樣平均誤差。()答案:√61抽樣平均誤差的計算:
重置抽樣不重置抽樣平均數(shù)成數(shù)成數(shù)平均數(shù)①②③④62如:某鄉(xiāng)糧食畝產(chǎn)量的標(biāo)準(zhǔn)差87。若按重置抽樣計算,其抽樣平均誤差為63如:已知秧苗成活率….如果改為:從100畝地中隨機抽取10畝地進行測試,秧苗成活率為92%,則按不重置抽樣計算,其抽樣平均誤差為:64抽樣平均誤差的應(yīng)用在抽樣推斷中,抽樣平均誤差用于計算極限誤差Δ652、抽樣極限誤差Δ用絕對值形式表示的樣本指標(biāo)與總體指標(biāo)偏差的可允許的最大范圍。也稱為允許誤差。由抽樣指標(biāo)變動可允許的上限或下限與總體指標(biāo)之差的絕對值求得。66抽樣極限誤差(Δ)的計算方法平均數(shù)的抽樣極限誤差成數(shù)的抽樣極限誤差67估計區(qū)間估計區(qū)間(置信區(qū)間):根據(jù)抽樣平均數(shù)和抽樣極限誤差確定的總體指標(biāo)取值范圍。總體平均數(shù)的估計區(qū)間總體成數(shù)的估計區(qū)間68···69如:從某工廠工人中隨機抽取100人,計算平均工資為1500元,若要求抽樣允許誤差最大值為160元,則該廠工人的總平均工資取值范圍在1340—1660元之間。即70兩種抽樣誤差的關(guān)系抽樣平均誤差具有較強的客觀性,抽取的樣本一旦確定,抽樣平均誤差也就隨之確定。它由樣本單位數(shù)、總體標(biāo)準(zhǔn)差、總體單位數(shù)確定。抽樣極限誤差具有較強的主觀性,人們可以根據(jù)工作需要、歷史經(jīng)驗規(guī)定抽樣允許誤差的范圍,以保證抽樣的有效性。71概率度(t)基于理論上的要求,抽樣極限誤差需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來衡量。即用抽樣極限誤差△除以抽樣平均誤差μ,得出相對的誤差程度t倍。t稱為抽樣誤差的概率度。于是有:72Δ、μ、t三者之間的關(guān)系Δ=tμ確定μ和t確定Δ根據(jù)抽樣平均數(shù)和Δ就能估計總體平均數(shù)的取值區(qū)間Δ,μ,t
相互制約。μ確定后,Δ與t成正比關(guān)系7374單選題
反映樣本指標(biāo)與總體指標(biāo)之間的平均誤差程度的指標(biāo)是()。A.抽樣誤差系數(shù)B.概率度C.抽樣平均誤差D.抽樣極限誤差答案:C75填空題如果總體平均數(shù)落在區(qū)間內(nèi)的概率保證程度是95.45%,則抽樣極限誤差等于
,抽樣平均誤差等于
。答案:2μμ76四、抽樣估計方法抽樣估計就是利用實際調(diào)查計算的樣本指標(biāo)值來估計相應(yīng)的總體指標(biāo)數(shù)值。抽樣估計有點估計和區(qū)間估計兩種。77點估計根據(jù)總體指標(biāo)的結(jié)構(gòu)形式設(shè)計樣本指標(biāo)作為總體參數(shù)的估計量,并以樣本指標(biāo)的實際值直接作為相應(yīng)總體參數(shù)的估計值。78點估計的基本特點:簡單易行,原理直觀。沒有表明抽樣誤差和誤差在一定區(qū)間的概率保證程度。79抽樣估計的置信度F(t)表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率有多大。即抽樣估計的可靠性有多大。也稱為概率保證程度。它是t的函數(shù)。0≤t≤5,0≤F(t)≤1,F(t)是增函數(shù)。80如:t=1F(1)=0.6827=68.27%t=1時全及指標(biāo)落在估計區(qū)間的可能性有68.27%t=2F(2)=0.9545=95.45%t=1.96F(1.96)=0.95=95%81判斷題抽樣估計置信度就是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率保證程度。()答案:√82單選題
在一定的抽樣平均誤差條件下()。
A.擴大極限誤差范圍,可以提高推斷的可靠程度
B.擴大極限誤差范圍,會降低推斷的可靠程度
C.縮小極限誤差范圍,可以提高推斷的可靠程度
D.縮小極限誤差范圍,不改變推斷的可靠程度答案:A
擴大極限誤差范圍,估計區(qū)間擴大,總體指標(biāo)落在該區(qū)間內(nèi)的可能性越大,即推斷的可靠程度越高。83單選題在其它條件不變的情況下,提高估計的概率保證程度,其估計的精確程度()。
A.隨之?dāng)U大B.隨之縮小
C.保持不變D.無法確定答案:B*原因84*原因精確度指抽樣指標(biāo)與總體指標(biāo)偏離的相對程度,概率保證程度提高,即F(t)增大,則t增大。在其它條件不變的情況下,t增大,抽樣極限誤差Δ增大,因此抽樣估計的精確度減小。85判斷題在其它條件不變的情況下,提高抽樣估計的可靠程度,可以提高抽樣估計的精確度。()答案:×86F(t)、t、Δ、μ之間的關(guān)系F(t)與t具有1—1對應(yīng)的關(guān)系,所以已知概率保證程度F(t)就可以求出概率度t;若已知t就可以知道F(t)。樣本確定μ給定F(t)tΔ=tμΔ/μ=t給定Δ
F(t)87填空題如果總體平均數(shù)落在區(qū)間內(nèi)的概率保證程度是95.45%,則抽樣極限誤差等于
,抽樣平均誤差等于
。答案:2μμF(t)=95.45t=2Δ=tμ=2μ88總體參數(shù)區(qū)間估計根據(jù)給定的概率保證程度的要求,利用實際抽樣資料,指出被估計值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍。89參數(shù)區(qū)間估計基本特點指出總體被估計值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍,而不是直接給出總體參數(shù)的估計值。同時指出總體參數(shù)落在估計區(qū)間內(nèi)的可能性有多大。90總體參數(shù)區(qū)間三個要素必須同時具備:估計值、抽樣誤差范圍、概率保證程度。估計值:一般為樣本平均數(shù)或樣本成數(shù)p抽樣誤差范圍:Δ概率保證程度:F(t)91填空題總體參數(shù)區(qū)間估計必須具備的三個要素是:估計值、
、
。答案:抽樣誤差范圍、概率保證程度92區(qū)間估計的步驟區(qū)間估計根據(jù)給定的條件不同,有兩種估計方法:⑴給出允許誤差(Δ),求概率保證程度F(t)。⑵給出概率保證程度F(t),求估計區(qū)間。93⑴給出Δ,求F(t)①抽取樣本,計算樣本指標(biāo)(樣本平均數(shù)、樣本方差、抽樣平均誤差);②根據(jù)給定的抽樣誤差——允許誤差Δ計算估計區(qū)間的上、下限;③求出概率度t,F(xiàn)(t),對總體參數(shù)作區(qū)間估計。94⑵給出概率保證程度F(t),求估計區(qū)間。①抽取樣本,計算樣本指標(biāo)(樣本平均數(shù)、樣本方差、抽樣平均誤差);②根據(jù)給定的F(t),查表求出t;③求出抽樣極限誤差Δ和估計區(qū)間的上、下限,對總體參數(shù)作區(qū)間估計。95區(qū)間估計注意首先確定被估計總體指標(biāo)的種類,是平均數(shù)還是成數(shù);其次取定抽樣方法,是重置抽樣還是不重置抽樣;然后再根據(jù)給定的樣本資料和抽樣條件(給定概率保證程度還是給定抽樣極限誤差),確定計算步驟,進行計算。96練習(xí)1某學(xué)校進行一次英語測驗,為了解學(xué)生的考試情況,隨機抽選部分學(xué)生進行調(diào)查,所得資料如下:試以95.45%的可靠性估計該校學(xué)生英語考試的平均成績的范圍及該校學(xué)生成績在80分以上的學(xué)生所占的比重的范圍。97解:(1)估計該校學(xué)生英語考試的平均成績的范圍:分析:考試成績是平均數(shù),應(yīng)選用關(guān)于的抽樣計算公式;資料沒有給出總體單位數(shù)N,抽樣方法應(yīng)選用重置抽樣。當(dāng)資料中沒有指出抽樣方法,同時也沒有給出總體單位數(shù)N時,默認(rèn)為重置抽樣。9899①計算樣本指標(biāo)樣本平均成績樣本標(biāo)準(zhǔn)差S=抽樣平均誤差100②根據(jù)給定的F(t),查表求tF(t)=95.45%查表t=2③求出抽樣極限誤差Δ和估計區(qū)間的上、下限
估計區(qū)間下限:76.6-2.2754=74.32估計區(qū)間上限:76.6+2.2754=78.89101可以95.45%的概率保證程度估計該校學(xué)生考試平均成績的區(qū)間范圍是:
74.32≤≤78.89102(2)估計該校學(xué)生成績在80分以上的學(xué)生所占的比重的范圍分析:學(xué)生所占比重是成數(shù),應(yīng)選用關(guān)于P的抽樣計算公式;抽樣方法仍為重置抽樣。103①計算樣本指標(biāo)樣本成數(shù)抽樣平均誤差104②根據(jù)給定的F(t),查表求tF(t)=95.45%查表t=2③求出抽樣極限誤差Δ和估計區(qū)間的上、下限
=2×0.04996=0.09992
估計區(qū)間下限:0.48-0.09992=0.3801估計區(qū)間上限:0.48+0.09992=0.5799105以95.45%概率保證程度估計,該校學(xué)生成績在80分以上的學(xué)生所占的比重的范圍在38.01%-57.99%之間。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)校門衛(wèi)衛(wèi)生考核制度
- 飲食衛(wèi)生制度
- 新衛(wèi)生院紀(jì)律管理制度
- 溫州圖書館財務(wù)制度
- 三費財務(wù)制度
- 衛(wèi)生室防護消毒轉(zhuǎn)運制度
- 衛(wèi)生許可證所需規(guī)章制度
- 商家代運營售后制度
- 全縣衛(wèi)生評比制度
- 衛(wèi)生工作責(zé)任制度
- 新技術(shù)項目立項
- GB/T 18344-2025汽車維護、檢測、診斷技術(shù)規(guī)范
- DB42T 1651-2021 房屋建筑和市政基礎(chǔ)設(shè)施工程安全生產(chǎn)事故隱患排查與治理要求
- 當(dāng)事人提交證據(jù)材料清單(完整版)
- 活物賣買合同協(xié)議書模板
- 酒店總經(jīng)理年終總結(jié)模版
- 清潔驗證完整版本
- 2023年山東省中考英語二輪復(fù)習(xí)專題++時態(tài)+語態(tài)
- 現(xiàn)場移交接收方案
- 2025“大唐杯”全國大學(xué)生新一代信息通信技術(shù)大賽決賽理論參考試題庫(含答案)
- 基于大數(shù)據(jù)的金融風(fēng)險管理模型構(gòu)建與應(yīng)用研究
評論
0/150
提交評論