版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
管理統(tǒng)計學
ManagementStatistics工商管理系王雅娟16174208@第一章數(shù)據(jù)與統(tǒng)計學1.理解統(tǒng)計與統(tǒng)計學的含義2.理解統(tǒng)計數(shù)據(jù)與統(tǒng)計學的關系3.了解統(tǒng)計學的分科
4.了解數(shù)據(jù)的計量尺度與數(shù)據(jù)的類型7.了解統(tǒng)計數(shù)據(jù)的來源8.掌握統(tǒng)計學的基本概念國內(nèi)統(tǒng)計界認為,統(tǒng)計在不同的場合有不同的含義,主要概括為以下三個方面的含義,即統(tǒng)計工作、統(tǒng)計數(shù)據(jù)和統(tǒng)計學。統(tǒng)計工作(統(tǒng)計實踐),是為了說明社會經(jīng)濟現(xiàn)象以及自然現(xiàn)象的總體數(shù)量規(guī)律性,而對該現(xiàn)象的數(shù)據(jù)進行搜集、整理、分析的活動過程。統(tǒng)計數(shù)據(jù),是指通過統(tǒng)計工作所獲得的反應客觀現(xiàn)象的各項數(shù)據(jù)資料以及相關的文字、圖表等資料的總稱,是統(tǒng)計工作的成果。統(tǒng)計學是一門研究社會經(jīng)濟和自然現(xiàn)象的數(shù)量方面的方法論科學,是一門收集、整理、顯示和分析統(tǒng)計數(shù)據(jù)的科學,其目的是探索數(shù)據(jù)內(nèi)在的數(shù)量規(guī)律性。理解統(tǒng)計與統(tǒng)計學的含義理解統(tǒng)計數(shù)據(jù)與統(tǒng)計學的關系了解統(tǒng)計學的分科統(tǒng)計學統(tǒng)計方法構成推斷統(tǒng)計學應用統(tǒng)計學描述統(tǒng)計學理論統(tǒng)計學統(tǒng)計方法研究與應用1.3統(tǒng)計學的分科反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)描述統(tǒng)計研究數(shù)據(jù)收集、整理和描述、分析的統(tǒng)計學分支推斷統(tǒng)計研究如何利用樣本(部分)數(shù)據(jù)來推斷總體特征的統(tǒng)計學分支數(shù)據(jù)的計量尺度定類尺度是測量尺度中層次最低的計量尺度。它按照事物的某種屬性對其進行平行的分類。人口按照性別屬性分為男女兩類;企業(yè)按照行業(yè)屬性分為醫(yī)藥企業(yè)、家電企業(yè)、紡織品企業(yè)等定序尺度具有定類尺度的一切特征,同時它還能反映出類別之間的等級,即不僅能把事物分成不同類別,而且不同類別之間還能進行排序。如用厭惡、一般、滿意來度量消費者的偏好定距尺度也稱間隔尺度,是在定序尺度的基礎上,還可以進行加減運算等,準確地指出類別之間的差距是多少。通常被用來度量溫度、考試成績等定比尺度也稱比率尺度,是最高層次的度量尺度,除了可以分類,比較大小及加減運算外還可以進行乘除運算,計算測度值之間的比值。統(tǒng)計數(shù)據(jù)類型與統(tǒng)計方法定類數(shù)據(jù)定序數(shù)據(jù)品質數(shù)據(jù)數(shù)量數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)參數(shù)方法非參數(shù)方法(按計量尺度)統(tǒng)計數(shù)據(jù)的來源(按收集方法分)調查數(shù)據(jù)
通過調查或觀測而收集到的數(shù)據(jù);在沒有對事物人為控制的條件下而得到的;有關社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是調查數(shù)據(jù)。試驗數(shù)據(jù)
在試驗中控制試驗對象而收集到的數(shù)據(jù);比如,對一種新藥療效的試驗,對一種新的農(nóng)作物品種的試驗等;自然科學領域的數(shù)據(jù)大多數(shù)都為試驗數(shù)據(jù)。統(tǒng)計數(shù)據(jù)的來源從使用者角度看,統(tǒng)計數(shù)據(jù)主要來自兩個渠道:直接獲取的數(shù)據(jù)間接獲取的數(shù)據(jù)1.4統(tǒng)計數(shù)據(jù)的來源直接獲取的數(shù)據(jù)統(tǒng)計調查 統(tǒng)計調查是按照統(tǒng)計任務的要求,運用科學的調查方法,有組織地向社會實際搜集各項原始資料的過程。普查(census)為某一特定目的,專門組織的一次性全面調查。這是一種摸清國情、國力的重要調查方法。特點:周期性或一次性、涉及面廣、調查單位及指標多、工作量大、規(guī)定統(tǒng)一的調查時間、數(shù)據(jù)規(guī)范化程度較高、應用范圍比較狹窄1.4統(tǒng)計數(shù)據(jù)的來源直接獲取的數(shù)據(jù)統(tǒng)計調查抽樣調查(samplingsurvey)抽樣調查是統(tǒng)計調查中應用最廣、最為重要的調查方法。它是通過隨機樣本對總體數(shù)量規(guī)律性進行推斷的調查研究方法。具有經(jīng)濟性、時效性強、適應面廣、準確性高等特點肯定存在一定的抽樣誤差科學試驗:科學試驗是取得自然科學數(shù)據(jù)的主要渠道。統(tǒng)計數(shù)據(jù)的質量抽樣誤差(samplingerror)利用樣本推斷總體時產(chǎn)生的誤差不可避免、可計量、可以控制影響抽樣誤差的大小的因素樣本量越大,抽樣誤差就越小總體的變異性越大,抽樣誤差越小非抽樣誤差(non-samplingerror)由于調查過程中各有關環(huán)節(jié)工作失誤造成的。有抽樣框誤差、回答誤差、無回答誤差、調查員誤差、測量誤差統(tǒng)計學的基本概念總體(population)總體是人們研究的所有基本單位(人、物體、交易或事件)的集合。樣本(sample)樣本是總體的一部分單位參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值所關心的參數(shù)主要有總體平均數(shù)()、標準差(
)、總體比例()等統(tǒng)計量(statistic)用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)所關心的樣本統(tǒng)計量有樣本平均數(shù)(
x)、樣本標準差(s)、樣本比例(p)等變量(variable)變量是總體中個體單位所具有的特征或特性。針對總體中每一基本單位的屬性都存在差異而言的。變量的具體取值稱為變量值定類變量、定序變量、數(shù)字變量第2章統(tǒng)計數(shù)據(jù)的描述1.了解數(shù)據(jù)的整理方法2.了解數(shù)據(jù)分布集中趨勢的測度3.了解數(shù)據(jù)分布離散趨勢的測度4.了解分布偏態(tài)與峰度的測度5.了解統(tǒng)計表與統(tǒng)計圖統(tǒng)計數(shù)據(jù)的分組
根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點,按某個分組標志(或幾個分組標志)把總體分為若干性質不同但又有聯(lián)系的幾個組成部分。統(tǒng)計分組的原則不重原則:在特定的分組標志下,總體中的任何一個單位的只能歸屬于某一組,而不能同時或可能歸屬于幾個組。不漏原則:使總體中的每一個單位都應有組可歸,或者說各分組的空間足以容納總體所有的單位。2.1統(tǒng)計數(shù)據(jù)的整理例1:從業(yè)人員按文化程度分組文盲或識字不多小學畢業(yè)中學畢業(yè)(含中專)大專畢業(yè)大學及大學以上
(×)(√)小學畢業(yè)中學畢業(yè)(含中專)大學畢業(yè)
定性分組(按品質標志分組)定量分組(按數(shù)量標志分組)1、單變量值分組——每組只有一個變量值2、組距分組——將變量值的一個區(qū)間作為一組。次數(shù)分配在統(tǒng)計分組的基礎上,將總體的所有單位按組歸類并排列,形成總體各個單位在各個組間的分布,稱為次數(shù)分配,這樣的數(shù)列稱為次數(shù)分配數(shù)列(又稱分布數(shù)列或次數(shù)分布)分配數(shù)列根據(jù)分組標志的不同可分為品質分配數(shù)列和變量分配數(shù)列變量數(shù)列可分為單項式變量數(shù)列和組距式變量數(shù)列。性別人數(shù)男30女20品質標志家庭人員(人)家庭(戶)1234567以上43391235182719合計625離散變量身高(米)學生人數(shù)1.50-1.601.60-1.701.70-1.8010119合計30連續(xù)變量2.1統(tǒng)計數(shù)據(jù)的整理組距分組的概念1、組限:各組兩端的數(shù)值,分為上限和下限下限(lowlimit)
:一個組的最小值上限(upperlimit)
:一個組的最大值2、組距(classwidth):一個組的上限與下限之差3、組中值(classmidpoint):一個組的下限與上限之間的中點值
閉口組:上限和下限都齊全的組。
開口組:上限和下限只具備其一的組
閉口組:組中值=(上限+下限)/2
缺下限開口組:組中值=上限-鄰組組距/2
缺上限開口組:組中值=下限+鄰組組距/2累計頻數(shù)和累計頻率:向下累積:把各組頻數(shù)或頻率由變量值低的組向變量值高的組累計向上累積:把各組頻數(shù)或頻率由變量值高的組向變量值低的組累計月工資(元)職工人數(shù)百分比(%)向下累積向上累積人數(shù)百分比(%)人數(shù)百分比(%)800-1000
1000-20002000-30003000-40004000-500037135210.023.343.316.76.731023283010.033.376.693.3100.030272072100.090.066.723.46.7合計30100.0----次數(shù)分配圖形(一)直方圖(histogram)用矩形的寬度和高度(記面積)來表示頻數(shù)分布的圖形在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖(二)折線圖(frequencypolygon)是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖下所圍成的面積與直方圖的面積相等(三)次數(shù)分配曲線當所觀察的次數(shù)越多,組距越小且組數(shù)越多時,所給出的折線圖就會越光滑,逐漸形成一條光滑的曲線。某車間工人周加工零件折線圖
洛倫茨曲線和基尼系數(shù)(1)洛倫茨曲線在一個總體(國家、地區(qū))內(nèi),將總人口按收入由低到高排隊,所形成的人口的累積百分比為橫坐標,收入的累積百分比為縱坐標,然后將總人口累積百分比與收入累計百分比的對應關系繪制在一張圖形上。(2)A表示實際收入曲線與絕對平均線之間的面積,B表示實際收入曲線與絕對不平均線之間的面積評價標準(1)如果A=0,則基尼系數(shù)=0,表示收入絕對平均;(2)如果B=0,則基尼系數(shù)=1,表示收入絕對不平均;(3)基尼系數(shù)在0和1之間取值;(4)基尼系數(shù)若小于0.2,表明分配平均但缺乏效率;(5)基尼系數(shù)在0.2至0.4之間是比較適當?shù)?,即一個社會既有效率又沒有造成極大的分配不公;(6)基尼系數(shù)在0.4被認為是收入分配不公平的警戒線,超過了0.4應該采取措施縮小這一差距。(7)基尼系數(shù)超過了0.6,則表示可能由于收入不公平導致社會不穩(wěn)定。分布集中趨勢的測度集中趨勢(ceneraltendency)是指分布的定位,它是指一組數(shù)據(jù)向某一中心值靠攏的傾向,或表明一組統(tǒng)計數(shù)據(jù)所具有的一般水平。分布集中趨勢的測度值反映的就是數(shù)據(jù)分布的中心值或數(shù)據(jù)一般水平的代表值。眾數(shù)(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)對于未分組數(shù)據(jù),眾數(shù)計算方法: 觀察給定的數(shù)據(jù),某個變量值出現(xiàn)次數(shù)越多,則該變量值即為所求眾數(shù)。對于組距數(shù)據(jù),眾數(shù)計算方法:MO:表示眾數(shù)L:表示眾數(shù)組的下組限
表示眾數(shù)組次數(shù)與前一組次數(shù)之差表示眾數(shù)組次數(shù)與后一組次數(shù)之差i表示眾數(shù)組的組距U:表示眾數(shù)組的上組限(1)確定眾數(shù)所在組(2)采用下面的近似公式計算眾數(shù)下限公式:上限公式:中位數(shù)(median)排序后處于中間位置上的變量值不受極端值的影響未分組數(shù)據(jù)中位數(shù)確定:設一組數(shù)據(jù)為(1)將數(shù)據(jù)排序后為(2)確定中位數(shù)所在位置=(n+1)/2(3)中位數(shù)即為:n奇數(shù)
n偶數(shù)已分組的定序數(shù)據(jù)或單項數(shù)列中位數(shù)的確定(1)確定中位數(shù)的位置=(2)計算各組的累計次數(shù)(或頻數(shù)),確定中位數(shù)組,中位數(shù)所在組稱為中位數(shù)組(3)確定中位數(shù):中位數(shù)所在組的變量值即為中位數(shù)【例】根據(jù)下表中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的中位數(shù)解:中位數(shù)的位置為:
(300+1)/2=150.5從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此
Me=一般表1甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計300—組距數(shù)列中位數(shù)的確定(1)確定中位數(shù)位置=(2)計算各組的累計次數(shù)(或頻數(shù)),確定中位數(shù)組,中位數(shù)所在組稱為中位數(shù)組Me:表示中位數(shù)L:表示中位數(shù)組的下限fm:表示中位數(shù)組的次數(shù)Sm-1:表示從低到高累積至中位數(shù)所在組前一組的累積次數(shù)(3)由公式計算中位數(shù)的近視值下限公式:四分位數(shù)(quartile)排序后處于25%和75%位置上的值不受極端值的影響原始數(shù)據(jù):組距變量數(shù)列:四分位數(shù)(位置的確定)數(shù)值型數(shù)據(jù)的四分位數(shù)(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789
數(shù)值型數(shù)據(jù)的四分位數(shù)(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:1234
5678910
定序數(shù)據(jù)的四分位數(shù)
(算例)【例】根據(jù)下表中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為:
QL位置=(300+1)/4=75.25
上四分位數(shù)(QL)的位置為:
QU位置=(3×301)/4=225.75從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此
QL
=不滿意
QU
=滿意表2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計300—數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算公式)上四分位數(shù):下四分位數(shù):
數(shù)值型分組數(shù)據(jù)的四分位數(shù)
(計算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表3某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】根據(jù)下表中的數(shù)據(jù),計算50名工人日加工零件數(shù)的四分位數(shù)均值(mean)算術平均值,是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)得到的結果集中趨勢的最主要測度值易受極端值的影響簡單算術平均值(simplearithmeticalmean)2.2分布集中趨勢的測度設總體的全部數(shù)據(jù)為:
x1,x2,…,xN總體均值樣本均值設一組樣本數(shù)據(jù)為:
x1,x2,…,xn2.2分布集中趨勢的測度加權算術平均值(weightedarithmeticalmean)設一組數(shù)據(jù)被分為k(K)組各組組中值分別為:x1,x2,…,xk(xK)各組相應的頻數(shù)為:f1,f2,…,fk(fK)總體均值樣本均值2.2分布集中趨勢的測度均值的數(shù)學性質1. 各變量值與均值的離差之和等于零
2.各變量值與均值的離差平方和最小幾何平均數(shù)(geometricmean)
n個變量值連乘積的
n次方根切尾平均值去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值
n
表示變量值的個數(shù);α表示切尾系數(shù),2.2分布集中趨勢的測度眾數(shù)、中位數(shù)和均值的關系左偏分布均值
中位數(shù)
眾數(shù)對稱分布
均值=中位數(shù)=
眾數(shù)右偏分布眾數(shù)
中位數(shù)均值2.2分布集中趨勢的測度眾數(shù)、中位數(shù)、均值的特點和應用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)量較多時應用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應用主要適用于定序數(shù)據(jù)的集中趨勢測度值均值易受極端值影響數(shù)學性質優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應用離散程度數(shù)據(jù)分布的另一個重要特征反映各變量值遠離其中心值的程度,因此也稱為離中趨勢從另一個側面說明了集中趨勢測度值的代表程度離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述內(nèi)距(Inter-QuartileRange,IQR)也稱四分位差上四分位數(shù)與下四分位數(shù)之差:內(nèi)距=Q3
–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響極差(range)適用于數(shù)值型數(shù)據(jù)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值表明各變量值變動的范圍易受極端值影響組距分組數(shù)據(jù)
R
最高組上限-最低組下限總體方差和標準差
(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù):分組數(shù)據(jù):未分組數(shù)據(jù):分組數(shù)據(jù):方差的計算公式標準差的計算公式樣本方差和標準差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):分組數(shù)據(jù):未分組數(shù)據(jù):分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!2.3分布離散程度的測度離散系數(shù)(coefficientofvariation)1.標準差與其相應的均值之比2.測度了數(shù)據(jù)的相對離散程度3.消除了數(shù)據(jù)水平高低和計量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較 離散系數(shù)大,數(shù)據(jù)離散程度大。離散系數(shù)小,說明數(shù)據(jù)的離散程度小5.計算公式為2.4分布偏態(tài)與峰度的測度偏態(tài)的概念偏態(tài)是對分布偏斜方向及程度的測度偏態(tài)系數(shù)(skewnesscoefficient)根據(jù)原始數(shù)據(jù)計算 根據(jù)分組數(shù)據(jù)計算偏態(tài)系數(shù)的取值:SK=0對稱SK<0左偏
SK>0右偏|SK|>1高度偏斜程度
0.5<|SK|<1中等偏斜程度
|SK|越接近于0,偏斜程度越小峰度及其測度峰度是對數(shù)據(jù)分布平峰或尖峰程度的測度。峰度通常是與標準正態(tài)分布相比較而言的。峰度系數(shù)用K來表示正態(tài)分布的峰態(tài)系數(shù)=0峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布根據(jù)分組數(shù)據(jù)計算第3章概率、概率分布與抽樣分布3.1事件及其概率3.2隨機變量及其概率分布3.3常見的抽樣方法3.4抽樣分布3.5中心極限定理的應用隨機變量——某次試驗結果的數(shù)值性描述取值是隨機的,事先不能確定取哪一個值根據(jù)取值特點的不同,可分為:離散型隨機變量和連續(xù)型隨機變量離散型隨機變量隨機變量X的所有可能是有限個或無限可數(shù)個時以確定的概率取這些不同的值連續(xù)型隨機變量隨機變量X取無限個值隨機變量的數(shù)學期望3.2隨機變量及其概率分布又稱均值描述隨機變量取值的集中程度或平均程度離散型隨機變量X的數(shù)學期望:相當于所有可能取值以概率為權數(shù)的平均值連續(xù)型隨機變量X的數(shù)學期望:隨機變量的方差方差是每一個隨機變量取值與期望值的離差平方的期望值,記為D(x)或σ2公式:離散型隨機變量的方差:連續(xù)型隨機變量的方差:3.2隨機變量及其概率分布正態(tài)分布的均值和標準差均值E(X)=μ方差D(X)=σ2
標準正態(tài)分布μ=0,σ=1的正態(tài)分布,記為N(0,1)X~N(μ,σ2),則:Z~N(0,1
)標準化標準化概率抽樣(probabilitysampling)(一)概率抽樣概述根據(jù)一個已知的概率來抽取樣本單位,也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率(二)簡單隨機抽樣(simplerandomsampling)從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個單位都有相同的機會(概率)被抽中2、抽取元素的具體方法有重復抽樣和不重復抽樣(三)分層抽樣(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本單位(四)系統(tǒng)抽樣(systematicsampling)將總體各單位按某種順序排列,并按某種規(guī)則確定一個隨機起點,然后每個一定的間隔抽取一個單位,直至抽取n個單位形成一個樣本(五)整群抽樣(clustersampling)調查時先將總體劃分成若干群,從中抽取部分群,進而對抽中的各個群中所包含的所有個體單位進行調查或觀察為了調查某校學生的購書費用支出,從全校抽取4個班級的學生進行調查,這種調查方法是將全校學生的名單按拼音順序排列后,每隔50名學生抽取一名學生進行調查,這種調查方法是抽樣分布(samplingdistribution)1.樣本統(tǒng)計量是隨機變量2.抽樣分布就是樣本統(tǒng)計量的概率分布樣本均值的抽樣分布(一)樣本均值的抽樣分布的概述1.樣本均值的概率分布(二)總體分布為正態(tài)分布N(μ,σ2)時的樣本均值的抽樣分布 假設從服從正態(tài)分布N(μ,σ2)的總體隨機抽取一個容量為n的樣本,那么樣本均值
的抽樣分布仍為正態(tài)分布,且樣本均值的數(shù)學期望
,方差
(三)假設從均值為μ,標準差為σ的一個不服從正態(tài)分布的總體中抽取一個容量為n的樣本,那么中心極限定理(centrallimittheorem):設從均值為
,方差為
2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布注意:
如果被抽樣的總體是無限總體或者抽樣的方式為重復抽樣,那么方差為σ2/n就是精確的。
如果被抽樣總體為有限總體且抽樣的方式為非重復抽樣,當總體容量比樣本容量大的多(一般來說,二者相差至少20倍)時,那么方差為σ2/n就是近似成立的。(四)樣本均值的數(shù)學期望與方差1.樣本均值的數(shù)學期望2.樣本均值的方差重復抽樣:不重復抽樣:【例】解:解:解:四、樣本比率的抽樣分布從總體中抽取容量為n的樣本,當n足夠大時(即nπ≥5,n(1-π)≥5),樣本比例p的抽樣分布可用正態(tài)分布近似1.樣本比率的數(shù)學期望2.樣本比率的方差重復抽樣:不重復抽樣:五、樣本方差的分布當總體
,從中抽取容量為n的樣本,則4.2一個總體參數(shù)的區(qū)間估計二、總體比率的區(qū)間估計1. 假定條件當樣本容量充分大,即np≥5,n(1-p)≥5時,可以由正態(tài)分布來近似2.使用正態(tài)分布統(tǒng)計量z3.總體比率
在1-置信水平下的置信區(qū)間為總體比率的區(qū)間估計
(例題分析)【例】某城市想要估計下崗職工中女性所占的比率,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比率的置信區(qū)間解:已知n=100,p=65%,np=65≥5,n(1-p)=35≥5,1-=95%,z/2=z0.025=1.96該城市下崗職工中女性比率的置信區(qū)間為55.65%~74.35%
二、估計總體比例時樣本容量的確定根據(jù)比率區(qū)間估計公式可得樣本容量n為4.4
樣本容量的確定E的取值一般小于0.1未知時,用樣本比率代替其中:估計總體比率時樣本容量的確定
(例題分析)【例】根據(jù)以往的生產(chǎn)統(tǒng)計,某種產(chǎn)品的合格率約為90%,現(xiàn)要求允許誤差為5%,在求95%的置信區(qū)間時,應抽取多少個產(chǎn)品作為樣本?解:已知
=90%,=0.05,z/2=z0.025=1.96,E=5%
應抽取的樣本容量為
應抽取139個產(chǎn)品作為樣本5.1假設檢驗的基本原理假設檢驗的步驟1.陳述原假設和備擇假設2.確定顯著性水平α3.選擇適當?shù)臋z驗統(tǒng)計量4.確定決定是否拒絕原假設的法則5.收集樣本數(shù)據(jù)并計算檢驗統(tǒng)計量的值6.用檢驗統(tǒng)計量的值和臨界值法則決定是否拒絕原假設5.1假設檢驗的基本原理假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m
=m0H0:m
m0H0:m
m0備擇假設H1:m
≠m0H1:m
<m0H1:m
>m0假設檢驗的基本形式總體均值的檢驗
(大樣本)1.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年高級會計實務與操作訓練題目
- 2026年新媒體運營與策劃專業(yè)知識測試題集
- 2025至2030中國零售業(yè)線上線下融合與消費行為研究報告
- 2026年新能源汽車原理及駕駛安全要點試題
- 2026一季度浙商銀行深圳分行社會招聘備考考試題庫及答案解析
- 鋼鐵廠安全生產(chǎn)試題及答案
- 法醫(yī)學期末考試題及答案
- 2026陜西西安市長安區(qū)村鎮(zhèn)建設管理站公益性崗位招聘8人備考考試試題及答案解析
- 2026年體育訓練與運動技能掌握測試題
- 電工一級試題及答案
- 叉車初級資格證考試試題與答案
- 2025年中國醫(yī)學科學院研究所招聘面試高頻問題答案與解析
- 2025至2030中國新癸酸縮水甘油酯行業(yè)發(fā)展研究與產(chǎn)業(yè)戰(zhàn)略規(guī)劃分析評估報告
- 剪映完整課件
- DB32∕T 310026-2024 雷電防護裝置檢測部位及檢測點確認技術規(guī)范
- 2025新能源集控中心規(guī)范化管理導則
- 2025屆新疆烏魯木齊市高三下學期三模英語試題(解析版)
- 混動能量管理與電池熱管理的協(xié)同優(yōu)化-洞察闡釋
- T-CPI 11029-2024 核桃殼濾料標準規(guī)范
- 統(tǒng)編版語文三年級下冊整本書閱讀《中國古代寓言》推進課公開課一等獎創(chuàng)新教學設計
- 2025年江蘇省蘇州市初三上學期物理期末陽光調研測試卷及答案
評論
0/150
提交評論