版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)數(shù)據(jù)的采集
第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的來源
一、統(tǒng)計(jì)數(shù)據(jù)直接來源
統(tǒng)計(jì)數(shù)據(jù)的直接來源是指通過專門組織的調(diào)查和科學(xué)實(shí)驗(yàn)搜集數(shù)據(jù)??茖W(xué)實(shí)驗(yàn)是取得自然科學(xué)數(shù)據(jù)的主要手段,如醫(yī)學(xué)、生物學(xué)等的數(shù)據(jù)都是通過實(shí)驗(yàn)和觀察取得的。數(shù)據(jù)來源
數(shù)據(jù)來源第一手資料實(shí)驗(yàn)法調(diào)查觀察出版物第二手資料(一)統(tǒng)計(jì)調(diào)查的意義和要求
統(tǒng)計(jì)調(diào)查是指根據(jù)統(tǒng)計(jì)研究的目的和要求,利用各種統(tǒng)計(jì)調(diào)查的方式方法,搜集統(tǒng)計(jì)資料的工作過程。統(tǒng)計(jì)調(diào)查作為統(tǒng)計(jì)工作的第二個(gè)階段,在統(tǒng)計(jì)工作的整個(gè)過程中,擔(dān)負(fù)著提供基礎(chǔ)資料的任務(wù),對(duì)統(tǒng)計(jì)資料的搜集,要求做到準(zhǔn)確、及時(shí)和完整。(二)統(tǒng)計(jì)調(diào)查的種類社會(huì)經(jīng)濟(jì)現(xiàn)象錯(cuò)綜複雜,根據(jù)不同的調(diào)查目的,需要採取不同的統(tǒng)計(jì)調(diào)查方式方法。統(tǒng)計(jì)調(diào)查的常見分類有:是否包括全部調(diào)查單位調(diào)查資料登記時(shí)間是否具有連續(xù)性全面調(diào)查:
對(duì)調(diào)查對(duì)象中的全部單位一一加以調(diào)查。非全面調(diào)查:
對(duì)調(diào)查對(duì)象中的部分單位進(jìn)行調(diào)查。經(jīng)常性調(diào)查:隨著調(diào)查對(duì)象的變化而進(jìn)行的經(jīng)常地、連續(xù)不斷地登記調(diào)查。一次性調(diào)查:是間隔一段時(shí)間對(duì)調(diào)查對(duì)象進(jìn)行的登記調(diào)查。資料搜集的方法不同調(diào)查的組織方式不同統(tǒng)計(jì)報(bào)表:按一定的表式和要求,自上而下統(tǒng)一佈置,自下而上上報(bào)統(tǒng)計(jì)資料的一種統(tǒng)計(jì)調(diào)查方式方法專門調(diào)查:是為了研究某些專門問題,由進(jìn)行調(diào)查的單位專門組織的調(diào)查直接觀察法採訪法報(bào)告法問卷法統(tǒng)計(jì)報(bào)表分類調(diào)查範(fàn)圍不同報(bào)送週期長短不同報(bào)送方式不同填報(bào)單位和程式的不同全面的統(tǒng)計(jì)報(bào)表非全面的統(tǒng)計(jì)報(bào)表。日?qǐng)?bào)旬報(bào)月報(bào)半年報(bào)年報(bào)郵寄報(bào)表電訊報(bào)表基層報(bào)表綜合報(bào)表。電話電報(bào)傳真二、統(tǒng)計(jì)數(shù)據(jù)的間接來源
統(tǒng)計(jì)數(shù)據(jù)的間接來源是指對(duì)次級(jí)資料的搜集,即第二手資料的搜集。一般是搜集公開出版或公開報(bào)導(dǎo)的數(shù)據(jù)。一、統(tǒng)計(jì)調(diào)查方案的設(shè)計(jì)(一)統(tǒng)計(jì)目的統(tǒng)計(jì)調(diào)查中,首先要明確調(diào)查目的,既通過調(diào)查要解決什麼問題。(二)調(diào)查對(duì)象、調(diào)查個(gè)體單位和報(bào)告單位
調(diào)查對(duì)象又稱調(diào)查總體,是我們所要研究事物的整體。
調(diào)查個(gè)體單位就是調(diào)查對(duì)象範(fàn)圍內(nèi)的各個(gè)個(gè)體單位。
報(bào)告單位又稱填報(bào)單位,它是負(fù)責(zé)填報(bào)調(diào)查資料的單位。第二節(jié)統(tǒng)計(jì)調(diào)查方案與問卷設(shè)計(jì)(三)調(diào)查專案和調(diào)查表1.調(diào)查專案調(diào)查專案就是進(jìn)行調(diào)查時(shí)向調(diào)查單位需要調(diào)查的問題。一般來說有多少個(gè)問題,便有多少個(gè)調(diào)查專案。調(diào)查專案應(yīng)該注意的事項(xiàng):(1)調(diào)查專案應(yīng)當(dāng)是調(diào)查目的所必需的,可有可無的專案不應(yīng)列入。(2)調(diào)查專案應(yīng)有確切的答案,還要明確答案形式,諸如文字式、數(shù)字式等。(3)調(diào)查專案提法應(yīng)設(shè)法避免出現(xiàn)歧義或減少被調(diào)查者的抵觸情緒或思想顧慮。(4)調(diào)查專案的提法不能帶有傾向性。(5)調(diào)查專案之間應(yīng)盡可能做到互相聯(lián)繫,便於核對(duì)答案的準(zhǔn)確性。2.調(diào)查表調(diào)查表類型單一表:在一張表格上只登記一個(gè)調(diào)查單位的資料,可以容納較多的調(diào)查專案。一覽表:在一張表上登記若干個(gè)調(diào)查單位的資料,調(diào)查的專案不能過多。
調(diào)查表制定以後,為了保證調(diào)查資料的科學(xué)性和統(tǒng)一性,需要編寫填表說明和指標(biāo)解釋。
(四)調(diào)查時(shí)間和調(diào)查地點(diǎn)調(diào)查時(shí)間包括調(diào)查資料所屬的時(shí)間和調(diào)查期限。
1.調(diào)查資料所屬的時(shí)間。時(shí)期資料指事物在某一時(shí)期內(nèi)發(fā)展過程的總量。例如,總產(chǎn)值、總產(chǎn)量
時(shí)點(diǎn)資料是指事物在某一時(shí)點(diǎn)上的水準(zhǔn)。例如,工人數(shù)、商品庫存量、耕地面積等
2.調(diào)查期限。
調(diào)查期限是指調(diào)查工作的起止時(shí)間。包括搜集資料和報(bào)送資料的整個(gè)工作所需的時(shí)間。
調(diào)查地點(diǎn)是指登記調(diào)查資料的地點(diǎn)。在一般情況下,調(diào)查地點(diǎn)和調(diào)查單位所在地點(diǎn)是一致的。(五)調(diào)查方式根據(jù)調(diào)查目的的不同,採取不同的調(diào)查方式。具體採用哪種調(diào)查方式,主要考慮人員、時(shí)間和經(jīng)費(fèi)等條件。一般來說,能夠通過非全面調(diào)查解決的問題,不要進(jìn)行全面調(diào)查。(六)制定調(diào)查的組織實(shí)施計(jì)畫一、建立調(diào)查隊(duì)伍;二、調(diào)查人員的組織和培訓(xùn);三、經(jīng)費(fèi)的預(yù)算和開支辦法;四、試點(diǎn)調(diào)查。二、調(diào)查問卷設(shè)計(jì)
(一)調(diào)查問卷的組織結(jié)構(gòu)調(diào)查問卷:一種特殊形式的調(diào)查表。
特點(diǎn):在表中用一系列按照嚴(yán)密邏輯結(jié)構(gòu)組成的問題,向被調(diào)查者調(diào)查具體事實(shí)和個(gè)人對(duì)某問題的反應(yīng)、看法,它不要求被調(diào)查者填寫姓名。
組成部分:
眉頭部分、說明詞/開場白、篩選/過濾部分、主體部分、背景質(zhì)料部分和結(jié)束語
1.眉頭部分
問卷的最開端。一般由問卷名稱、問卷編號(hào)、調(diào)查組織名稱、城市編號(hào)、訪問員、問卷復(fù)核人等資訊組成。2.說明詞
說明詞也就是開場白。包括問候語、調(diào)查主題、調(diào)查組織、調(diào)查員身份、調(diào)查用途、調(diào)查請(qǐng)求以及其他資訊,如承諾調(diào)查的保密性。3.篩選/過濾部分
這部分主要是為了選擇符合要求的調(diào)查個(gè)體單位而設(shè)。4.主體部分
主體部分是調(diào)查問卷的核心,它通常由主題問句和備選答案兩部分構(gòu)成。
常見的問句形式和要求具體如下:開放式問句即提出問題,由被調(diào)查者自由回答,不受限制,在問卷中不宜多用。對(duì)選式問句這類問句要求被調(diào)查者在兩個(gè)可能的答案中選擇一個(gè)。多項(xiàng)選擇式問句即列舉幾個(gè)可能的答案,由被調(diào)查者選出最符合自己情況和意見的一個(gè)答案。順位式問句即列出對(duì)某一問題不同層次的答案,由被調(diào)查者排出次序,表示自己的態(tài)度和傾向。5.背景質(zhì)料部分
背景資料主要是一些人文資訊,一般包括調(diào)查個(gè)體單位的性別、年齡、婚姻狀況、家庭人數(shù)、家庭或個(gè)人收入、職業(yè)等資訊。這部分一般放在問卷的最後。6.結(jié)束語
結(jié)束語的任務(wù)就是告訴被調(diào)查者調(diào)查問卷結(jié)束,調(diào)查完畢了。(二)調(diào)查問卷設(shè)計(jì)的基本要求
主題明確,形式簡明,文字通俗,容易理解,便於回答三、量表設(shè)計(jì)(一)量表的含義
量表是由反映某一抽象概念的所有測量指標(biāo)和備選答案構(gòu)成的調(diào)查表。
量表是由相互關(guān)聯(lián)的指標(biāo)或題目構(gòu)成,所以,指標(biāo)的選擇至關(guān)重要,在選擇指標(biāo)時(shí)應(yīng)注意以下幾點(diǎn)。
第一,構(gòu)成量表的指標(biāo)個(gè)數(shù)應(yīng)適當(dāng)
第二,構(gòu)成量表的指標(biāo)的測量層次選擇應(yīng)適當(dāng)(二)量表的種類
1.根據(jù)測量尺度不同可將量表分為類別量表、順序量表、等距量表和等比量表(1)類別量表。類別量表是指由定類尺度指標(biāo)構(gòu)成的量表。(2)順序量表。順序量表是指由定序尺度指標(biāo)構(gòu)成的量表。(3)等距量表。等距量表也稱區(qū)間量表,是由定距尺度指標(biāo)構(gòu)成的量表。(4)等比量表。等比量表是由定比尺度指標(biāo)構(gòu)成的量表。2.根據(jù)答案數(shù)量的多少可分為五級(jí)量表、七級(jí)量表、九級(jí)量表等3.根據(jù)反映測量對(duì)象的特徵多少可以將量表分為一維量表和多維量表(三)量表設(shè)計(jì)中應(yīng)注意的問題1.量級(jí)層次的個(gè)數(shù)2.平衡量表與非平衡量表3.奇數(shù)層次量表與偶數(shù)層次量表4.量表的形式第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的採集方法一、統(tǒng)計(jì)報(bào)表(一)統(tǒng)計(jì)報(bào)表的概念
統(tǒng)計(jì)報(bào)表是我國取得統(tǒng)計(jì)資料的一種基本的組織形式。它是基層企業(yè)、事業(yè)單位以及各級(jí)領(lǐng)導(dǎo)機(jī)關(guān),按照國家有關(guān)部門統(tǒng)一規(guī)定的報(bào)表格式、報(bào)告內(nèi)容、報(bào)送時(shí)間和程式等,自下而上報(bào)送報(bào)表的一種調(diào)查方式。(二)統(tǒng)計(jì)報(bào)表的特點(diǎn)
數(shù)據(jù)準(zhǔn)確、報(bào)送及時(shí)、便於匯總:內(nèi)容比較固定,不能及時(shí)地反映新情況、新問題。
二、普查(一)普查的概念普查是為了某一特定目的而專門組織的一次性全面調(diào)查,如人口普查、工業(yè)普查、農(nóng)業(yè)普查等。(二)普查的特點(diǎn)普查通常是一次性的或週期性的普查需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間普查的數(shù)據(jù)比較準(zhǔn)確普查的成本高、時(shí)間才長三、抽樣調(diào)查(一)抽樣調(diào)查的概念
抽樣調(diào)查是實(shí)際中應(yīng)用最廣泛的一種調(diào)查方式和方法,它是從調(diào)查對(duì)象的總體中隨機(jī)抽取一部分單位做為樣本進(jìn)行調(diào)查,並根據(jù)樣本調(diào)查結(jié)果來推斷總體數(shù)量特徵的一種非全面調(diào)查。(二)抽樣調(diào)查的特點(diǎn):經(jīng)濟(jì)性,時(shí)效性,適應(yīng)性,準(zhǔn)確性四、重點(diǎn)調(diào)查(一)重點(diǎn)調(diào)查的概念
重點(diǎn)調(diào)查在調(diào)查總體中,選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,以瞭解總體基本情況的一種非全面調(diào)查。所謂重點(diǎn)單位,是指調(diào)查單位的標(biāo)誌總量在總體標(biāo)誌總量中占絕大比重的個(gè)體單位。
(二)應(yīng)用重點(diǎn)調(diào)查的條件:第一,調(diào)查的任務(wù)只要求掌握調(diào)查總體的基本情況。第二,在調(diào)查總體中,確實(shí)存在著重點(diǎn)單位。
五、典型調(diào)查(一)典型調(diào)查的概念
典型調(diào)查是根據(jù)調(diào)查目的和要求,在對(duì)調(diào)查對(duì)象進(jìn)行初步分析的基礎(chǔ)上,有意識(shí)的選取少數(shù)具有代表性的典型單位進(jìn)行深入細(xì)緻的調(diào)查研究,藉以認(rèn)識(shí)同類事物的發(fā)展變化規(guī)律及本質(zhì)的一種非全面調(diào)查。
(二)典型調(diào)查的特點(diǎn)
1.有意識(shí)地選擇調(diào)查單位。
2.對(duì)於推廣新生事物,總結(jié)經(jīng)驗(yàn)具有重要作用。
3.調(diào)查內(nèi)容靈活性。
假設(shè)檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)的基本原理
一﹑假設(shè)檢驗(yàn)的基本思想
假定某人拿著裝有100個(gè)球的袋子,並說:“袋中的球99個(gè)是白色的而只有1個(gè)是黑色的”。如果從袋中任摸一個(gè)球竟是黑球,我們自然會(huì)覺得這個(gè)人的說法不可靠。
判斷的理論依據(jù):假設(shè)檢驗(yàn)的理論依據(jù)是小概率事件原理。所謂小概率事件原理是:小概率事件(即概率很小的事件)在一次試驗(yàn)中幾乎是不可能發(fā)生的。
推理的思想方法:當(dāng)對(duì)總體所做的某一假設(shè)成立時(shí),事件A是一個(gè)小概率事件,則按小概率事件原理在一次試驗(yàn)中事件A幾乎是不可能發(fā)生的。現(xiàn)在進(jìn)行一次試驗(yàn),如果在這一試驗(yàn)中事件A竟然發(fā)生了,則按小概率事件原理這是不合理的,於是拒絕原來的假設(shè)。
基本思想小概率原理:如果對(duì)總體的某種假設(shè)是真實(shí)的,那麼不利於或不能支持這一假設(shè)的事件A(小概率事件)在一次試驗(yàn)中幾乎不可能發(fā)生的;要是在一次試驗(yàn)中A竟然發(fā)生了,就有理由懷疑該假設(shè)的真實(shí)性,拒絕這一假設(shè)??傮w(某種假設(shè))抽樣樣本(觀察結(jié)果)檢驗(yàn)(接受)(拒絕)小概率事件未發(fā)生小概率事件發(fā)生【例6-1】某車間用一臺(tái)包裝機(jī)包裝某食品,額定標(biāo)準(zhǔn)為每袋淨(jìng)重200克。根據(jù)經(jīng)驗(yàn)知道這種食品的每袋淨(jìng)重服從正態(tài)分佈,標(biāo)準(zhǔn)差是2.2克。為了檢驗(yàn)包裝機(jī)是否正常,每日開工後都要抽樣檢驗(yàn)。某日開工後隨機(jī)抽測了9袋,淨(jìng)重如下(單位:克):198.1197.3201.2198.4197.6196.4199.1200.4200.2試問該日包裝機(jī)工作是否正常?綜合上述,可歸納出假設(shè)檢驗(yàn)問題的基本步驟:
(1)提出假設(shè):原假設(shè)H0及備擇假設(shè)H1(2)選擇適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,並指出H0成立時(shí)該檢驗(yàn)統(tǒng)計(jì)量所服從的抽樣分佈
(3)根據(jù)給定的顯著性水準(zhǔn),查表確定相應(yīng)的臨界值,並建立相應(yīng)的小概率事件,
(4)根據(jù)樣本觀察值計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值
(5)將檢驗(yàn)統(tǒng)計(jì)量的值與臨界值比較,當(dāng)檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域時(shí)拒絕H0而接受H1;否則不能拒絕H0,可接受H0。
需要注意的是:在每一次假設(shè)檢驗(yàn)的考察中,當(dāng)我們?cè)跇颖举Y訊的基礎(chǔ)上接受一個(gè)假設(shè)時(shí),實(shí)際上是沒有統(tǒng)計(jì)證據(jù)去拒絕它,這並不是說原假設(shè)是真實(shí)的,這時(shí)由於沒有拒絕它的證據(jù),只好把它當(dāng)作是真實(shí)的。惟一證明原假設(shè)的方法是要知道總體參數(shù)是什麼,那是不可能用抽樣方法求得的。二、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤
假設(shè)檢驗(yàn)是通過對(duì)樣本數(shù)據(jù)的分析來進(jìn)行的,由於有抽樣誤差的風(fēng)險(xiǎn),所以就會(huì)產(chǎn)生兩種類型的錯(cuò)誤。1. 第一類錯(cuò)誤棄真錯(cuò)誤,表示為:P(拒絕H0/H0正確)=
後果往往嚴(yán)重出現(xiàn)第一類錯(cuò)誤的概率為
2. 第二類錯(cuò)誤取偽錯(cuò)誤,表示為:P(接受H0/H0不正確)=
出現(xiàn)第二類錯(cuò)誤的概率為
對(duì)於一定的樣本量n,不能同時(shí)做到減小犯這兩種錯(cuò)誤的概率。如果減小第一類錯(cuò)誤的概率a
,就會(huì)增大第二類錯(cuò)誤的概率;如果減小第二類錯(cuò)誤的概率,則會(huì)增大第一類錯(cuò)誤的概率a。所以,通常人們只對(duì)犯第一類錯(cuò)誤的概率a
加以限制。三、雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)下麵以一個(gè)燈泡廠生產(chǎn)的燈泡平均使用壽命為例。1.雙側(cè)檢驗(yàn)(也稱雙尾檢驗(yàn))產(chǎn)品的使用壽命是1000小時(shí)嗎?H0:
=1000
H1:
10002.左側(cè)檢驗(yàn)產(chǎn)品的使用壽命到達(dá)1000小時(shí)的要求嗎?H0:
1000
H1:
<
10003.右側(cè)檢驗(yàn)新產(chǎn)品的使用壽命比以往的1000小時(shí)有顯著提高嗎?
H0:
1000
H1:
1000下麵為雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)示意圖:假設(shè)檢驗(yàn)就是根據(jù)樣本觀察結(jié)果對(duì)原假設(shè)H0進(jìn)行檢驗(yàn),接受H0,就否定H1;拒絕H0,就接受H1。雙側(cè)檢驗(yàn)示意圖左側(cè)檢驗(yàn)示意圖右側(cè)檢驗(yàn)示意圖注意:雙側(cè)檢驗(yàn)的原假設(shè)中,總體參數(shù)只取一個(gè)值,而單側(cè)檢驗(yàn)的原假設(shè)通常給出參數(shù)的一個(gè)取值區(qū)間。在理論上,單側(cè)檢驗(yàn)時(shí),我們應(yīng)對(duì)每個(gè)假設(shè)的參數(shù)值進(jìn)行檢驗(yàn)。而實(shí)際上,我們一般只完成在相等點(diǎn)上的檢驗(yàn),並且可以證明,如果我們?cè)谙嗟赛c(diǎn)上否定了H0,則在原假設(shè)所含的任何點(diǎn)上也將否定H0。因此,原假設(shè)應(yīng)包括等號(hào)。四、原假設(shè)與備擇假設(shè)的建立確定原假設(shè)和備擇假設(shè)在假設(shè)檢驗(yàn)中非常重要,它直接關(guān)係到檢驗(yàn)的結(jié)論。以下幾點(diǎn)可供參考:1、通常成立的情況作為原假設(shè),其相反作為備擇假設(shè)。2、關(guān)心某一情況是否發(fā)生作為備擇假設(shè),其相反作為原假設(shè)。3、等號(hào)在原假設(shè)中。總體均值的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0
(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μ正態(tài)總體σ2已知nxZsm0-=zz0z0aZ-aZ第二節(jié)幾種常見的假設(shè)檢驗(yàn)例5-1:設(shè)我國出口鳳尾魚罐頭,標(biāo)準(zhǔn)規(guī)格是每罐淨(jìng)重250克,根據(jù)以往經(jīng)驗(yàn),標(biāo)準(zhǔn)差是3克?,F(xiàn)在某食品廠生產(chǎn)一批供出口用的這種罐頭,從中抽取100罐檢驗(yàn),其平均淨(jìng)重是251克。假定罐頭重量服從正態(tài)分佈,規(guī)定顯著性水準(zhǔn)=0.05,問這批罐頭是否合乎出口標(biāo)準(zhǔn),即淨(jìng)重確為250克?
假設(shè):H0:
=250,H1:
≠250
由於罐頭重量服從正態(tài)分佈,在H0成立時(shí),~N(0,1)
=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.96,==3.33
=3.33>=1.96,則拒絕原假設(shè)H0,接受H1,故認(rèn)為罐頭的淨(jìng)重偏高,這批罐頭不合乎出口標(biāo)準(zhǔn)。
已知使P(|Z|≥1.96)=0.05,建立的小概率事件是|Z|≥1.96)。根據(jù)樣本觀察值計(jì)算得
Z==
因?yàn)閆=解:由題中得知=250,=3,n=100,=251,根據(jù)這一問題的具體情況,食品罐頭所以要規(guī)定一定的淨(jìng)重是為了保障買賣雙方的合理經(jīng)濟(jì)利益?,F(xiàn)在規(guī)定淨(jìng)重為250克,當(dāng)淨(jìng)重遠(yuǎn)遠(yuǎn)超過250克時(shí),工廠生產(chǎn)成本增加,賣方吃虧;當(dāng)淨(jìng)重遠(yuǎn)遠(yuǎn)低於250克時(shí),買方如果接受了這批罐頭就會(huì)吃虧。所以要求罐頭不過於偏重或偏輕。例5-2:設(shè)某機(jī)械製造公司需要進(jìn)口一種抗高溫的工具鋼,規(guī)格是平均抗溫不低於600℃。根據(jù)以往的經(jīng)驗(yàn),抗高溫近似服從正態(tài)分佈,標(biāo)準(zhǔn)差是80℃?,F(xiàn)在進(jìn)口一批新貨。抽取100件為樣本,測定其平均抗高溫為580℃。問應(yīng)否接受這批貨物(=0.05)?
使P(Z<-1.645)=0.05,建立的小概率事件是(Z<-1.645)。解:已知=600℃,=80,n=100,=580,在這裏我們所關(guān)心的是這批貨平均抗高溫是否低於600℃,若低於600℃,就不符合規(guī)格要求了,因此提出假設(shè):H0:≥600,H1:<600在H0成立時(shí)Z==~N(0,1)由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得=1.645,由於是左側(cè)檢驗(yàn),所以臨界值為-=-1.645,根據(jù)樣本觀察值計(jì)算得Z===-2.5因?yàn)閆=-2.5<-=-1.645,則拒絕原假設(shè)H0,接受H1,故認(rèn)為這批鋼平均抗高溫低於600℃,應(yīng)當(dāng)拒絕接受這批貨物??傮w均值的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0
(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μ正態(tài)總體σ2未知(n<30)nsxt0m-=tt0t00atat-例5-3:某地區(qū)居民月收入服從正態(tài)分佈,現(xiàn)隨機(jī)抽取10戶家庭,得到他們的月收入分別為3640元、2800元、500元、382元、366元、350元、360元、320元、290元、250元,能否認(rèn)為該地區(qū)居民的平均月收為920元(=0.05)。
解:居民月收入X-N,未知,=920,由樣本資料計(jì)算得=925.8,S=1226.99依題意提出假設(shè)H0:=920,
H1:=~t(9)≠920在H0成立時(shí)t=根據(jù)樣本觀察值計(jì)算得
t==0.1444=因?yàn)閨t|=0.1444<=2.2622,則接受原假設(shè)H0,故可認(rèn)為該地區(qū)居民的月平均收入為920元。
由使P(|t|≥2.2622)=0.05,建立的小概率事件是(|t|≥2.2622)。
=0.05,查自由度為9的t分佈表得臨界值
=2.2622,例5-4:某汽車輪胎廠聲稱,該廠一等品輪胎的平均壽命在一定的重量和正常行駛條件下超過25000公里。對(duì)一個(gè)由15個(gè)輪胎組成的隨機(jī)樣本進(jìn)行試驗(yàn),得到的平均值和標(biāo)準(zhǔn)差分別為27000公里和5000公里。假定輪胎壽命近似服從正態(tài)分佈,試問是否有充分理由相信產(chǎn)品同廠家所說的標(biāo)準(zhǔn)相符?(=0.05)
解:已知=25000,n=15,
=27000,S=5000,在這裏我們所關(guān)心的是該廠一等品輪胎的平均壽命是否真的超過25000公里,因此提出假設(shè):>25000H0:≤25000,
H1:在H0成立時(shí)t==~t(14)=0.05,查自由度為14的t分佈表得臨界值=1.7613,由使p(
>1.7613)=0.05,建立的小概率事件是(>1.7613)。根據(jù)樣本觀察值計(jì)算得t===1.55
因?yàn)閠=1.55<=1.7613,則接受原假設(shè)H0,故沒有充分的理由相信廠家所說的標(biāo)準(zhǔn)與實(shí)際相符??傮w均值的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0
(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μ非正態(tài)總體n≥30σ2已知或未知nxZsm0-=nSxZ0m-=zz0z00aZ-aZ例5-5:設(shè)有一所醫(yī)院大量使用一種藥物的特定包裝劑量,這種藥物的單裝劑量是100亳升(ml)。這種藥的特點(diǎn)是服多了無害,而服藥劑量不足則達(dá)不到預(yù)期的藥效,甚至?xí)蓴_病人的治療進(jìn)程。醫(yī)院按它的需要從同一藥廠購買這種藥物已有多年,並知道總體標(biāo)準(zhǔn)差是2ml。醫(yī)院從很大一批到貨中隨機(jī)檢查了50個(gè)包裝,發(fā)現(xiàn)它們的平均劑量是99.75ml,試問這批到貨的劑量是否小於100ml?(=0.1)=100,=2,n=50,=99.75,在這裏我們所關(guān)心的是這批貨的劑量是否小於100ml,因此提出假設(shè):解:已知H0:
=100,
H1:<100
在H0成立時(shí)Z==近似服從N(0,1)=0.1,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得=1.28,由於是左側(cè)檢驗(yàn),所以臨界值為-=-1.28,使P(Z<-1.28)=0.1,建立的小概率事件是(Z<-1.28)。
由根據(jù)樣本觀察值計(jì)算得Z===-0.883因?yàn)閆=-0.883>-=-1.28,則接受H0,故可以認(rèn)為這批到貨的劑量不小於100ml。例5-6:某房地產(chǎn)經(jīng)紀(jì)人宣稱某鄰近地區(qū)房屋的平均價(jià)值低於480000元。從40間房屋組成的一個(gè)樣本得出的平均價(jià)值為450000元,標(biāo)準(zhǔn)差為120000元。問這些數(shù)據(jù)是否支持這位經(jīng)紀(jì)人的說法?(=0.05)=480000,n=40,=450000,S=120000,在這裏我們所關(guān)心的是房屋的平均價(jià)值是否真的低於480000元,因此提出假設(shè):解:已知H0:
≥480000,H1:<480000在H0成立時(shí)Z==近似服從N(0,1)=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得
由
=1.645,由於是左側(cè)檢驗(yàn),所以臨界值為-
=-1.645,使P(Z<-1.645)=0.05,建立的小概率事件是(Z<-1.645)。
根據(jù)樣本觀察值計(jì)算得Z===-1.581因?yàn)閆=-1.581>-=-1.645,則接受H0,故可以認(rèn)為這些數(shù)據(jù)不能支持該經(jīng)紀(jì)人的說法。兩個(gè)總體均值之差的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:μ1=μ2H1:μ1≠μ2
(2)H0:μ1≤μ2
H1:μ1
>μ2
(3)H0:μ1≥μ2
H1:μ1
<μ2
兩個(gè)正態(tài)總體已知22,s21szz0z00aZaZ-Z=例5-7:有兩種方法可用於製造某種產(chǎn)品。經(jīng)驗(yàn)表明,這兩種方法生產(chǎn)的產(chǎn)品抗拉強(qiáng)度都近似服從正態(tài)分佈。方法1和方法2的標(biāo)準(zhǔn)差分別為3公斤和4公斤。從方法1和方法2生產(chǎn)的產(chǎn)品中分別抽取10個(gè)和14個(gè)產(chǎn)品。所得樣本均值分別為20公斤和17公斤。試問這兩種方法生產(chǎn)的產(chǎn)品的平均抗拉強(qiáng)度是否不同(=0.05)?
使P(|Z|≥1.96)=0.05,建立的小概率事件是(|Z|≥1.96)。解:已知=20,=17,=3,=4,=10,=14,依題意提出假設(shè):H0:
,
H1:或H0:=0,H1:≠0在H0成立時(shí)Z==~N(0,1)由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.96,
根據(jù)樣本觀察值計(jì)算得Z===2.1因?yàn)閨Z|=2.1>=1.96,則拒絕原假設(shè)H0,接受H1,故可以認(rèn)為這兩種方法生產(chǎn)的產(chǎn)品的平均抗拉強(qiáng)度不同。例5-8:某服裝公司有兩個(gè)附屬工廠:A工廠和B工廠。過去幾年內(nèi),A工廠採取了許多改進(jìn)措施,增添了一些新設(shè)備?,F(xiàn)從A工廠和B工廠分別抽取40天和30天觀察,得到平均生產(chǎn)率分別為92%和88%,假定A工廠和B工廠的生產(chǎn)率近似服從正態(tài)分佈,標(biāo)準(zhǔn)差分別為15和19。公司希望知道改進(jìn)後的A工廠的生產(chǎn)率是否高於B工廠的?(=0.05)解:已知=92,=88,=15,=19,=40,=32,依題意提出假設(shè)H0:H1:在H0成立時(shí)Z==~N(0,1)由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.645,
使P(Z>1.645)=0.05,建立的小概率事件是(Z>1.645)。根據(jù)樣本觀察值計(jì)算得Z===0.973因?yàn)閆=0.973<=1.645,則接受H0,故可以認(rèn)為A工廠的生產(chǎn)率沒有高於B工廠的。兩個(gè)總體均值之差的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1
(1)H0:μ1=μ2
H1:μ1≠μ2
(2)H0:μ1≤μ2
H1:μ1>μ2
(3)H0:μ1≥μ2
H1:μ1<μ2
t0兩個(gè)正態(tài)總體未知,但相等212111nnSxxtw+-=2)1()1(21222211-+-+-=nnSnSnSw21s22,s0tatt0at-例5-9:某地區(qū)高考負(fù)責(zé)人想知道能否說某年來自城市中學(xué)考生的平均成績比來自農(nóng)村中學(xué)考生的平均成績高。已知總體服從正態(tài)分佈且方差大致相同,由抽樣獲得如下資料:(=0.05)
城市中學(xué)考生:n1=17,=545,S1=50;=495,S2=55農(nóng)村中學(xué)考生:n2=15,解:依題意提出假設(shè)H0:≤,H1:>或H0:≤0,H1:>0在H0成立時(shí)t==~t(n1+n2-2)由=0.05,查自由度為30的t分佈表得臨界值(30)=1.697,使P(t>1.697)=0.05,建立的小概率事件是(t>1.697)。
根據(jù)樣本觀察值計(jì)算得==52.393t==2.69因?yàn)閠=2.69>=1.697,拒絕H0,可以認(rèn)為來自城市的中學(xué)考生比來自農(nóng)村的中學(xué)考生平均成績高。兩個(gè)總體均值之差的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:μ1=μ2
H1:μ1≠μ2
(2)H0:μ1≤μ2
H1:μ1
>μ2
(3)H0:μ1≥μ2
H1:μ1
<μ2
兩個(gè)非正態(tài)體n1≥30n2≥30已知或未知0z22,s21s22212121nnxxZss+-=22212121nSnSxxZ+-=0zaZz0aZ-例5-10:設(shè)某進(jìn)出口公司,為了檢查本市甲、乙食品加工廠所生產(chǎn)的蘋果罐頭的淨(jìng)重,分別從甲乙兩廠抽取了樣本容量為100和200的樣本,得到甲廠樣本均值為252克,標(biāo)準(zhǔn)差為4克,乙廠樣本均值為249克,標(biāo)準(zhǔn)差為45克,問兩個(gè)工廠所生產(chǎn)的罐頭的淨(jìng)重有無差別(=0.05)解:已知=252,=249,S1=4,S2=4.5,n1=100,n2=200,依題意提出假設(shè)
H0:H1:或H0:=0,H1:≠0在H0成立時(shí)Z==近似服從N(0,1)由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.96,
使P(|Z|≥1.96)=0.05,建立的小概率事件是(|Z|≥1.96)。根據(jù)樣本觀察值計(jì)算得Z=
==5.882因?yàn)閨Z|=5.882>=1.96,則拒絕原假設(shè)H0,接受H1,故可以認(rèn)為兩個(gè)工廠所生產(chǎn)的罐頭的淨(jìng)重有差別。一個(gè)總體方差的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1總體服從正態(tài)分佈
222)1(scSn-=2021:ss1H2020:ss=H2021:ss>H2020:ss£H2020:ss3H2021:ss<H拒絕域接受域拒絕域
接受域拒絕域拒絕域接受域例5-11:某廠生產(chǎn)的汽車蓄電池,由以往經(jīng)驗(yàn)知其壽命服從正態(tài)分佈,其標(biāo)準(zhǔn)差為0.8(年)?,F(xiàn)從該廠生產(chǎn)的一批蓄電池中隨機(jī)抽取13個(gè),算得樣本標(biāo)準(zhǔn)差為0.92(年)。問該廠生產(chǎn)的這批蓄電池壽命的方差是否有明顯改變?(=0.1)
解:依題意提出假設(shè)
H0:,H1:≠0.82
在H0成立時(shí)
==~(n-1)
由=0.1查自由度為12的分佈表得臨界值=21.026,使P(≤5.226)+P(≥21.026)=0.1,建立的小概率事件是(≤5.226)或(≥21.026)。
根據(jù)樣本觀察值計(jì)算得
===15.94
因?yàn)?5.226<=15.94<=21.026,接受H0,故可以認(rèn)為這批蓄電池壽命的方差沒有明顯改變。=5.226,例5-12:某企業(yè)職工月收入呈正態(tài)分佈,某年某月標(biāo)準(zhǔn)差為245元,今年同月抽查了30各職工月收入情況,知其標(biāo)準(zhǔn)差為287元,能否以0.01的顯著水準(zhǔn)斷定今年職工的月收入差異程度已明顯擴(kuò)大?(=0.01)
解:依題意提出假設(shè)H0:≤2452,H1:>2452
在H0成立時(shí)
==~(n-1)
由=0.01,查自由度為29的分佈表得臨界值(29)=49.588,使P(>49.588)=0.01,建立的小概率事件是(>49.588)。根據(jù)樣本觀察值計(jì)算得
===39.795因?yàn)?39.795<=49.588接受H0,故不能斷定該企業(yè)今年職工月收入差異程度較某年已明顯擴(kuò)大。兩個(gè)總體方差之比的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1總體服從正態(tài)分佈 22222221//ssSSF=22210:ss=H22211:ss1H22210:ss£H22211:ss>H22210:ss3H22211:ss<H拒絕域接受域拒絕域拒絕域接受域接受域拒絕域例5-13:IQ(即智商)測驗(yàn)成績一般服從正態(tài)分佈,現(xiàn)隨機(jī)地從某校中抽取31位男生和16位女生進(jìn)行同樣的IQ測驗(yàn),測得結(jié)果男生和女生IQ測驗(yàn)成績的標(biāo)準(zhǔn)差分別為10分和8分,試問:男生和女生IQ測驗(yàn)成績的穩(wěn)定性有無顯著差異?
(=0.01)
解:依題意提出假設(shè)H0:=,H1:≠在H0成立時(shí)F===~F(n1-1,n2-1)
由=0.01,查第一自由度為30第二自由度為15的F分佈表得臨界值(30,15)=3.69,由公試(4.49)得另一臨界值===0.4975,使P(F>3.69)+P(F<0.4975)=0.01,建立的小概率事件是F>3.69或F<0.4975。根據(jù)樣本觀察值計(jì)算得F===1.5625
因?yàn)?0.4975<F=1.5625<=3.69,接受H0,可以認(rèn)為男、女生IQ測驗(yàn)成績的穩(wěn)定性無顯著差異。
例5-14:兩臺(tái)車床生產(chǎn)同一種零件。為比較兩種車床的加工精度,從兩車床加工的零件中各抽8件和9件,對(duì)某一指標(biāo)進(jìn)行測量後算得:=0.0564,=0.0278。假設(shè)兩車床加工的零件的這個(gè)指標(biāo)分別服從正態(tài)分佈。問是否可以認(rèn)為第二臺(tái)車床加工精度較第一臺(tái)高?
(=0.05)
解:依題意提出假設(shè)
H0:≤H1:>在H0成立時(shí)F===~F(n1-1,n2-1)
由=0.05查第一自由度為7第二自由度為8的F分佈表得臨界值(7,8)=3.5,使P(F>3.5)=0.05,建立的小概率事件是(F>3.5)。根據(jù)樣本觀察值計(jì)算得F===2.03
因?yàn)镕=2.03<=3.5,接受H0,不能認(rèn)為第二臺(tái)車床加工精度較第一臺(tái)車床高。
例5-15:有人說,在大學(xué)中男生的學(xué)習(xí)成績比女生高。某位社會(huì)學(xué)家從一所大學(xué)中隨機(jī)抽取了25位男生和16位女生,對(duì)他們進(jìn)行了同樣題目的測試。測試結(jié)果,男生的平均成績?yōu)?2分,標(biāo)準(zhǔn)差為8分;女生的平均成績?yōu)?8分,標(biāo)準(zhǔn)差為7分,試問這位社會(huì)學(xué)家能得出什麼樣的結(jié)論?假設(shè)男、女生成績都是服從正態(tài)分佈的
(=0.02)
解:要檢驗(yàn)兩個(gè)總體均值是否相等,首先要對(duì)兩總體方差是否相等進(jìn)行檢驗(yàn)。(1)H0:=,H1:≠在H0成立時(shí)F===~F(n1-1,n2-1)由=0.02查第一自由度為24第二自由度為15的F分佈表得臨界值(24,15)=3.29,由公式(4.49)得另一臨界值
(2415)===0.346
根據(jù)樣本觀察值計(jì)算得F===1.306因?yàn)?0.346<F=1.306<=3.29,接受H0,可以認(rèn)為兩總體方差相等。(2)已知=,檢驗(yàn)假設(shè)H0:=,H1:≠在H0成立時(shí)t=~t()由=0.02查自由度為39的t分佈表得臨界值(39)=2.423,使P(|t|≥2.423)=0.02,建立的小概率事件是|t|≥2.423)。根據(jù)樣本觀察值計(jì)算得t===1.64
因?yàn)閨t|=1.64<=2.423,接受H0,可以認(rèn)為社會(huì)學(xué)家會(huì)得出男、女生之間學(xué)習(xí)成績並無顯著差異的結(jié)論。條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:P=P0H1:P≠P0
(2)H0:P≤P0H1:P>P0(3)H0:P≥P0H1:P<P0z0樣本比率p近似服從正態(tài)分佈
z0aZz0aZ-一個(gè)總體比率的假設(shè)檢驗(yàn)Z=例5-16根據(jù)有關(guān)資料估計(jì)某市老年人口(65歲以上)比重為14.7%,該市老年人口研究會(huì)為了驗(yàn)證這個(gè)估計(jì)是否可靠,隨機(jī)抽選了400名居民,發(fā)現(xiàn)有57人年齡在65歲以上,調(diào)查結(jié)果是否支持該市人口比重為14.7%的結(jié)論?((=0.05)
解:依題意提出假設(shè)H0:P=14.7%,H1:P≠14.7%在H0成立時(shí)Z==近似服從N(0,1)由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.96,使P(|Z|≥1.96)=0.05,建立的小概率事件是(|Z|≥1.96)。根據(jù)樣本觀察值計(jì)算得
=0.1425Z===-0.254因?yàn)閨Z|=0.254<=1.96,則接受原假設(shè)H0,故可以認(rèn)為調(diào)查結(jié)果支持了該市老年人口比重為14.7%。例5-17:某電視臺(tái)節(jié)目主持人根據(jù)以往經(jīng)驗(yàn)估計(jì)該節(jié)目的收視率至少為40%。某統(tǒng)計(jì)局調(diào)查了1000名電視觀眾,得知經(jīng)常收看該節(jié)目的人為375人,問能否證實(shí)節(jié)目主持人的說法?(=0.05)
解:依題意提出假設(shè)H0:P≥40%H1:P<40%在H0成立時(shí)Z=
==近似服從N(0,1)由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得=1.645,由於是左側(cè)檢驗(yàn)所以臨界值為-
=-1.645,使P(Z<-1.645)=0.05,建立的小概率事件是(Z<-1.645)。根據(jù)樣本觀察值計(jì)算得Z=
=
=-1.6因?yàn)閆=
-1.6>-
=-1.645,則接受H0,故以0.05的顯著性水準(zhǔn)證實(shí)了節(jié)目主持人的說法。兩個(gè)總體比率之差的假設(shè)檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:P1=P2H1:P1≠P2
(2)H0:P1≤P2H1:P1
>
P2(3)H0:P1≥P2H1:P1
<P2n1p1≥5n1q1≥5n2p2≥5n2q2≥5
z0z0aZz0aZ-Z=
例5-18:農(nóng)業(yè)上進(jìn)行浸種試驗(yàn),抽取了兩部分種子,一部分是溫水浸種,播下200粒,其中130粒發(fā)芽,另一種未經(jīng)溫水浸種,播下400粒,其中200粒發(fā)芽。問這批種子經(jīng)過這兩種方法處理後發(fā)芽率有無顯著差異?(=0.05)
解:依題意提出假設(shè)
H0:P1=P2
,H1:P1≠P2
在H0成立時(shí)
Z==近似服從N(0,1)
由=0.05查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.96,使P(|Z|≥1.96)=0.05,建立的小概率事件是(|Z|≥1.96)。
根據(jù)樣本觀察值計(jì)算得
==0.65==0.5
Z===1.191
因?yàn)閨Z|=1.191<=1.96接受H0,可以認(rèn)為種子經(jīng)過這兩種方法處理後發(fā)芽率沒有差異。
例5-19某一保險(xiǎn)機(jī)構(gòu)稱,對(duì)於新出臺(tái)的某一險(xiǎn)種,沿海地區(qū)的人們的喜受程度要高於內(nèi)地的人們。為了進(jìn)一步瞭解事實(shí),進(jìn)行了一次抽樣調(diào)查,瞭解兩地喜愛該險(xiǎn)種的人數(shù)比例,調(diào)查結(jié)果如下,沿海地區(qū):n1=300
=0.65內(nèi)地地區(qū):n2=400=0.55
問該調(diào)查結(jié)果是否支持沿海地區(qū)的消費(fèi)者更偏好該險(xiǎn)種這個(gè)結(jié)論?(=0.01)
解:依題意提出假設(shè)H0:P1≤P2,H1:P1>P2在H0成立下
Z==近似服從N(0,1)由=0.01查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=2.323,使P(Z>2.323)=0.01,建立的小概率事件是(Z>2.323)。根據(jù)樣本觀察值計(jì)算得Z===2.695因?yàn)閆=2.695>=2.323,拒絕H0,故可以認(rèn)為沿海地區(qū)的消費(fèi)者更偏好該險(xiǎn)種。
第三節(jié)假設(shè)檢驗(yàn)中的其他問題一、P值檢驗(yàn)法所謂P值是指H0視為真時(shí),檢驗(yàn)統(tǒng)計(jì)量在以其觀察值為端點(diǎn)的某區(qū)域內(nèi)取值的概率。
計(jì)算方法:在已知時(shí),檢驗(yàn)統(tǒng)計(jì)量為Z=,其樣本觀測值為Z0=,表示樣本均值的觀察值。在左側(cè)檢驗(yàn)中,P值=P(Z≤Z0);
在右側(cè)檢驗(yàn)中,P值=P(Z≥Z0);
在雙側(cè)檢驗(yàn)中,P值=2P(Z≥|Z0|);P值法的檢驗(yàn)準(zhǔn)則:若P值≤時(shí),則拒絕H0;接受H1。例5-20:電視機(jī)顯像管批量生產(chǎn)的品質(zhì)標(biāo)準(zhǔn)為平均使用壽命為1200小時(shí),標(biāo)準(zhǔn)差為300小時(shí)。某電器集團(tuán)公司宣稱,他們生產(chǎn)的顯像管其品質(zhì)大大超過規(guī)定標(biāo)準(zhǔn)。為了進(jìn)行驗(yàn)證,隨機(jī)抽取了100件為樣本,測得平均使用壽命1245小時(shí)。能否說該公司的顯像管品質(zhì)顯著地高於規(guī)定標(biāo)準(zhǔn)?
(=0.05)
解:依題意提出假設(shè)H0:=1200,H1:>1200(1)臨界值法在H0成立時(shí)Z=
=~N(0,1)
由=0.05,查標(biāo)準(zhǔn)正態(tài)分佈函數(shù)表得臨界值=1.645,使P(Z>1.645)=0.05,建立的小概率事件是(Z>1.645)。根據(jù)樣本觀察值計(jì)算得
Z=
=
=1.5因?yàn)閆=1.5<=1.645,接受H0,可以認(rèn)為該公司的顯像管品質(zhì)不顯著高於規(guī)定標(biāo)準(zhǔn)。
(2)P值檢驗(yàn)法在H0成立時(shí),Z0=
=
=1.5P值=P(Z≥Z0)=P(Z≥1.5)=1-P(Z<1.5)=1-0.93319=0.06681
因?yàn)镻值=0.06681>=0.05,所以接受H0。與利用臨界值法結(jié)果一致。如果另取一隨機(jī)樣本,計(jì)算得樣本均值=1265小時(shí),結(jié)果又會(huì)如何?
Z===2.17由於Z=2.17>=1.645,所以拒絕H0,接受H1。這時(shí)候的P值為
P值=P(Z≥Z0)=P(Z≥2.17)=1-P(Z<2.17)=1-0.985=0.015
P值=0.015<=0.05拒絕H0,接受H1。上面兩種情況見下麵兩圖由上面的例子及圖可以看出,如果縮小,即等於縮小拒絕域同時(shí)擴(kuò)大接受域,但只要不小於P值,就總可以拒絕H0;若繼續(xù)縮小到小於P值,就不再可以拒絕H0了。因此我們可以這樣認(rèn)識(shí)P值的實(shí)質(zhì):
P值是假設(shè)檢驗(yàn)中可以導(dǎo)致拒絕零假設(shè)的最小值。P值越小,代表否定H0的證據(jù)越充分,就越容易拒絕零假設(shè);P值越大,就越不容易拒絕零假設(shè)。二、假設(shè)檢驗(yàn)與置信區(qū)間的關(guān)係
通過前面的學(xué)習(xí),我們可以看出假設(shè)檢驗(yàn)與置信區(qū)間有密切的關(guān)係,二者使用的公式類似,下麵我們以正態(tài)總體均值u的統(tǒng)計(jì)推斷為例,說明他們之間的關(guān)係。設(shè)總體X~N(u,)則u的置信水準(zhǔn)為1-的置信區(qū)間為(1)
而關(guān)於u的假設(shè)檢驗(yàn)在顯著性水準(zhǔn)為下為拒絕域?yàn)椋?/p>
即:則與此相對(duì)應(yīng)的接受域?yàn)橐布矗海?)
我們比較(1)和(2),兩者的公式是一樣的,因此置信區(qū)間與假設(shè)檢驗(yàn)有如下想關(guān)係:結(jié)論:如果假設(shè)檢驗(yàn)在顯著性水準(zhǔn)下接受,則的置信水準(zhǔn)為的置信區(qū)間必包含,反之,則不然。因此,我們可以用置信水準(zhǔn)來檢驗(yàn)假設(shè),反之,我們可以通過假設(shè)檢驗(yàn)來求出置信區(qū)間。以上所述的關(guān)於對(duì)於各種假設(shè)檢驗(yàn)和置信區(qū)間具有普遍性。例5-21:某市統(tǒng)計(jì)局城調(diào)隊(duì)調(diào)查該市職工每天用於閒暇活動(dòng)的時(shí)間,假設(shè)職工用於閒暇活動(dòng)時(shí)間服從正態(tài)分佈,根據(jù)以往經(jīng)驗(yàn),該城調(diào)隊(duì)認(rèn)為這一時(shí)間沒有多大變化仍為3.3小時(shí)。現(xiàn)隨機(jī)抽取28名職工進(jìn)行調(diào)查,得到=3.59小時(shí),S=0.74小時(shí),問調(diào)查結(jié)果是否證實(shí)了域調(diào)隊(duì)的看法?(=0.05)解:依題意提出假設(shè):的置信水準(zhǔn)1-=95%的置信區(qū)間為:該區(qū)間不包含,因此拒絕,接受,調(diào)查結(jié)果不能證實(shí)城調(diào)隊(duì)的看法。再以臨界值法進(jìn)行檢驗(yàn):在成立時(shí)由=0.05,查自由度為27的t分佈表得臨界值=2.052根據(jù)樣本觀察值計(jì)算得因?yàn)?2.07>=2.052,因此拒絕,接受。兩者檢驗(yàn)結(jié)果一致。統(tǒng)計(jì)數(shù)據(jù)的整理
第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的審核
在對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行整理時(shí),首先要進(jìn)行審核,以保證數(shù)據(jù)品質(zhì),為進(jìn)一步統(tǒng)計(jì)分析打下基礎(chǔ)。對(duì)於通過直接調(diào)查取得的原始數(shù)據(jù),應(yīng)主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查的個(gè)體單位是否有遺漏,所有的調(diào)查專案或指標(biāo)是否填寫齊全等。審核數(shù)據(jù)準(zhǔn)確性的方法主要有邏輯檢查和計(jì)算檢查。第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的審核
通過其他管道取得的第二手?jǐn)?shù)據(jù),除了對(duì)其完整性和準(zhǔn)確性進(jìn)行審核外,還應(yīng)著重審核數(shù)據(jù)的適用性和時(shí)效性。第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的審核對(duì)審核過程中發(fā)現(xiàn)的錯(cuò)誤應(yīng)盡可能予以糾正。調(diào)查結(jié)束後,當(dāng)數(shù)據(jù)中發(fā)現(xiàn)的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時(shí),就需要對(duì)數(shù)據(jù)進(jìn)行篩選。數(shù)據(jù)篩選包括兩方面內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來。數(shù)據(jù)的篩選在統(tǒng)計(jì)調(diào)查中是十分重要的。一、統(tǒng)計(jì)分組的概念統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將統(tǒng)計(jì)總體按照一定的標(biāo)誌區(qū)分為若干個(gè)組成部分的一種統(tǒng)計(jì)方法。統(tǒng)計(jì)分組同時(shí)具有兩個(gè)方面的含義:對(duì)總體而言是“分”,即將總體區(qū)分為性質(zhì)相異的若干部分;對(duì)總體單位而言,是“合”,即將性質(zhì)相同的總體單位組合起來。
第二節(jié)統(tǒng)計(jì)分組
二、統(tǒng)計(jì)分組的作用(一)區(qū)分不同事物的性質(zhì)區(qū)分事物不同的性質(zhì)是統(tǒng)計(jì)分組的根本作用。例如,研究人口時(shí),可以從性別、年齡、民族、文化程度等方面來區(qū)分人口的不同性質(zhì)。分組前分組後25%33%42%(二)反映事物的內(nèi)部構(gòu)成及其變化規(guī)律性通過分組區(qū)分了事物的不同性質(zhì),可以研究現(xiàn)象的各部分構(gòu)成,進(jìn)而識(shí)別事物的主要部分與共性特徵,以說明事物發(fā)展變化的規(guī)律。表3-12009年我國產(chǎn)業(yè)結(jié)構(gòu)
100.0335353合計(jì)10.5846.8042.6235477156958142918第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)比重%增加值(億元)產(chǎn)業(yè)(三)揭示現(xiàn)象之間的數(shù)量依存關(guān)係通過分組將性質(zhì)上有關(guān)聯(lián)的分組資料聯(lián)繫起來分析,便可研究不同現(xiàn)象總體之間數(shù)量上的依存關(guān)係。例如表2-2中的數(shù)據(jù)便可展現(xiàn)出小麥畝產(chǎn)量與施肥量二者之間的相互依存關(guān)係。表3-2小麥?zhǔn)┓柿颗c畝產(chǎn)量之間的關(guān)係500651490420350280210140小麥畝產(chǎn)量(斤)706050403020100施肥量(斤)三、統(tǒng)計(jì)分組的原則與分組變數(shù)(一)統(tǒng)計(jì)分組的原則一是要有周延性,即不遺漏,每一單位都有所歸屬。二是要有互斥性,即不重複,每一單位只能歸屬於某一組而不能歸屬於另一組。(二)統(tǒng)計(jì)分組的變數(shù)分組變數(shù)就是將總體分為各個(gè)性質(zhì)不同的標(biāo)準(zhǔn)或根據(jù)。
根據(jù)分組變數(shù)的特徵不同,總體可按屬性變數(shù)分組,也可按數(shù)量變數(shù)分組。(1)按屬性變數(shù)分組按屬性變數(shù)分組就是以屬性變數(shù)作為分組變數(shù),並在屬性變數(shù)的變異範(fàn)圍內(nèi)劃分各組界限,將總體分為若干組。(2)按數(shù)量變數(shù)分組按數(shù)量變數(shù)分組就是以數(shù)量變數(shù)作為分組變數(shù),並在數(shù)量變數(shù)的變異範(fàn)圍內(nèi)劃分各組界限,將總體分為若干組。
(四)簡單分組和複合分組
1.簡單分組對(duì)總體只按一個(gè)變數(shù)分組稱為簡單分組。
2.複合分組對(duì)總體按兩個(gè)或兩個(gè)以上變數(shù)層疊起來進(jìn)行分組稱為複合分組。即先按一個(gè)變數(shù)分組,然後再按另一個(gè)變數(shù)將已經(jīng)分好的各個(gè)組進(jìn)一步劃分為若干組。
3.交叉分組對(duì)總體按兩個(gè)變數(shù)交叉進(jìn)行分組稱為交叉分組,它也是一種複合分組。如表3-3所示。表3-32009年三個(gè)地區(qū)按城鄉(xiāng)分組的文盲率
——合計(jì)6.395.846.203.383.294.07甲地區(qū)乙地區(qū)丙地區(qū)鄉(xiāng)村文盲率(%)城鎮(zhèn)文盲率(%)地區(qū)第三節(jié)次數(shù)分佈一、次數(shù)分佈的概念在統(tǒng)計(jì)分組的基礎(chǔ)上,將組中的所有單位按組歸類整理,形成總體中各個(gè)單位在各組間的分佈,就叫做次數(shù)分佈。分佈在各組的個(gè)體單位數(shù)叫次數(shù),又稱頻數(shù)。各組次數(shù)與總次數(shù)之比稱比率,又稱頻率。將各組組別與次數(shù)依次編排而成的數(shù)列就叫做次數(shù)分佈數(shù)列,簡稱分佈數(shù)列。次數(shù)分佈分為品質(zhì)次數(shù)分佈和變數(shù)次數(shù)分佈。
二、次數(shù)分佈的種類
次數(shù)分佈分為屬性次數(shù)分佈和數(shù)量次數(shù)分佈。
屬性次數(shù)分佈就是按屬性變數(shù)分組所形成的次數(shù)分佈。它有兩個(gè)構(gòu)成要素:一是以屬性變數(shù)表現(xiàn)為各組的名稱,二是各組的次數(shù)。如表3-4。表3-42009年我國人口按性別分組的情況100.0133474合計(jì)51.4348.576865264822男女占總?cè)丝诒戎兀?)人數(shù)(萬人)性別數(shù)量次數(shù)分佈就是按數(shù)量變數(shù)分組所形成的次數(shù)分佈。它也有兩個(gè)構(gòu)成要素:一是以數(shù)量變數(shù)作為各組的名稱,二是各組的單位數(shù)。例如表3-5。表3-5某班組工人看管機(jī)器臺(tái)數(shù)的情況100.0016合計(jì)20.0053.3026.70385123比率(%)工人數(shù)(人)看管機(jī)器數(shù)(臺(tái))
數(shù)量次數(shù)分佈又分為單項(xiàng)次數(shù)分佈和組距次數(shù)分佈。數(shù)量次數(shù)分佈中的每個(gè)組只用一個(gè)變數(shù)值來表示就是單項(xiàng)次數(shù)分佈。如果變數(shù)值的變動(dòng)範(fàn)圍較小,項(xiàng)數(shù)不多,在這種情況下,就可以採用單項(xiàng)次數(shù)分佈反映總體的分佈狀態(tài)。如表3-5就是單項(xiàng)次數(shù)分佈。
數(shù)量次數(shù)分佈中的每個(gè)組用一定範(fàn)圍的變數(shù)值來表示就是組距次數(shù)分佈。如果變數(shù)值的變動(dòng)範(fàn)圍較大,項(xiàng)數(shù)較多,在這種情況下,就要採用組距次數(shù)分佈反映總體的分佈狀態(tài)。如表3-6就是組距次數(shù)分佈。表3-6某地區(qū)2009年城鎮(zhèn)居民可支配收入情況100.00合計(jì)2.5514.8224.4522.0017.369.644.912.361.91500以下500-700700-900900-11001100-13001300-15001500-17001700-21002100以上百分比(%)每人每月可支配收入(元)三、變數(shù)次數(shù)分佈的編制方法步驟:編制序列和計(jì)數(shù)、確定組數(shù)和組距、確定組限和組中值。例如,對(duì)某工廠某月50名工人生產(chǎn)量(公斤)情況進(jìn)行調(diào)查,得到下列初級(jí)數(shù)據(jù):10682106979681108841051109811412892112111122104111103911099110710810710411297110861258510510910510396124125931131151061011061028986119這些數(shù)據(jù)雜亂無章,難以看出其數(shù)量特徵及其分佈的規(guī)律性,需編制次數(shù)分佈。
(一)編制序列和計(jì)數(shù)按一定順序排列的數(shù)值稱為序列,即把數(shù)值從小到大(從大到小)的順序排列。編制單項(xiàng)次數(shù)分佈表3-7。表3-7某企業(yè)月工人生產(chǎn)量分佈表50----合計(jì)22211111121110111112113114115119122124125128211122342229798101102103104105106107108109111111121128182838485868991929396人數(shù)(人)零件數(shù)(件)人數(shù)(人)零件數(shù)(件)人數(shù)(人)零件數(shù)(件)(二)確定組數(shù)和組距組數(shù)是指對(duì)總體劃分為幾個(gè)組。
組距就是一個(gè)組的範(fàn)圍,它是通過相鄰兩組的下限(或上限)之差來計(jì)算的。對(duì)於同一總體,組數(shù)的多少和組距的大小成反比。確定組數(shù)和組距應(yīng)根據(jù)統(tǒng)計(jì)研究的目的,資料所反映的經(jīng)濟(jì)內(nèi)容,變數(shù)值的分佈程度和全距等因素來決定。
如果將表3-7重新分組,取組數(shù)為5,組距為10,就得到表3-8的次數(shù)分佈。
表3-8工人日生產(chǎn)量分佈表10050合計(jì)1418382010791910580—9090—100100—110110—120120—130比率(%)人數(shù)(人)日生產(chǎn)量(公斤)
在組距次數(shù)分佈中,各組組距相同的次數(shù)分佈稱為等距次數(shù)分佈。各組組距不同的次數(shù)分佈稱為異距次數(shù)分佈。等距次數(shù)分佈一般在現(xiàn)象性質(zhì)差異變動(dòng)比較均衡的條件下使用。
優(yōu)點(diǎn):易於掌握次數(shù)分佈的特性。各組次數(shù)可以直接比較。等距的情況下,確定組數(shù)、組距的公式:組數(shù)=全距/組距組距=全距/組數(shù)
異距次數(shù)分佈一般在現(xiàn)象性質(zhì)差異的變動(dòng)非均衡的條件下使用。
優(yōu)點(diǎn):能準(zhǔn)確地描述偏態(tài)分佈;能將性質(zhì)相同的總體單位歸為一組。採用異距次數(shù)分佈應(yīng)當(dāng)注意的是:由於各組組距不同,各組次數(shù)直接比較沒有意義。通常需計(jì)算次數(shù)密度(次數(shù)/組距)。(三)確定組限和組中值
組限就是各組間的數(shù)量界限。對(duì)於連續(xù)變數(shù)來說,由於變數(shù)的數(shù)值是連續(xù)不斷的,相鄰兩值之間可取無限數(shù)值,因此,相鄰組的組限必須重合。如表3-8中,第一組80~90,80為下限,90為上限。按習(xí)慣規(guī)定,各組包括下限數(shù)值,但不包括上限數(shù)值,統(tǒng)計(jì)中叫做“上限不在內(nèi)”原則。
對(duì)於離散變數(shù),相鄰組的組限一般要間斷。如表3-9中“100~199”一組的上限199和“200~299”一組的下限200並不需要重合,只需互相銜接。表3-9按工人人數(shù)劃分的工業(yè)企業(yè)分佈情況285合計(jì)8012060205100以下100~199200~299300~399400以上工業(yè)企業(yè)數(shù)(個(gè))工人數(shù)(人)
常用組中值作為各組變數(shù)值的代表值,反映分佈在各組中個(gè)體單位變數(shù)值的一般水準(zhǔn)。
組中值是上限與下限之間的中點(diǎn)數(shù)值。計(jì)算公式為:組中值=(上限+下限)/2
用組中值的假定的前提:
各個(gè)個(gè)體單位的變數(shù)值在本組內(nèi)呈均勻分佈或在組中值兩側(cè)呈對(duì)稱分佈。
根據(jù)表3-9計(jì)算各組組距和組中值,如表3-10。表3-10某企業(yè)工人日生產(chǎn)量分佈8595105115125101010101080-9090-100100-110110-120120-130組中值組距日生產(chǎn)量(公斤)據(jù)表3-9計(jì)算各組組距和組中值,如表3-11。表3-11按工人人數(shù)分組
50150250350450100100100100100100以下100—199200—299300—399400以上組中值組距
工人數(shù)(人)開口組缺下限的開口組組中值=本組上限-鄰組組距/2缺上限的開口組組中值=本組下限+鄰組組距/2
三、次數(shù)分佈的表示方法(一)表示法表示法就是用表格來反映次數(shù)分佈。表示法的形式有兩種:一是次數(shù)分佈表,二是累積次數(shù)分佈表。次數(shù)可用絕對(duì)數(shù)或相對(duì)數(shù)。需要各組的累計(jì)次數(shù)時(shí),可編制累計(jì)次數(shù)分佈表,如表3-12。計(jì)算累計(jì)次數(shù)的方法:
向上累計(jì)是從變數(shù)值最小一組的次數(shù)起逐項(xiàng)累計(jì),每組累計(jì)次數(shù)表示小於該組上限值的次數(shù)共有多少。
向下累計(jì)是從變數(shù)值最大一組累計(jì)的次數(shù)共有多少。表3-12工人生產(chǎn)量累計(jì)次數(shù)表----10050合計(jì)10086683010504334155143270901007163545501418382010791910580-9090-100100-110110-120120-130比率(%)人數(shù)(人)比率(%)人數(shù)(人)比率(%)人數(shù)(人)向下累計(jì)向上累計(jì)次數(shù)生產(chǎn)量(公斤)(二)圖示法圖示法給人以更清晰、直觀的印象,很容易看出總體分佈的特徵。圖示法就是用圖形來表示次數(shù)分佈。它的種類很多如次數(shù)直方圖、次數(shù)折線圖、累計(jì)次數(shù)分佈圖、餅形圖、環(huán)形圖和雷達(dá)圖。05101520生產(chǎn)量(公斤)工人數(shù)80-9090-100100-110110-120120-130在等距分組下,橫軸表示變數(shù),縱軸表示各組次數(shù),其寬度與各組組距相適應(yīng),這樣繪製的各直方形的面積可以表示各組次數(shù)的分佈狀態(tài),稱為次數(shù)直方圖。02040608010080~9090~100100~110110~120120~130向上累計(jì)向下累計(jì)折線圖折線圖也可以反映總體的次數(shù)分佈情況。繪製次數(shù)折線圖時(shí),橫軸表示變數(shù),變數(shù)值用組中值表示??v軸表示次數(shù),在每組組中值上方按該組的次數(shù)描一個(gè)點(diǎn),然後用直線連接起來,即成為次數(shù)折線圖。
根據(jù)累計(jì)次數(shù)分佈表繪製而成。向上累計(jì)次數(shù)曲線以各組上限為橫坐標(biāo),向下累計(jì)次數(shù)曲線以各組下限為橫坐標(biāo),其縱
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023肺亞實(shí)性結(jié)節(jié)外科管理進(jìn)展共識(shí)解讀課件
- 邊檢安全培訓(xùn)課件
- 手術(shù)醫(yī)生技能培訓(xùn)方案
- 辨色力培訓(xùn)課件
- 車隊(duì)安全培訓(xùn)模板下載課件
- 車隊(duì)安全人員培訓(xùn)內(nèi)容課件
- 車間質(zhì)量安全培訓(xùn)會(huì)課件
- 車間級(jí)安全教育課件
- 2025年國有資產(chǎn)清查盤點(diǎn)總結(jié)(3篇)
- 2026年內(nèi)科醫(yī)生年度工作總結(jié)
- 化學(xué)剝脫美容技術(shù)
- 醫(yī)療機(jī)構(gòu)傳染病隔離區(qū)域設(shè)置與管理要求
- 2025年數(shù)學(xué)廣東一模試卷及答案
- 安全總監(jiān)先進(jìn)個(gè)人材料范文
- 2025年高速公路收費(fèi)員考試題(附答案+解析)
- 智算中心大模型訓(xùn)練部署方案
- 2025年中國BBU備用電源行業(yè)市場全景分析及前景機(jī)遇研判報(bào)告
- 幼兒園大班社會(huì)教案《影子變變變》含反思
- 2025高度近視防控專家共識(shí)
- 循環(huán)經(jīng)濟(jì)中生產(chǎn)者責(zé)任延伸制度-洞察及研究
- 2024年安徽宣城中學(xué)自主招生考試語文試卷真題(含答案詳解)
評(píng)論
0/150
提交評(píng)論