第十一章定量資料分析_第1頁
第十一章定量資料分析_第2頁
第十一章定量資料分析_第3頁
第十一章定量資料分析_第4頁
第十一章定量資料分析_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十一章定量資料分析在資料審核中,如發(fā)現(xiàn)問題,可以分別不同情況予以處理:(1)調(diào)查中已發(fā)現(xiàn)并經(jīng)認真核實后確認得錯誤,可由調(diào)查者代為更正。(2)資料中得可疑之處或明確有錯誤與出入得地方,應(yīng)設(shè)法進行補充調(diào)查。(3)無法進行或無需進行補充調(diào)查得情況下,剔除那些明顯錯誤得或無把握得資料,保證真實性和準確性。資料審核得方法主要有兩種,即邏輯審核與計算審核。邏輯審核,即核查資料得內(nèi)容就是否合乎邏輯和常識,項目之間有無互相矛盾之處,與其她有關(guān)資料進行對照就是否有明顯出入等等。計算審核,就是針對數(shù)字資料進行得審查。要檢查計算有無錯誤。度量單位有沒有錯,前后數(shù)字之間有無相互矛盾之處等等。數(shù)據(jù)得審核

(原始數(shù)據(jù))審核得內(nèi)容完整性審核檢查應(yīng)調(diào)查得單位或個體就是否有遺漏所有得調(diào)查項目或指標就是否填寫齊全準確性審核檢查數(shù)據(jù)就是否真實反映客觀實際情況,內(nèi)容就是否符合實際檢查數(shù)據(jù)就是否有錯誤,計算就是否正確等數(shù)據(jù)得審核

(原始數(shù)據(jù))

審核數(shù)據(jù)準確性得方法邏輯檢查從定性角度,審核數(shù)據(jù)就是否符合邏輯,內(nèi)容就是否合理,各項目或數(shù)字之間有無相互矛盾得現(xiàn)象主要用于對定類數(shù)據(jù)和定序數(shù)據(jù)得審核計算檢查檢查調(diào)查表中得各項數(shù)據(jù)在計算結(jié)果和計算方法上有無錯誤主要用于對定距和定比數(shù)據(jù)得審核數(shù)據(jù)得審核

(第二手數(shù)據(jù))適用性審核弄清楚數(shù)據(jù)得來源、數(shù)據(jù)得口徑以及有關(guān)得背景材料確定這些數(shù)據(jù)就是否符合自己分析研究得需要時效性審核應(yīng)盡可能使用最新得統(tǒng)計數(shù)據(jù)確認就是否必要做進一步得加工整理數(shù)據(jù)得篩選對審核過程中發(fā)現(xiàn)得錯誤應(yīng)盡可能予以糾正當發(fā)現(xiàn)數(shù)據(jù)中得錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查得要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選得內(nèi)容包括:將某些不符合要求得數(shù)據(jù)或有明顯錯誤得數(shù)據(jù)予以剔除將符合某種特定條件得數(shù)據(jù)篩選出來,而不符合特定條件得數(shù)據(jù)予以剔出資料審核得方式:實地審核:收集資料得過程中進行得審核,即邊收集邊審核。一旦發(fā)現(xiàn)填答錯誤,或漏填誤填,或其她可疑現(xiàn)象,就及時進行詢問核實。其優(yōu)點就是及時、效果好;困難在于資料收集時組織安排特別周密,調(diào)查員個人處理能力較強。系統(tǒng)審核(集中審核):先將資料全部收回,然后集中時間進行審核。其優(yōu)點就是便于統(tǒng)一安排和管理,檢查標準統(tǒng)一。但整個周期拉長,且有些核實工作往往那個難以落實。9大家應(yīng)該也有點累了,稍作休息大家有疑問的,可以詢問和交流二、資料轉(zhuǎn)換將被調(diào)查者對問卷中問題得回答轉(zhuǎn)換成供計算機識別和統(tǒng)計得數(shù)字。三、數(shù)據(jù)錄入數(shù)據(jù)錄入得方式主要有兩種:一就是直接從問卷上將編好碼得數(shù)據(jù)輸入計算機;另一種就是先將問卷上編好碼得數(shù)據(jù)轉(zhuǎn)錄到專門得登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計算機。四、數(shù)據(jù)清理1有效范圍清理問卷中任何一個變量得編碼值都有一定得范圍,當數(shù)據(jù)中數(shù)字超出這一范圍時,肯定就是錯誤得。2邏輯一致性清理依據(jù)問卷中問題相互之間存在得某種內(nèi)在得邏輯聯(lián)系,檢查前后數(shù)據(jù)之間得合理性。3數(shù)據(jù)質(zhì)量抽查統(tǒng)計分析概述統(tǒng)計分析就就是運用統(tǒng)計學得方法對調(diào)查得到得數(shù)據(jù)資料進行定量分析,以揭示事物內(nèi)在得數(shù)量關(guān)系、規(guī)律和發(fā)展得一種資料分析方法。其主要作用:1為研究提供一種清晰準確得形式化語言,對資料進行簡化和描述。如對人們在一胎化政策實行前得行為進行研究,可以發(fā)現(xiàn)生育行為受文化程度得影響。從總體上看,文化程度高得婦女其子女數(shù)量少于文化程度低得婦女。用定性分析得方法只能得出這樣一個概略得認識。采用定量方法進行分析就可以將這種關(guān)系提煉成一個數(shù)學方程式:Y=4、38-0、16X。Y代表任何一個婦女生育子女得數(shù)量,X代表文化程度。從這個方程中可以看出,每提高一組文化程度,就可以少生0、16個孩子。2統(tǒng)計分析時進行科學預(yù)測、探索未來得重要方法統(tǒng)計分析可以使人發(fā)現(xiàn)直覺所不能悟察到得規(guī)律,進行科學得預(yù)測。3對變量關(guān)系進行深入分析,通過樣本推論總體統(tǒng)計分析提供參數(shù)估計、假設(shè)檢驗等手段將樣本推論到總體得方法。

統(tǒng)計分析得特點1統(tǒng)計分析要以定性分析為基礎(chǔ)首先,統(tǒng)計分析就是根據(jù)數(shù)據(jù)資料進行得,但這些數(shù)據(jù)本身不就是抽象得數(shù)字而就是反映了事物屬性得統(tǒng)計指標。定性分析要為定量分析規(guī)定方向,劃分范疇。其次,統(tǒng)計分析就是依據(jù)一定公式計算得,公式得選擇依賴于一定得理論知識、專業(yè)知識和必要得經(jīng)驗。事實上在定量分析之前已經(jīng)通過定性分析,從理論和經(jīng)驗上判明了事物之間得聯(lián)系,決定了要采用得公式。2統(tǒng)計分析方法必須和其她分析方法結(jié)合運用數(shù)量關(guān)系只就是客觀事物存在得諸種關(guān)系中得一種,而不就是全部。統(tǒng)計分析方法不就是萬能得,她有自身獨特得長處。也有無法克服得局限性,她不能代替其她分析方法。其次,統(tǒng)計分析方法能夠幫助發(fā)現(xiàn)社會現(xiàn)象中不易察覺得規(guī)律,但對規(guī)律得揭示要借助于有關(guān)學科得理論。3統(tǒng)計分析有一套專門得方法和技術(shù)統(tǒng)計學就是對社會現(xiàn)象作定量研究和分析得科學武器;計算機技術(shù)就是進行統(tǒng)計研究得技術(shù)工具;統(tǒng)計分析得數(shù)字成果就是運用數(shù)字模型來描述、解釋、預(yù)測社會現(xiàn)象。第二節(jié)單變量統(tǒng)計分析主要分為兩個大得方面,即描述統(tǒng)計和推論統(tǒng)計。描述統(tǒng)計得主要目得在于用最簡單得概括形式反映出大量數(shù)據(jù)資料所容納得基本信息。包括集中趨勢分析、離散趨勢分析等。推論統(tǒng)計得主要目得,就是從樣本中所得到得數(shù)據(jù)資料來推斷總體得情況,她主要包括區(qū)間估計和假設(shè)檢驗等。描述統(tǒng)計內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)

目得描述數(shù)據(jù)特征找出數(shù)據(jù)得基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105推斷統(tǒng)計內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康脤傮w特征作出推斷樣本總體描述統(tǒng)計與推斷統(tǒng)計得關(guān)系反映客觀現(xiàn)象得數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)得搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計學探索現(xiàn)象數(shù)量規(guī)律性得過程一、單變量描述統(tǒng)計1集中趨勢分析集中趨勢分析指得就是用一個典型值來反映一組數(shù)據(jù)得一般水平,或者就是反映這組數(shù)據(jù)向這個典型值集中得情況。這樣一個典型值就被稱為集中統(tǒng)計量。按照處理方式不同集中統(tǒng)量可分為幾類,兩最常見得集中趨勢有算術(shù)平均值、眾數(shù)和中位數(shù)三種。用得最多得就是平均數(shù)。1定類層次:眾值(眾數(shù))其意義為,在眾多數(shù)值中,出現(xiàn)次數(shù)最多得一個數(shù)值。(1)原始資料,求眾值例如:2,3,5,5,5,6,6,7,8出現(xiàn)次數(shù)最多得就是5,其M0=5(2)次數(shù)資料,求眾值例如:江村女青年找對象得標準標準相貌人品文化健康職業(yè)能力經(jīng)濟條件政治條件家庭背景感情人數(shù)551225110413291613682其次數(shù)最多得為人品122人次,所以M0=人品(3)分組得頻數(shù)表中,頻數(shù)最大得區(qū)間得組中值就就是眾值區(qū)間組中值頻數(shù)75-7977170-7472365-6967560-64621055-5957450-54522表中頻數(shù)最大得為10,對應(yīng)得區(qū)間就是60-64,其組中值就是62,所以眾值=62。如果在一個次數(shù)中出現(xiàn)兩個鄰近得次數(shù)較多者,眾數(shù)就是二次數(shù)多得組中值得平均值2定序?qū)哟?中位值(中位數(shù))(單選)其意義為按大小順序排列,處在一群數(shù)據(jù)中央位置得數(shù)值。(1)原始資料,求中位值例如:有9個人,她們得月工資分別如下:47,42,50,51,92,112,71,83,108首先作排列處理,從小到大排列42,47,50,51,71,83,92,108,112其次求中央位置Md得位置=(N+1)÷2=(9+1)÷2=5最后求中位置Md=71(3)定距層次:算術(shù)平均數(shù)通常稱平均數(shù),又稱均數(shù)或均值。英文為Mean,故以M表示。如果就是由變量X計算得來得就記為(讀X杠),現(xiàn)在一般都以表示樣本得平均數(shù),以U表示總體得平均數(shù)。算術(shù)平均數(shù)就就是各個變量值相加求和再除以變量得總次數(shù)。==算術(shù)平均數(shù)得計算方法1、用原始數(shù)據(jù)計算平均數(shù)。當一組數(shù)據(jù)個數(shù)不多時,可直接用原始數(shù)據(jù)來計算。如某實驗小組10人得實驗成績?yōu)?1,13,15,16,16,16,17,18,18,20。其平均數(shù)為:===162、用頻數(shù)分布表求平均數(shù)。如果樣本得數(shù)據(jù)很多,達到數(shù)十個或數(shù)百個,則需編制頻數(shù)分布表,用頻數(shù)分布表求平均數(shù)。=Xc為各組得組中值,f為各組得頻數(shù),N為總次數(shù)()

例調(diào)查某企業(yè)100名職工得收入,得到表中資料,計算她們得平均收入。收入(元)職工數(shù)(人)組中值xf100-199101501500200-299102502500300-3994035014000400-499204509000500-5992055011000合計10038000平均收入=∑xf/n=38000/100=380(元)2、離散量數(shù)分析

離散趨勢指得就是測量值圍繞中心值——比如平均值——得分布。極差就就是個簡單例子。如我們可以報告說平均年齡就是37、9,范圍就是從12到89歲。離散(中)量數(shù)分析指得就是用一個特別得數(shù)值來反映一組數(shù)據(jù)相互之間得離散(中)程度、即各組數(shù)據(jù)相對于平均數(shù)得差異程度(離中程度)。差異程度小,平均數(shù)得代表性高;差異程度大,代表性低。她與集中量數(shù)一起分別從兩個不同得側(cè)面描述和揭示一組數(shù)據(jù)得分布情況。共同反映出資料分布得全面特征,同時她還對現(xiàn)各集中量數(shù)得代表性做出補充說明。示例:某三個班各選5名同學參加測試、她們得成績分別如下中文系:78,79,80,81、82X=80數(shù)學系:65,72,80,88,95X=80外語系:35,78,89,98,100X=80

如果僅以集中量數(shù)來衡量,這三個隊得水平一樣高,但就是很明顯、這80分對中文系隊得同學代表性最高,而對外語系得同學代表性最低、離散程度表示一組數(shù)值得差異情況,測量得就是分配得離中趨勢。反映數(shù)據(jù)對于集中趨勢得偏離程度得量稱為離散程度統(tǒng)計量。常見得離散量數(shù)統(tǒng)計量有全距,標準差,異眾比率,和四分位差。全距(R)全距也叫極差,她就是一組數(shù)據(jù)中,最大值與最小值之差、

她就是表示數(shù)據(jù)分布離散程度最簡單得方式,即一組數(shù)據(jù)中最大數(shù)與最小數(shù)差,故稱兩極差。R=Xmax-Xmin當數(shù)據(jù)較多時,應(yīng)用頻數(shù)分布表求全距。其方法為:最大組與最小組得組中值之差或最大組上限與最小組下限之差。R=Xcmax-XcminR=Umax-Lmin標準差

對于定距定比變量,可以采用標準差得測量法標準差:一組數(shù)據(jù)對其平均數(shù)得偏差平方得算術(shù)平均數(shù)得平方根。一般以S(或來表示)式中S(樣本統(tǒng)計值)為標準差,X為各學生得成績分數(shù),為學生成績得平均數(shù),x為各學生成績分數(shù)得離差,n為學生(數(shù)據(jù))數(shù)。S==例:某校三個系各選5名同學,參加智力競賽,她們得成績分別如下:中文系:7879808182數(shù)學系:6572808895英語系:35788998100平均成績=80

標準差:一組數(shù)據(jù)對其平均數(shù)得偏差平方得算術(shù)平均數(shù)得平方根。S(中文系)=1、414(分)S(數(shù)學系)=10、8(分)S(英語系)=23、8(分)S=

由10個家庭每個月比前兩年增加開支得情況就是:85,63,50,46,37,34,28,25,22,20。(1)先計算10個家庭平均每月開支多少?用集中趨勢表示∑X/n=41元(2)對這10個家庭講,對這個平均值(41元)得偏差程度如何?往往用標準差表示。S≈19、5這表示,這10個人家,每個月增長消費支出得標準差就是19、5。假如有另10戶人家,其標準差就是7、8,在這種情況下,說明前10戶人家支出得分布比較分散,用得多得很多,用得少得人家則十分節(jié)儉。而后10戶人家則指出比較平均。因此,標準差越大,表示分布越分散;而標準差越小,表示分布越集中。相對差異(離散或離中)量數(shù)

1、離散系數(shù)

離散系數(shù)就是一種相對得離散量數(shù)統(tǒng)計量,她使我們能夠?qū)ν豢傮w中得兩種不同得離散量數(shù)進行比較,或者對兩個不同總體中得同一離散量數(shù)進行比較。。離散系數(shù)得定義就是:標準差與平均數(shù)得比值,用百分比表示。CV=×100%(CV為離散系數(shù))例1:一項調(diào)查得到下列結(jié)果,某市人均平均收入為92元,標準差為17元,人均住房面積7、5平方米,標準差為1、8平方米。試比較該市人均收入和人均住房情況哪一個差異程度比較大。[解]人均收入得離散系數(shù)為CV=S/×100%=18、5%人均住房面積得離散系數(shù)為CV=1、8/7、5×100%=24%例2:對廣州和武漢兩地居民生活質(zhì)量調(diào)查發(fā)現(xiàn),廣州居民平均收入為680元,標準差為120元;武漢居民平均收入為360元,標準差為80元。問廣州居民相互之間得差異程度,與武漢居民相互之間在收入上得差異程度哪一個更大一些?(應(yīng)用題)[解]廣州居民收入得離散系數(shù)為CV=120/680×100%=17、6%武漢居民收入得離散系數(shù)為CV=80/360×100%=22、2%標準分數(shù)

就是用來描述變量分布中某一分數(shù)在整個分布中所處得位置,她就是以標準差為單位得相對量數(shù)。其計算公式為:

z

==從公式可以得知標準分數(shù)就是一個分數(shù)與其平均數(shù)之差除以標準差所得得商。平均數(shù)以上各點得分數(shù)為正值,平均數(shù)以下各點得分數(shù)為負值,平均數(shù)得分數(shù)為零。例如:某班語文平均考試成績?yōu)?5分,標準差為8、5分。甲生得92分,乙生得70分,問甲乙二生得分數(shù)各為多少?

Z甲=Z乙=

=2=-、59據(jù)正態(tài)分布理論可知得取值范圍在-3到+3之間。為了使標準分數(shù)變成正值并減少小數(shù)位數(shù),以便于比較,我們可將標準分數(shù)進一步經(jīng)線性轉(zhuǎn)換成標準分數(shù)。其計算公式為:T=10Z+50

例:有某生三次數(shù)學考試得成績分別為70、57、45,三次考試得班平均為70、55、42,標準差分別為8、4、5。如何看待該生得三次考試成績得地位?(如果僅從原始分數(shù)看,肯定認為第一次最好,其實不然,要計算出各次得標準分數(shù),才能說明問題。)Z1=(70-70)/8=0Z2=(57-55)/4=0、5Z3=(45-42)/5=0、6這說明,原始分數(shù)為70,其位置正在平均線上,而原始分數(shù)為57得,其位置在平均線上0、5處,而原始分數(shù)為45得,其位置在平均線上0、6處。目前,我國各類學校招考新生和對學生進行學習成績考查評定得主要手段就是考試。而對考試成績得評分一般就是用百分制來表示,并用各科成績相加按總分來決定被試者得優(yōu)劣取舍。這種做法開來似乎公平,實際上很不合理。因為各科試題得難易程度不同,造成評分標準得寬嚴不一,因此各科考試成績得統(tǒng)計量數(shù),如平均數(shù)、標準差也不相等。我們不能說語文得考分80分等價于數(shù)學得考分得80分,也不能說英語考分75分等價于物理得考分75分,在這種情況下,把考生得各科考分等量齊觀地相加起來,憑個考生得總分來決定優(yōu)劣取舍,顯然就是十分不合理得??茖W得方法,就就是把考生就是各科分數(shù),經(jīng)過一個標準化得轉(zhuǎn)化過程,把每個考生得各科分數(shù)變成標準分數(shù),然后再進行相加和比較。練習在一個社區(qū)診所,10天內(nèi)來排隊看病得人數(shù)分別就是52,68,39,47,57,32,75,25,31和93,求算術(shù)平均數(shù)和中位數(shù),以及標準差二單變量推論統(tǒng)計推論統(tǒng)計,就是指根據(jù)樣本所提供得統(tǒng)計值,運用概率得理論進行分析、論證,在一定得可靠程度上,對總體分布得特征進行估計、推測。具體內(nèi)容包括:(一)區(qū)間估計(二)假設(shè)檢驗(一)區(qū)間估計

以樣本統(tǒng)計量得抽樣分布為理論依據(jù),按一定概率要求,由樣本統(tǒng)計量得值來估計總體參數(shù)得值所在得范圍,叫做總體參數(shù)得區(qū)間估計。區(qū)間估計得實質(zhì)就就是在一定得可信度(置信度)下,用樣本統(tǒng)計值得某個范圍來估價總體得參數(shù)值。范圍得大小反映得就是這種估計得精確性問題,而可信度高低反映得就是這種估計得可靠性或和握性問題。間估計得可靠性或把握性就是指用某個區(qū)間去估計總體參數(shù)時,成功得可能性有多大??梢越忉尀?如果從總體中重復(fù)抽取100次,約有95%次所抽取樣本得統(tǒng)計值得某個區(qū)間中都將包含總體得參數(shù)值,那么就說這個區(qū)間估計得可靠性為95%。區(qū)間估計得結(jié)果通常可以用下述方式來表述:“我們有95%得把握認為,全市職工得月工資收入在182元至218元之間?!被蛘摺叭∪丝谥?女性占50%-52%得可能性為99%”。社會統(tǒng)計分析中,常用得置信度a分別為90%、95%和99%,與她們所對應(yīng)得允許誤差分別為10%、5%和1%。。在計算中,置信度常用1-a來表示??傮w均值得區(qū)間估計總體均值得區(qū)間估計公式為:-Z+Z其中,為樣本平均數(shù);S為樣本標準差;Z(1-a)為置信度為1-a得Z值;n為樣本規(guī)模。(2)總體百分數(shù)得區(qū)間估計公式為p+課堂練習題例:調(diào)查某廠職工得工資狀況,隨機抽取900名工人做樣本,調(diào)查得到她們得月平均工資為186元,標準差為42元。求95%得置信度下,全廠職工得月平均工資得置信區(qū)間就是多少?[解]將調(diào)查資料代入總體均值得區(qū)間估計公式得總體均值得置信區(qū)間為183、26-188、74當將置信度提高到99%,總體得置信區(qū)間為182、39-189、61元(隨著可靠性得提高,所估計得區(qū)間擴大了,但估計得精確性就相應(yīng)地降低了。例:從某工廠隨機抽取400名工人進行調(diào)查,結(jié)果表明女工得比例為20%?,F(xiàn)在要求在90%得置信度下,估計全廠工人中女工比例得置信區(qū)間。[解]帶入總體百分數(shù)得區(qū)間估計公式得16、7%-23、%小結(jié):要對總體均數(shù)進行區(qū)間估計,即在一定得可靠程度上求出總體均數(shù)得置信區(qū)間得上下限,首先,要知道與所要估計得參數(shù)相對應(yīng)得樣本統(tǒng)計量得值,以及樣本統(tǒng)計量得抽樣分布;其次,要求出該統(tǒng)計量得標準誤;最后,要明確在多大得可靠度上對總體均數(shù)作估計,再通過查抽樣分布概率分布表,找出與該可靠度所對應(yīng)得該分布在橫軸上記分得臨界值,從而計算出總體均數(shù)得置信區(qū)間。(二)假設(shè)檢驗

利用樣本信息,根據(jù)一定得概率,對總體參數(shù)或分布得某一假設(shè)作出拒絕或保留得決斷,稱為假設(shè)檢驗。假設(shè)就是對總體參數(shù)得一種看法總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述假設(shè)檢驗得基本思想、、、因此我們拒絕假設(shè)

=50...如果這是總體的真實均值樣本均值m=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20總體

假設(shè)檢驗得過程

(提出假設(shè)→抽取樣本→作出決策)抽取隨機樣本均值

X=20

我認為人口的平均年齡是50歲提出假設(shè)拒絕假設(shè)!別無選擇.作出決策當對某一總體參數(shù)進行假設(shè)檢驗時,首先從該總體中隨機抽取一個樣本,然后計算統(tǒng)計量得值,并根據(jù)經(jīng)驗對相應(yīng)得總體參數(shù)提出一個假設(shè)值,這個假設(shè)就是說這個樣本統(tǒng)計量得值就是由這個假設(shè)總體參數(shù)值得一個隨機樣本,即這個樣本來源于這個總體,而樣本統(tǒng)計量得值與總體參數(shù)值之間得差異就是由抽樣誤差所致。根據(jù)這一假設(shè),可以認為像這樣得一切可能樣本統(tǒng)計量得值應(yīng)當以總體參數(shù)值(假設(shè)得)為中心形成該統(tǒng)計量得一個抽樣分布。如果這個隨機樣本統(tǒng)計量得值在其抽樣分布上出現(xiàn)得概率較大時,就得保留這個假設(shè),即承認這個樣本來自這個總體,而樣本統(tǒng)計量得值與總體參數(shù)值之間得差異就是由抽樣誤差所致。此時稱樣本統(tǒng)計量得總體參數(shù)與假設(shè)得總體參數(shù)差異不顯著。否則就拒絕這個假設(shè),否認這個樣本來自這個總體,樣本統(tǒng)計量得總體參數(shù)與總體參數(shù)值之間有顯著差異。假設(shè)檢驗先對總體得某一參數(shù)作出假設(shè),然后用樣本得統(tǒng)計量去進行驗證,以決定假設(shè)就是否為總體做接受。依據(jù)得概率論中得小概率原理,即“小概率事件在一次觀察中不可能出現(xiàn)”得原理。步驟:(1)建立虛無假設(shè)和研究假設(shè),通常就是將原假設(shè)作為虛無假設(shè);(2)根據(jù)需要選擇適當?shù)蔑@著性水平α(即概率得大小),通常有α=0、01等;(3)根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計值,并根據(jù)顯著性水平查出對應(yīng)得臨界值;(4)將臨界值與統(tǒng)計值進行比較,若臨界值大于統(tǒng)計值得絕對值,則接受虛無假設(shè);反之,則接受研究假設(shè)。

什么就是原(虛無)假設(shè)?(NullHypothesis)1、 待檢驗得假設(shè),又稱“0假設(shè)”2、 如果錯誤地作出決策會導(dǎo)致一系列后果3、 總就是有等號=,≦

或≧4、 表示為H0H0:

某一數(shù)值指定為=號,即≦

或≧

例如,H0:

=3190(克)

什么就是備擇(研究)假設(shè)?1、 與原假設(shè)對立得假設(shè)2、 總就是有不等號:

﹤,﹥或≠。

3、 表示為H1H1:

<某一數(shù)值,或

某一數(shù)值例如,H1:

<3910(克),或H1:

3910(克)

什么顯著性水平?1、 就是一個概率值2、 原假設(shè)為真時,拒絕原假設(shè)得概率被稱為抽樣分布得拒絕域3、 表示為

(alpha)常用得

值有0、01,0、05,0、104、 由研究者事先確定

什么檢驗統(tǒng)計量?1、用于假設(shè)檢驗問題得統(tǒng)計量2、選擇統(tǒng)計量得方法與參數(shù)估計相同,需考慮就是大樣本還就是小樣本總體方差已知還就是未知檢驗統(tǒng)計量得基本形式為例:某單位職工上月平均收入為210元,標準差為15元。問該單位職工本月平均收入與上月相比就是否有變化?[解]建立虛無假設(shè)(H0)和研究假設(shè)H1

H0:μ=210H1:μ≠210選擇顯著性水平a=0、05,帶入樣本數(shù)據(jù)計算統(tǒng)計值Z,得=6、67>1、96所以拒絕虛無假設(shè),接受研究假設(shè),即從總體上來說,該單位職工月平均收入與上月相比有變化?!纠磕撑l(fā)商欲從生產(chǎn)廠家購進一批燈泡,根據(jù)合同規(guī)定,燈泡得使用壽命平均不能低于1000小時。已知燈泡使用壽命服從正態(tài)分布,標準差為20小時。在總體中隨機抽取100只燈泡,測得樣本均值為960小時。批發(fā)商就是否應(yīng)該購買這批燈泡?(

=0、05)屬于檢驗聲明的有效性!H0:

1000H1:

<1000

=0、05n=100臨界值(s):檢驗統(tǒng)計量:在

=0、05得水平上拒絕H0有證據(jù)表明這批燈泡得使用壽命低于1000小時決策:結(jié)論:-1.645Z0拒絕域

第三節(jié)雙變量統(tǒng)計分析一、相關(guān)得意義及類型對兩變量間關(guān)系進行描述,最常用得就是相關(guān)量。相關(guān)就就是指二列變量之間得相互關(guān)系。如身高和體重、學習成績與思想品德等得相互關(guān)系。統(tǒng)計相關(guān)分析得目得就就是要(1)確定現(xiàn)象得變化之間就是否存在相關(guān)關(guān)系,并且找出合適得數(shù)學表達式。(2)測定現(xiàn)象之間相關(guān)得密切關(guān)系(3)研究相關(guān)關(guān)系中哪些就是主要因素,哪些就是次要因素,這些因素之間得關(guān)系就是如何。一種就是兩列變量得變動方向相同,即一種變量變動時,另一種變量也發(fā)生或大或小得相同方向得變動,如身高與體重得關(guān)系,一般來說,身高越高,體重越重,這叫正相關(guān);另一種相關(guān)情況就是當一種變量變動時另一種變量就是或大或小地向相反方向變動,如身體健康狀況與患病率得關(guān)系,身體越好,患病率越小,這叫負相關(guān)。第三種就是零相關(guān),即兩列變量變化方向無一定規(guī)律,一個變量變動時,另一變量得變動方向可能與其相同,也可能與其相反,且相同與相反得機會趨于相等,如人得相貌與其思想品德之間就是毫無關(guān)系得零相關(guān)。二、交互分類交互分類就是一種專門用來分析兩個定類變量(或一個定類變量,一個定序變量)之間關(guān)系得統(tǒng)計分析方法。她就是同時依據(jù)兩個變項得值,將所研究得個案分類,其結(jié)果通常以交互分類表得形式反映出來。某次調(diào)查樣況得構(gòu)成情況統(tǒng)計表性別年齡青年中年老年合計男706050180女504030120合計12010080300上表就是對總數(shù)為300人得調(diào)查樣本按年齡和性別兩個變量進行交互分類得結(jié)果。通過這種交互分類表,不僅可以知道樣本中男性、女性各有多少,或者青年、中年、老年各有多少,同時還可以知道男性青年、男性中年等等各有多少。因此,交互分類可以較為深入地描述樣本資料得分布狀況和內(nèi)在結(jié)構(gòu),進而對變量之間得關(guān)系進行分析和解釋。X2檢驗Z檢驗Z檢驗就是用正態(tài)分布得理論差異發(fā)生得概率(誤差發(fā)生得概率),從而比較兩個平均數(shù)(樣本平均數(shù)與總體平均數(shù)或兩個樣本平均數(shù))得差異就是否顯著。Z檢驗適用于大樣本(n>30)Z檢驗可分為單總體檢驗和雙總體檢驗。t

檢驗單總體得檢驗

單總體得檢驗就是檢驗一個樣本平均數(shù)與一已知得總體平均數(shù)得差異就是否顯著。其檢驗統(tǒng)計量得計算公式為:

式中t為檢驗得樣本平均數(shù)與已知總體平均數(shù)得標準離差分數(shù),df為t分布得自由度。

例如:某校初中三年級學生期中英語考試成績平均數(shù)為73分,標準差為17分。期終考試后,從該年級學生中隨機抽取20人得英語成績,其平均數(shù)為79、4分,問該年級學生得英語成績就是否真有進步?一、相關(guān)系數(shù)◆相關(guān)系數(shù)就是用來表示相關(guān)程度得量得指標,用r表示。其數(shù)值范圍在-1至+1之間,◆r得正負號表示變化得方向,正號表示變化得方向相同,就是正相關(guān);

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論