版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、項目九:調查資料的統(tǒng)計分析項目九:調查資料的統(tǒng)計分析 一、頻數(shù)分布與頻率分布一、頻數(shù)分布與頻率分布(1) 頻數(shù)分布頻數(shù)分布 頻數(shù)分布是指一組數(shù)據中取不同值的個頻數(shù)分布是指一組數(shù)據中取不同值的個案的次數(shù)分布情況。它一般是以頻數(shù)分布表案的次數(shù)分布情況。它一般是以頻數(shù)分布表的形式表達。的形式表達。( (見表見表1)1) 表表1. 97年年統(tǒng)統(tǒng)計計學學歷歷分分布布 學 歷 人 數(shù) 小學以下 1 中學 72 高中 44 中專 13 大專 52 大學 58 碩士 4 博士 7 Missing 49 Total 300 頻數(shù)分布表的作用頻數(shù)分布表的作用: A、簡化資料。、簡化資料。將調查得到的雜亂的將調查得
2、到的雜亂的原始數(shù)據原始數(shù)據,以十分簡潔以十分簡潔的統(tǒng)計表反映出來。的統(tǒng)計表反映出來。 B、清楚地了解、清楚地了解調查數(shù)據的眾多信息。調查數(shù)據的眾多信息。(2 2)頻率分布:)頻率分布: 一組數(shù)據中不同取值的頻數(shù)相對于總數(shù)一組數(shù)據中不同取值的頻數(shù)相對于總數(shù)的比率分布情況。常是以百分比的形式來表的比率分布情況。常是以百分比的形式來表達。達。( (見表見表2)2) 頻率分布表:是不同類別在總體中的相頻率分布表:是不同類別在總體中的相對數(shù)量分布。能十分方便不同總體和不同類對數(shù)量分布。能十分方便不同總體和不同類別之間的比較。因此這種分布表的應用更為別之間的比較。因此這種分布表的應用更為普遍。普遍。例1年
3、齡(歲)學生人數(shù)1721851910205213合計25年齡(歲)百分比1781820194020202112合計100(n=25)某班學生的年齡分布(頻數(shù))某班學生的年齡分布(頻率)NoImage例2: 頻數(shù)分布:頻數(shù)分布:一組數(shù)據中取不同值的個案的次數(shù)分布情況 (數(shù)量) 頻率分布:頻率分布:一組數(shù)據中不同取值的頻數(shù)相對于總數(shù)的比率分布情況。通常以百分比的形式表達。 (相對數(shù)量)職業(yè)類別人數(shù)工人4干部6教師3商人5農民2合計20表表9-1 某班學生父親的職業(yè)分布某班學生父親的職業(yè)分布職業(yè)類別百分比工人20干部30教師15商人25農民10合計100表表9-2 某班學生父親職業(yè)分布某班學生父親職
4、業(yè)分布例例: :調查某年級調查某年級150150名學生的年齡得到下列結果名學生的年齡得到下列結果: : 表表 3.某某年年級級學學生生的的年年齡齡分分布布 年齡 人數(shù)(頻數(shù)) 17 10 18 25 19 50 20 40 21 20 22 5 合計 150 頻數(shù)分布作用:作用:F有助于明確未回答者的多少,同時也能顯示不合格答案的多少;F可以檢驗奇異值和極端值;F根據頻數(shù)分布可以劃出各種統(tǒng)計圖形。二、單變量描述統(tǒng)計二、單變量描述統(tǒng)計 單變量統(tǒng)計分析分兩大方面單變量統(tǒng)計分析分兩大方面, ,即即, ,描述統(tǒng)描述統(tǒng)計和推論統(tǒng)計。計和推論統(tǒng)計。 描述統(tǒng)計的主要目的在于用最簡單的概描述統(tǒng)計的主要目的在于
5、用最簡單的概括性地反映出大量數(shù)據資料所容納的基本信括性地反映出大量數(shù)據資料所容納的基本信息。它的基本方法包括:息。它的基本方法包括:集中量數(shù)分析和離集中量數(shù)分析和離散量數(shù)散量數(shù)分析等。分析等。 推論統(tǒng)計的主要目的使用從樣本調查中推論統(tǒng)計的主要目的使用從樣本調查中所得到的數(shù)據資料來推斷總體的情況所得到的數(shù)據資料來推斷總體的情況, ,主要包主要包括:括:區(qū)間估計和假設檢驗區(qū)間估計和假設檢驗等。等。(一)集中趨勢統(tǒng)計指標(一)集中趨勢統(tǒng)計指標均值均值/平均數(shù)(平均數(shù)(mean)眾數(shù)(眾數(shù)(mode)中位數(shù)(中位數(shù)(median)(二)離散程度指標(二)離散程度指標全距全距/極差(極差(range)方
6、差(方差(variance)標準差(標準差(standard deviation)(一)集中趨勢分析(一)集中趨勢分析 集中趨勢分析指的是用一個典型值或代表值來反映一組數(shù)據的一般水平,或者說反映這組數(shù)據向這個典型值集中的情況。 最常見的集中量數(shù)有:最常見的集中量數(shù)有: (1 1)算術平均數(shù))算術平均數(shù)( (簡稱平均數(shù)簡稱平均數(shù), ,也稱為均值也稱為均值) ) (2 2)眾數(shù))眾數(shù) (3 3)中位數(shù)。)中位數(shù)。 (1 1)平均數(shù):)平均數(shù): 平均數(shù)是使用得最多的集中量數(shù)。平均平均數(shù)是使用得最多的集中量數(shù)。平均數(shù)是指總體各單位數(shù)值之和除以總體單位數(shù)是指總體各單位數(shù)值之和除以總體單位數(shù)目所得之商。數(shù)
7、目所得之商。 統(tǒng)計分析中習慣以統(tǒng)計分析中習慣以X X來表示。其計算公式來表示。其計算公式如下:如下: X X n n從原始數(shù)據計算平均數(shù)從原始數(shù)據計算平均數(shù) 例:例: 某班某班10名學生的年齡分別為名學生的年齡分別為20、21、19、19、19、20、20、21、22、18、20歲,求歲,求他們的平均年齡。他們的平均年齡。從單值分組資料計算平均數(shù)從單值分組資料計算平均數(shù) 首先要將每一個變量值乘以對應的首先要將每一個變量值乘以對應的頻數(shù)頻數(shù)f f,得出各組的數(shù)值之和,然后將,得出各組的數(shù)值之和,然后將各組的數(shù)值之和全部相加,最后除以單各組的數(shù)值之和全部相加,最后除以單位總數(shù)。位總數(shù)。 Xf Xf
8、 Xf Xf f nf n = 青年人閱讀小說書的數(shù)目書數(shù)f2-42365-746248-10594511-133123614-162153017-1911818總數(shù)17159 按照公式,可知每名青年人一年來讀過9.4本小說書。mxmfx 練習:練習:100名工人的收入資料如下,計算他們的名工人的收入資料如下,計算他們的平均工資。平均工資。 表表 100名工人的收入分布名工人的收入分布收入人數(shù)30040050060030203020合計100從組距分組資料計算均值從組距分組資料計算均值 在調查收入、年齡等方面情況時,常常得到組在調查收入、年齡等方面情況時,常常得到組距分組形式的資料,如我們知道
9、各年齡段的人數(shù),距分組形式的資料,如我們知道各年齡段的人數(shù),若要計算平均年齡就需要計算出各組的組中值,然若要計算平均年齡就需要計算出各組的組中值,然后在按照單值分組資料計算平均數(shù)的公式計算。后在按照單值分組資料計算平均數(shù)的公式計算。 組中值的計算公式為組中值的計算公式為: :v 上限上限+ +下限下限v 2 2 組中值 = 例例: :調查某企業(yè)調查某企業(yè)100100名職工的收入得到如下資料名職工的收入得到如下資料, ,請計算平均收入。請計算平均收入。 練習:調查練習:調查100名學生的成績得到資料如下,名學生的成績得到資料如下,求平均成績。求平均成績。 表表3 100名學生的成績分布名學生的成
10、績分布成績組中值人數(shù)4160618081100205030合計100注意注意:開口組的組中值開口組的組中值前面缺下限的開前面缺下限的開 鄰組組距鄰組組距口組的組中值口組的組中值 2后面缺上限的開口后面缺上限的開口 鄰組組距鄰組組距組的組中值組的組中值 2=下限+ 平均數(shù)的作用F能反映總體分布的集中趨勢;F能反映總體現(xiàn)象的共性特征;F是總體分布的重要數(shù)量特征值;nxnxxxxniin121小故事:騙人的“平均數(shù)”vM M:吉斯莫先生有一個小工廠,生產超級小玩意兒。:吉斯莫先生有一個小工廠,生產超級小玩意兒。vM M:管理人員由吉斯莫先生、他的弟弟、六個親戚:管理人員由吉斯莫先生、他的弟弟、六個親
11、戚組成。工作人員由組成。工作人員由5 5個領工和個領工和1010個工人組成。工廠個工人組成。工廠經營得很順利,現(xiàn)在需要一個新工人。經營得很順利,現(xiàn)在需要一個新工人。vM M:現(xiàn)在吉斯莫先生正在接見薩姆,談工作問題。:現(xiàn)在吉斯莫先生正在接見薩姆,談工作問題。v吉斯莫:吉斯莫:我們這里報酬不錯。平均薪金是每周我們這里報酬不錯。平均薪金是每周300300元。你在學徒期間每周得元。你在學徒期間每周得7575元,不過很快就可以加元,不過很快就可以加工資。工資。vM M:薩姆工作了幾天之后,要求見廠長。:薩姆工作了幾天之后,要求見廠長。v薩姆;薩姆;你欺騙我!我已經找其他工人核對過了,沒你欺騙我!我已經找
12、其他工人核對過了,沒有一個人的工資超過每周有一個人的工資超過每周100100元。平均工資怎么可能元。平均工資怎么可能是一周是一周300300元呢?元呢?v吉斯莫吉斯莫:啊,薩姆,不要激動。平均工資是:啊,薩姆,不要激動。平均工資是300300元。元。我要向你證明這一點。我要向你證明這一點。v吉斯莫:吉斯莫:這是我每周付出的酬金。我得這是我每周付出的酬金。我得24002400元,我元,我弟弟得弟弟得10001000元,我的六個親戚每人得元,我的六個親戚每人得250250元,五個領元,五個領工每人得工每人得200200元,元,1010個工人每人個工人每人100100元??偣彩敲恐茉?偣彩敲恐?9
13、006900元,付給元,付給2323個人,對吧?個人,對吧?v薩姆:薩姆:對,對,對!你是對的,平均工資是每周對,對,對!你是對的,平均工資是每周300300元??赡氵€是蒙騙了我。元??赡氵€是蒙騙了我。v吉斯莫;吉斯莫;我不同意!你實在是不明白。我已經把我不同意!你實在是不明白。我已經把工資列了個表,并告訴了你,工資的中位數(shù)是工資列了個表,并告訴了你,工資的中位數(shù)是200200元,可這不是平均工資,而是中等工資。元,可這不是平均工資,而是中等工資。v薩姆:薩姆:每周每周100100元又是怎么回事呢?元又是怎么回事呢?v吉斯莫吉斯莫:那稱為眾數(shù),是大多數(shù)人掙的工資。:那稱為眾數(shù),是大多數(shù)人掙的工
14、資。v吉斯莫:吉斯莫:老弟,你的問題是出在你不懂平均數(shù)、老弟,你的問題是出在你不懂平均數(shù)、中位數(shù)和眾數(shù)之間的區(qū)別。中位數(shù)和眾數(shù)之間的區(qū)別。v薩姆:薩姆:好,現(xiàn)在我可懂了。我好,現(xiàn)在我可懂了。我我辭職!我辭職?。? 2)眾數(shù))眾數(shù) 眾數(shù)是一組數(shù)據中出現(xiàn)次數(shù)最多眾數(shù)是一組數(shù)據中出現(xiàn)次數(shù)最多( (即頻數(shù)最高即頻數(shù)最高) )的那個數(shù)值。的那個數(shù)值。 眾數(shù)與平均數(shù)一樣也可用來概括反映總體的一眾數(shù)與平均數(shù)一樣也可用來概括反映總體的一般水平或典型情況。般水平或典型情況。 眾數(shù)的求法: A、單值分組資料:頻數(shù)最大者所對應的標志值。 B、組距分組資料:組中值法、摘補法。 單值分組資料單值分組資料 先在頻數(shù)欄中找
15、出最大的頻數(shù),然后找先在頻數(shù)欄中找出最大的頻數(shù),然后找到最大頻數(shù)所對應的標志值,這一標志值即到最大頻數(shù)所對應的標志值,這一標志值即為眾數(shù)。為眾數(shù)。眾數(shù)是出現(xiàn)最頻繁的數(shù)值,是分布中的高峰眾數(shù)是出現(xiàn)最頻繁的數(shù)值,是分布中的高峰。無眾數(shù)無眾數(shù)數(shù)據:10.34.98.911.76.37.7一個眾數(shù)一個眾數(shù)數(shù)據:6.34.94.98.9 6.3 4.94.94.94.9一個以上的眾數(shù)一個以上的眾數(shù)數(shù)據:21282828284143434343 組距分組資料組距分組資料( (組中值法組中值法) ) 首先通過直接觀察找出最高的頻數(shù),然首先通過直接觀察找出最高的頻數(shù),然后根據最高的頻數(shù)找到它所對應的組;最后后
16、根據最高的頻數(shù)找到它所對應的組;最后求出該組的組中值即為眾數(shù)。求出該組的組中值即為眾數(shù)。例:分類數(shù)據的眾數(shù)某城市居民關注廣告類型的頻數(shù)分布廣告類型人數(shù)比例頻率(%)商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其它廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100數(shù)據-分類數(shù)據M0商品廣告例:順序數(shù)據的眾數(shù)甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比()非常不滿意不滿意一般滿意非常滿意24108934530836311510合計300100數(shù)據:順序數(shù)據 M0不滿意眾數(shù)(眾數(shù)(od
17、e)特點:)特點: 不受極端值的影響;不受極端值的影響; 可能沒有眾數(shù)或有幾個眾數(shù)(不唯一性);可能沒有眾數(shù)或有幾個眾數(shù)(不唯一性); 主要用于分類數(shù)據,也可用于順序數(shù)據或數(shù)主要用于分類數(shù)據,也可用于順序數(shù)據或數(shù)值型數(shù)據。值型數(shù)據。確定眾數(shù)根據所依據資料的不同會有兩種情況確定眾數(shù)根據所依據資料的不同會有兩種情況 、根據原始數(shù)據或單變量值分組資料確定眾數(shù)。、根據原始數(shù)據或單變量值分組資料確定眾數(shù)。如果被研究總體單位數(shù)如果被研究總體單位數(shù)30 ,在對變量值由小,在對變量值由小到大排序后,就很容易找到眾數(shù)。到大排序后,就很容易找到眾數(shù)。若對原始數(shù)據按單變量值進行分組,得到次數(shù)若對原始數(shù)據按單變量值進
18、行分組,得到次數(shù)分布,那么次數(shù)最大的變量值即眾數(shù)。分布,那么次數(shù)最大的變量值即眾數(shù)。 、根據組距分組資料確定眾數(shù)。、根據組距分組資料確定眾數(shù)。對總體比較大,離散型變量數(shù)值表現(xiàn)較多連續(xù)對總體比較大,離散型變量數(shù)值表現(xiàn)較多連續(xù)型變量,按組距分組形成次數(shù)分布。由組距分組資型變量,按組距分組形成次數(shù)分布。由組距分組資料計算眾數(shù)。料計算眾數(shù)。(3 3)中位數(shù))中位數(shù) 把一組數(shù)據按值的大小順序排列起把一組數(shù)據按值的大小順序排列起來,處于中央位置的那個數(shù)值就叫中位來,處于中央位置的那個數(shù)值就叫中位數(shù)。數(shù)。 它描述的是定序變量以上層次的變它描述的是定序變量以上層次的變量。它的含義是整個數(shù)據中有一半數(shù)值量。它的
19、含義是整個數(shù)據中有一半數(shù)值在它之上,另一半數(shù)值在它之下。在它之上,另一半數(shù)值在它之下。 計算公式為計算公式為: M: Md d=(n+1)=(n+1)2 2 原始資料計算中位數(shù)原始資料計算中位數(shù) 計算方法是將各個個案由低到高排列起來,居計算方法是將各個個案由低到高排列起來,居序列中央位置的個案的值就是中位數(shù)。序列中央位置的個案的值就是中位數(shù)。 例例: :調查五個工廠的職工人數(shù),按規(guī)模由小到調查五個工廠的職工人數(shù),按規(guī)模由小到大依次為大依次為200200人,人,300300人,人,500500人,人,800800人,人,10001000人。人。依據公式依據公式(5+1)(5+1)2=32=3為中
20、間位置,即所對應的數(shù)值為中間位置,即所對應的數(shù)值500500人即為中位數(shù)。人即為中位數(shù)。 當數(shù)據為偶數(shù)時中位數(shù)處于中間兩個數(shù)值之間,當數(shù)據為偶數(shù)時中位數(shù)處于中間兩個數(shù)值之間,這時一般以中間兩個數(shù)值的平均數(shù)作為中位數(shù)。這時一般以中間兩個數(shù)值的平均數(shù)作為中位數(shù)。 中位數(shù)是指把所有數(shù)據按照升序或降序排列后中位數(shù)是指把所有數(shù)據按照升序或降序排列后居中的數(shù)值。居中的數(shù)值。 如果數(shù)據為奇數(shù)項,中位數(shù)是中間位置的數(shù)值。如果數(shù)據為奇數(shù)項,中位數(shù)是中間位置的數(shù)值。 如果數(shù)據為偶數(shù)項,中位數(shù)是中間位置兩個數(shù)如果數(shù)據為偶數(shù)項,中位數(shù)是中間位置兩個數(shù)值的平均數(shù)。值的平均數(shù)。例:v數(shù)據 :10.3 4.98.911.7
21、6.37.7v順序 :4.9 6.37.77.78.98.910.311.7v位置 : 1 2 3 3 4 4 5 6v當總體單位數(shù)n為奇數(shù)時21nexm當總體單位數(shù)n為偶數(shù)時2122nnexxm 單值分組資料計算中位數(shù)單值分組資料計算中位數(shù) 當資料為單值分組數(shù)據時,也是先求出當資料為單值分組數(shù)據時,也是先求出數(shù)據組的中間位置,然后再找出其對應值,數(shù)據組的中間位置,然后再找出其對應值,但尋找方式需要注意但尋找方式需要注意( (以表以表4 4為例為例) )。 先計算中間位置先計算中間位置: : (n+1) (n+1)2=(80+1)2=(80+1)2=40.52=40.5 即中間位置在第即中間位
22、置在第4040個數(shù)值與個數(shù)值與4141個數(shù)值之個數(shù)值之間,為了找到這個位置,需要列出累計頻數(shù)。間,為了找到這個位置,需要列出累計頻數(shù)。在序列中,可能有許多相同的數(shù)值。若如是,可先統(tǒng)計次數(shù)分布,然后求出中位數(shù)。如將某校的80名學生的成績分為甲、乙、丙、丁四個等級,各級的人數(shù)(f)如表4所示。中位數(shù)的位置是(n+1)/2=40.5,從累加次數(shù)(cf)很容易見到在這個位置上的值應在丙級內,故Md=丙。表4 學生的學業(yè)成績等級fcf甲580乙2075丙3055丁2525總數(shù)80 由組距分組資料求中位數(shù)由組距分組資料求中位數(shù) 具體方法是:先列出累計頻數(shù),然后按同樣的方法確具體方法是:先列出累計頻數(shù),然后
23、按同樣的方法確定中位數(shù)所在的組,最后利用下述公式計算出中位數(shù)的值。定中位數(shù)所在的組,最后利用下述公式計算出中位數(shù)的值。 L L為中位數(shù)所在組的下限值;為中位數(shù)所在組的下限值; CfCf(m -1)(m -1)為中位數(shù)所在組以上的累計頻數(shù);為中位數(shù)所在組以上的累計頻數(shù); f fm m為為中位數(shù)所在組的頻數(shù);中位數(shù)所在組的頻數(shù); i為中位數(shù)所在組的組距;為中位數(shù)所在組的組距; n=全部個案數(shù)目。全部個案數(shù)目。ifcfm1m2nL中位數(shù)表5 各鄉(xiāng)育齡婦女節(jié)育情況節(jié)育率(%)fcf5%或以下16165 % -15 %385415 % -25 %409425 % -35 %3012435 % -45 %
24、2314745 % -55 %2417155 % -65 %1919065 %或以上22212總數(shù)212 如何根據表5的分組資料來計算中位數(shù)呢?首先是將各組的次數(shù)(f)向上累加起來(cf),繼而求出中位數(shù)的位置,(n-1)/2=(212-1)/2=105.5。根據向上累加次數(shù)的分布,第105.5個位置的值應在25%至35%的組內。既然中位數(shù)應在“25 -35 ”組內,如何求出中位數(shù)呢?將公式用于上例,就是L=25.5, fm =30,i=35.5-25.5=10, Cf(m -1) =94,n=212。因此,中位數(shù)是: 換言之,在212個鄉(xiāng)中,有半數(shù)鄉(xiāng)的育齡婦女節(jié)育率低于29.5%,也有半數(shù)高
25、于29.5%。 中位數(shù)具有估計或預測的意義。如上例的節(jié)育率研究,假定從212個鄉(xiāng)中任意抽取一個鄉(xiāng),我們估計其節(jié)育率是29.5%。長遠來說,以中位數(shù)去估計定序變項的數(shù)值,所犯的錯誤總數(shù)是最小的。21294225.51029.530dMminMxn1iei 中位數(shù)特點:中位數(shù)特點: 不受極端值的影響;不受極端值的影響; 主要用于順序數(shù)據,也可用于數(shù)值型數(shù)據,主要用于順序數(shù)據,也可用于數(shù)值型數(shù)據,但不能用于分類數(shù)據,各變量值與中位數(shù)的但不能用于分類數(shù)據,各變量值與中位數(shù)的離差絕對值之和最小,即離差絕對值之和最小,即(4 4)中位數(shù)與平均數(shù)的比較)中位數(shù)與平均數(shù)的比較v平均數(shù)要求計算所有的數(shù)值;而中位
26、數(shù)只用平均數(shù)要求計算所有的數(shù)值;而中位數(shù)只用到數(shù)值的相對位置。一般來說平均數(shù)比中位到數(shù)值的相對位置。一般來說平均數(shù)比中位數(shù)利用了更多的信息,更全面和準確。數(shù)利用了更多的信息,更全面和準確。v平均數(shù)容易受到極端值的影響;中位數(shù)則不平均數(shù)容易受到極端值的影響;中位數(shù)則不會受到這種影響。會受到這種影響。v平均數(shù)是一種比中位數(shù)更為穩(wěn)定的量度,它平均數(shù)是一種比中位數(shù)更為穩(wěn)定的量度,它隨樣本的變化比較少。隨樣本的變化比較少。v 平均數(shù)要求定距以上變量;中位數(shù)要求定序平均數(shù)要求定距以上變量;中位數(shù)要求定序以上變量。以上變量。 總的說來,如要測量集中趨勢,即找出一個最有代表性之值,定類變項的資料可用眾數(shù);定序
27、變項可用眾數(shù),但以中位數(shù)較適宜,因為后者能夠應用資料中所具有的等級數(shù)學性質。 定距變項以均值最適宜,因為它能應用資料中所具有的加減數(shù)學性質。 但是,有兩種情況不宜用均值。 一種情況是在分組資料中的極端組沒有組限時,不能求出均值,只能用中位數(shù); 另一種情況是變量中有個別的數(shù)值非常特殊,則均值的代表性就有疑問。用中位數(shù)比較合適。如有些地區(qū)的家庭貧富極為懸殊,計算平均收入就沒有什么意義,可以改用中位數(shù)來表示地區(qū)的經濟水平。(二)離散量數(shù)分析 離散量數(shù)分析,是要求出一個值來表示個案與個案之間的差異情況。這種分析法,與上節(jié)所講的集中量數(shù)分析具有互相補充的作用。 集中量數(shù)分析是一個最能代表變量所有資料的值
28、,但其代表性的高低卻要視各個個案之間的差異情況。如果個案之間的差異很大,則眾數(shù)、中位數(shù)或均值的代表性就會甚低;在此情況下,如果以眾數(shù)、中位數(shù)或均值作估計或預測,所犯的錯誤就會很大。 因此,對于每個變量的資料,我們要測量其集中趨勢,也要測量其離散或差異的程度。 離散量數(shù):指用一個特別的數(shù)值來反映離散量數(shù):指用一個特別的數(shù)值來反映一組數(shù)據相互之間的離散程度。一組數(shù)據相互之間的離散程度。 作用:作用: 與集中量數(shù)一起,共同反映資料分布與集中量數(shù)一起,共同反映資料分布的全面特征;的全面特征; 對相應的集中量數(shù)的代表性作補充說對相應的集中量數(shù)的代表性作補充說明。明。 適用條件:主要用于數(shù)值型數(shù)據適用條件
29、:主要用于數(shù)值型數(shù)據例1:兩人的5次測驗成績如下: X: 50,100,100,60,50 E(X )=72; Y: 73, 70, 75,72,70 E(Y )=72。 平均成績相同,但X不穩(wěn)定,對平均值的偏離大。 對于一組數(shù)據整體,只有既用集中量數(shù)描述其平均水平和典型情況,又用離散量數(shù)反映其分散性、變異性等特殊情況,才能真實描繪出這組數(shù)據整體的全貌。 所謂離散量數(shù),就是表示一組數(shù)據變異程度或分散程度的量數(shù)。離散量數(shù)越大,表示數(shù)據分布范圍越廣,越不集中,越不整齊;反之,離散量數(shù)越小,表示數(shù)據分布范圍越集中,變動程度越小。 常用的是: (1)全距(也叫極差) (2)方差 (3)標準差(與平均數(shù)
30、對應) (4)異眾比率(與眾數(shù)對應) (5)四分位差(與中位數(shù)對應) (6)離散系數(shù)。iixMinimumxMaximumR(1 1)全距(極差)()全距(極差)(angeange)v定義:一組數(shù)據的最大值與最小值之差定義:一組數(shù)據的最大值與最小值之差v計算公式:計算公式:F測量的是數(shù)據的分散程度,就是樣本中最大值與最小測量的是數(shù)據的分散程度,就是樣本中最大值與最小值之差。值之差。F全距直接到奇異值的影響;全距直接到奇異值的影響;F反映標志值的變動范圍;反映標志值的變動范圍;F全距計算簡便,易于理解,應用普遍。全距計算簡便,易于理解,應用普遍。F全距的計算全距的計算: :全距全距= =最大標志
31、值最大標志值- -最小標志值最小標志值全距的特征:全距的特征:v離散程度的最簡單測度值;離散程度的最簡單測度值;v易受極端值的影響;易受極端值的影響;v未考慮數(shù)據的分布。未考慮數(shù)據的分布。 意義:意義:v極差越大,在一定程度上說明這組數(shù)據的離極差越大,在一定程度上說明這組數(shù)據的離散程度越大,集中量數(shù)的代表性越低。散程度越大,集中量數(shù)的代表性越低。(2)方差 方差是一種重要的離散量數(shù),它的計算方法是,把一組數(shù)據中每個數(shù)據與該組算術平均數(shù)相減,將其差進行平方然后相加,再除以數(shù)據的個數(shù)。如何計算一組數(shù)據的方差?如何計算一組數(shù)據的方差?計算三個數(shù)據計算三個數(shù)據x1、x2,x3方差方差計算三個數(shù)據計算三
32、個數(shù)據x1、x2,x3方差方差 一般地,如果一組數(shù)據的個數(shù)是一般地,如果一組數(shù)據的個數(shù)是n,那么它,那么它們的方差可以用下面的公式計算:們的方差可以用下面的公式計算: 當一組數(shù)據中的數(shù)當一組數(shù)據中的數(shù)較小較小時,用公式時,用公式計計算方差比公式算方差比公式計算少了求各數(shù)據與平均數(shù)計算少了求各數(shù)據與平均數(shù)的差一步,因此比較方便的差一步,因此比較方便練習:計算下面數(shù)據的方差練習:計算下面數(shù)據的方差(結果保留結果保留到小數(shù)點后第到小數(shù)點后第1位位):3 -1 2 1 -3 3當一組數(shù)據當一組數(shù)據較大較大時,可按下述公式計算方差:時,可按下述公式計算方差:其中其中x1=x1-a,x2=x2-a,xn=
33、xn-a;x1,x2,xn是原已知的是原已知的n個數(shù)據,個數(shù)據,a是接近這組是接近這組數(shù)據的平均數(shù)的一個常數(shù)數(shù)據的平均數(shù)的一個常數(shù)例:甲、乙兩個小組各例:甲、乙兩個小組各10名學生的英語口語名學生的英語口語測驗成績如下測驗成績如下(單位:分單位:分): 哪個小組學生的成績比較整齊?哪個小組學生的成績比較整齊? (3)代入公式代入公式計算方差并計算方差并比較得解比較得解解題步驟解題步驟練習:在某次數(shù)學考試中,甲、乙兩校練習:在某次數(shù)學考試中,甲、乙兩校各各8個班,不及格的人數(shù)分別如下:個班,不及格的人數(shù)分別如下: 分別計算這兩組數(shù)據的平均數(shù)與方差分別計算這兩組數(shù)據的平均數(shù)與方差 (3 3)標準差
34、:)標準差:Standard DeviationStandard Deviation 一組數(shù)據對其平均數(shù)的偏差的平方的算術一組數(shù)據對其平均數(shù)的偏差的平方的算術平均數(shù)的平方根。平均數(shù)的平方根。(方差的算術平方根方差的算術平方根)nXXs2)(標準差 分析定距變量的離散情況,最常用的方法是標準差(簡寫S),即將各數(shù)值(x)與其均值之差的平方和除以全部個案數(shù)目,然后取其平方根。公式如下: s= 計算標準差,可以根據原資料,也可以根據分組資料。21()niiXXn標準差 標準差是最重要、應用最廣泛的離散量數(shù)。標準差的值越大,表明數(shù)據的離散程度越大,也就是數(shù)據的差異性越大,分布越不均勻;反之,標準差越小
35、,則是數(shù)據的離散程度越小,數(shù)據的差異性越小,數(shù)據越整齊。 例:某校例:某校3個系各選個系各選5名同學,參加智力名同學,參加智力競賽,他們的成績分別如下:競賽,他們的成績分別如下: 中文系:中文系:78、79、80、81、82 數(shù)學系:數(shù)學系:65、72、80、88、95 英語系:英語系:35、78、89、98、100標準差的計算標準差的計算 (1 1)根據原始資料計算)根據原始資料計算 nXXS2家庭規(guī)模戶數(shù) 2人10 3人120 4人50 5人20 合計200 v 210+3120+450+520vX= =3.4人v 200用原始資料求標準差 例題:在調查甲地的十個鄉(xiāng)的衛(wèi)生情況時,發(fā)現(xiàn)每個鄉(xiāng)
36、的衛(wèi)生戶比率如下:8 18 14 14 8 15 12 17 12 19 則 標準差是3.6。 換言之,平均每鄉(xiāng)有13.7%是衛(wèi)生戶,而反映各鄉(xiāng)差異的標準差數(shù)值是3.6。在這里要解釋的是,標準差數(shù)值在相互比較中更能突出其意義。例如,在調查乙鄉(xiāng)的衛(wèi)生戶比率時,假定均值是18.5,標準差是1.7,對比之下,乙地各鄉(xiāng)的差異程度小于甲地。 標準差有另一種意義,就是表示用均值作估計或預測變項值時所犯錯誤的大小。818141913.710 x 222(8 13.7)(18 13.7)(19 13.7)10s (2 2)單值分組數(shù)據資料計算)單值分組數(shù)據資料計算 nfXXS2家庭規(guī)模戶數(shù)X-X(X-X)2(
37、X-X)2f2人10-1.41.9619.63人120-0.40.1619.24人500.60.36185人201.62.5651.2合計200108 例題:某校三個系各選名同學,參加智力競賽,他們的成績如下: 中文系:78 79 80 81 82 數(shù)學系:65 72 80 88 95 英語系:35 78 89 98 100 無論從團體總分來看,還是從平均分來看,這三個系代表隊的成績都是相同的。那么,均值到底對哪一個代表隊的代表性高呢?用前面的公式可得: 中文系=1.414 數(shù)學系=10.8 英語系=23.8 由此證明,平均成績對中文系代表隊的代表性最大,對英語系的代表性最小。(3 3)組距分
38、組資料計算:)組距分組資料計算: 先計算出各組的組中值,然后先計算出各組的組中值,然后按單值分組資料計算公式和方法計按單值分組資料計算公式和方法計算即可。算即可。青年人閱讀小說書的數(shù)目書數(shù)f2-42365-746248-10594511-133123614-162153017-1911818總數(shù)17159 按照公式,可知每名青年人一年來讀過9.4本小說書。mxmfx用組距分組資料求標準差公式是:其中的Xm是每組的組中點,f是該組的次數(shù)。例如,據前面的資料,可知17名青年人一年來閱讀小說書數(shù)目的均值是9.4本。彼此的差異情況可用標準差證明。2()mfxxsn(4 4)異眾率)異眾率Variati
39、on RatioVariation Ratiov含義:一組數(shù)據中非眾數(shù)的次數(shù)相對于總體全部含義:一組數(shù)據中非眾數(shù)的次數(shù)相對于總體全部單位的比率。單位的比率。v計算表計算表3的異眾率。的異眾率。nfnVRmo 表表 3. 某某 年年 級級 學學 生生 的的 年年 齡齡 分分 布布 年 齡 人 數(shù) (頻 數(shù) ) 累 計 頻 數(shù) 累 計 頻 數(shù) 17 10 10 150 18 25 35 140 19 50 85 115 20 40 125 65 21 20 145 25 22 5 150 5 合 計 150 150-50 VR= =0.67=67% 150異眾比率的意義與作用異眾比率的意義與作用v
40、意義:眾數(shù)所不能代表的其他數(shù)值,即非眾數(shù)的數(shù)意義:眾數(shù)所不能代表的其他數(shù)值,即非眾數(shù)的數(shù)值在總體中的比重。值在總體中的比重。v作用:異眾比率越大,即眾數(shù)所不能代表的其他數(shù)作用:異眾比率越大,即眾數(shù)所不能代表的其他數(shù)值在總體中的比重越大時,眾數(shù)在總體中所占的比值在總體中的比重越大時,眾數(shù)在總體中所占的比重自然越小,眾數(shù)的代表性越小。重自然越小,眾數(shù)的代表性越小。v反之,異眾比率越小,即眾數(shù)所不能代表的其他數(shù)反之,異眾比率越小,即眾數(shù)所不能代表的其他數(shù)值在總體中的比重越小,眾數(shù)的代表性越大。值在總體中的比重越小,眾數(shù)的代表性越大。(5 5)四分位差)四分位差Interquartile RangeI
41、nterquartile Range 先將一組數(shù)據按大小排列順序,然后將先將一組數(shù)據按大小排列順序,然后將其其4等分,去掉序列中最高的等分,去掉序列中最高的1/4和最低的和最低的1/4,僅就中間的一半數(shù)值來測定序列的全距。僅就中間的一半數(shù)值來測定序列的全距。 Q1的位置的位置(第一個四分位點第一個四分位點)=(n1)/4 Q3的位置的位置(第三個四分位點第三個四分位點)=3(n1)/4 QD=Q3-Q1四分位差 計算方法,是將個案由低至高排列,然后分為四個等分(即每個等分包括25%的個案,則第一個四分位差的值(Q1)與第三個四分位置的值(Q3)的差異,就是四分位差(簡寫Q),公式是:Q=Q3-
42、Q1 低 Q1 Q2 Q3 高 上圖表示四個等分。Q2就是眾數(shù),兩邊各有50%的個案。要注意的是,在中位數(shù)的兩旁的Q1和Q3之間,共有50%的個案。因此,Q1與Q3的差異愈大,表示有50%的個案的分布愈遠離中位數(shù),因而中位數(shù)的代表性就愈小,以之作為估計或預測的標準所犯的錯誤就愈大。計算四分位差時,先要求出Q1的位置和Q3的位置,然后計算在這兩個位置上的值的差異。計算四分位差的方法計算四分位差的方法(1)對原始資料: 例1:調查11位同學的年齡如下:17歲、18歲、18歲、19歲、19歲、20歲、20歲、21歲、21歲、22歲、。 首先,求出Q1和Q3的位置: Q1 的位置= = =3 Q3的位
43、置= = =9 其次,從數(shù)序中找出Q1=18,Q3=21 則四分位差Q= Q3Q1=2118=34111 41n4) 1(3n4)111(3計算四分位差的方法 例2:甲村有8戶人家,每戶人數(shù)如下: 2,3,4,7,9,10,12,12 首先,求出Q1位置= =2.25 Q1=3+0.25(43)=3.25 Q3 位置= =675 Q3=10+0.75(1210)=11.5 所以Q=11.5 3.25=8.25418 418 (3)(2)對單值分組資料 表9-4學生的學業(yè)成績 等級 f cf cf甲乙丙丁 5 5 80 20 25 75 30 55 55 25 80 25 總數(shù) 80據公式可知:
44、 Q1位置= =20.25 Q3位置= =60.75 從累積次數(shù)分布表中,很易看到在這兩個位置上的值分別是丁級和乙級,所以 Q=乙丁=兩個等級4180 4)180(3(3)對組距分組資料:對組距分組資料Q1和Q3的計算公式為: Q1=L1+ w1 Q3=L3+ w3114fcfn3433fcfn其中 L1=Q1屬組之真實下限L3= Q3屬組之真實下限f1=Q1屬組之次數(shù)f3= Q3屬組之次數(shù)cf1=低于Q1屬組下限之累積次數(shù)cf3=低于Q3屬組下限之累積次數(shù)w1=Q1屬組之組距w3=Q3屬組之組距n為全部個案數(shù)表9-5某企業(yè)100名職工收入的分布收入(元) 職工數(shù)(人) 累計頻數(shù) 組中值 Xf
45、100199 10 10 150 1500200299 10 20 250 2500300399 40 60 35020 80 450 9000500599 20 100 550 11000合計 100表9-5所示的資料 其Q1位置= = =25.25, 所以Q1在300399組內; Q3位置= = =75.75, 所以Q3在400499組內。 41n411004)1(3n4) 1100( 3由公式可知: Q1=300+ 100=312.5 Q3=400+ 100=475 所以Q=Q3-Q1=162.540204100206041003(6 6)離散系數(shù))離散系數(shù) 離
46、散系數(shù):離散系數(shù):Coefficient of Variation,標準差,標準差與平均數(shù)的比值,用百分比表示。與平均數(shù)的比值,用百分比表示。v意義:對同一總體中的兩種不同的離散量數(shù)統(tǒng)計量意義:對同一總體中的兩種不同的離散量數(shù)統(tǒng)計量進行比較;對兩個不同總體中的同一離散量數(shù)統(tǒng)計進行比較;對兩個不同總體中的同一離散量數(shù)統(tǒng)計量進行比較。量進行比較。v公式:公式:%100XsCVv例題:對廣州和武漢兩地居民生活質量調查發(fā)現(xiàn),廣州居民平均收入為680元,標準差為120元;武漢居民平均收入為360元,標準差為80元。問廣州居民相互之間在收入的差異程度,與武漢居民相互之間在收入上的差異程度哪一個更大一些?v
47、廣州居民收入的離散系數(shù)為v武漢居民收入的離散系數(shù)為v可見,比較而言,武漢居民相互之間在收入上的差異程度,比廣州居民相互之間的差異程度更大一些。120100%17.6%680cv 80100%22.2%360cv 請計算下表中工人之間的收入差別與教師之請計算下表中工人之間的收入差別與教師之間的差別哪個更大?間的差別哪個更大?收入工人數(shù)教師數(shù)3004005006003020302020304010合計100100二、單變量推論統(tǒng)計二、單變量推論統(tǒng)計v推論統(tǒng)計推論統(tǒng)計利用樣本的統(tǒng)計值對總體的參利用樣本的統(tǒng)計值對總體的參數(shù)值進行估計的方法。數(shù)值進行估計的方法。v1、區(qū)間估計(、區(qū)間估計(Interva
48、l Estimation)v就是在一定的可信度(置信度)下,用樣本就是在一定的可信度(置信度)下,用樣本統(tǒng)計值的某個范圍(置信區(qū)間)來估計總體統(tǒng)計值的某個范圍(置信區(qū)間)來估計總體的參數(shù)值。的參數(shù)值。v表述:表述:“我們有我們有95的把握認為,全市職工的把握認為,全市職工的工資收入在的工資收入在182元至元至218元之間元之間”區(qū)間估計區(qū)間估計v注意:區(qū)間估計中的可靠性和區(qū)間大小成正比關注意:區(qū)間估計中的可靠性和區(qū)間大小成正比關系系v(1)總體均值的區(qū)間估計)總體均值的區(qū)間估計v公式:公式:nSZX)1(區(qū)間估計區(qū)間估計v區(qū)間估計中的可取性或把握性是指用某區(qū)間估計中的可取性或把握性是指用某個區(qū)
49、間去估計總體參數(shù)時,成功的可能個區(qū)間去估計總體參數(shù)時,成功的可能性有多大。對于同一總體和同一抽樣規(guī)性有多大。對于同一總體和同一抽樣規(guī)模來說,所給區(qū)間的大小與作出這種估模來說,所給區(qū)間的大小與作出這種估計所具有的把握性成正比。因此,人們計所具有的把握性成正比。因此,人們總是需要在這兩者之間進行平衡和選擇??偸切枰谶@兩者之間進行平衡和選擇。 區(qū)間估計的一般程序區(qū)間估計的一般程序v第一,確定置信水平。社會研究一般用第一,確定置信水平。社會研究一般用90、95和和99的置信水平。在計算中,置信度的置信水平。在計算中,置信度常用常用1a來表示。來表示。v第二,計算標準誤差,根據樣本分布特點和第二,計算
50、標準誤差,根據樣本分布特點和樣本不同統(tǒng)計值,分別采用不同的方法確定樣本不同統(tǒng)計值,分別采用不同的方法確定標準誤差。標準誤差。v第三,根據樣本統(tǒng)計值和標準誤差確定置信第三,根據樣本統(tǒng)計值和標準誤差確定置信區(qū)間。區(qū)間。v例例10、調查某廠職工的工資狀況,隨機抽取、調查某廠職工的工資狀況,隨機抽取900名工人作樣本,調查得到他們的月平均名工人作樣本,調查得到他們的月平均工資為工資為186元,標準差為元,標準差為42元。求元。求95的置的置信度下,全廠職工的月平均工資的置信區(qū)間信度下,全廠職工的月平均工資的置信區(qū)間是多少是多少?總體均值的區(qū)間估計v將調查資料代入總體均值的區(qū)間估計公式得將調查資料代入總
51、體均值的區(qū)間估計公式得v查查 得得 ,故總體均值的置信,故總體均值的置信區(qū)間為區(qū)間為v 即即183.26188.74元元(1 0.05)42186900zz(1 0.05)1.96z42186 1.96900v練習:練習:v 從某校隨機抽取從某校隨機抽取300名教師進行調查,得名教師進行調查,得出他們的平均年齡為出他們的平均年齡為42歲,標準差為歲,標準差為5歲。歲。 求求95的置信度下,該校全體教師平均年齡的置信度下,該校全體教師平均年齡的置信區(qū)間是多少。的置信區(qū)間是多少。區(qū)間估計區(qū)間估計v(2)總體百分比的區(qū)間估計)總體百分比的區(qū)間估計v公式:公式:nppZp)1 ()1 (v 例11 從
52、某工廠隨機抽取400名工人進行調查,結果表明女工的比例為20?,F(xiàn)在要求在90的置信度下,估計全廠工人中女工比例的置信區(qū)間。v練習:練習:v 從某高校隨機抽取從某高校隨機抽取200名學生進行調查,名學生進行調查,發(fā)現(xiàn)抽煙的比例為發(fā)現(xiàn)抽煙的比例為15?,F(xiàn)要求在?,F(xiàn)要求在95的置的置信度下,估計全校學生中抽煙比例的置信區(qū)信度下,估計全校學生中抽煙比例的置信區(qū)間。間。2、假設檢驗、假設檢驗v(1)概念:統(tǒng)計假設,非理論假設)概念:統(tǒng)計假設,非理論假設 先對總體的某一參數(shù)指作出假設,先對總體的某一參數(shù)指作出假設,然后用樣本的統(tǒng)計量去進行驗證,以決定然后用樣本的統(tǒng)計量去進行驗證,以決定假設是否為總體所接受
53、。假設是否為總體所接受。v例如:例如: 根據以往的資料,某地女青年的平均初根據以往的資料,某地女青年的平均初婚年齡是婚年齡是20歲,但今年根據歲,但今年根據100名女青年名女青年的隨機抽樣調查,平均年齡為的隨機抽樣調查,平均年齡為21歲,問能歲,問能否認為該地女青年的初婚年齡比以往有所否認為該地女青年的初婚年齡比以往有所推遲?推遲?v又如:又如:根據隨機調查,文化程度高的家庭,平均子女數(shù)也要少根據隨機調查,文化程度高的家庭,平均子女數(shù)也要少些。兩者呈負相關些。兩者呈負相關r0.3。問這樣的結論是否具有普。問這樣的結論是否具有普遍性遍性v(2)原假設和備擇假設)原假設和備擇假設v原假設原假設H0
54、 :又稱虛無假設,:又稱虛無假設,u20歲,歲,r0.3v備擇假設備擇假設H1:又稱研究假設,有三種情況:又稱研究假設,有三種情況vu20, u20 或或 u 20v前兩種情況稱為單邊假設,第三種情況稱為雙邊假設。前兩種情況稱為單邊假設,第三種情況稱為雙邊假設。v(3)假設檢驗的基本原理:小概率原理)假設檢驗的基本原理:小概率原理v兩個方面:兩個方面: A、小概率事件在一次觀察中是不可能出現(xiàn)、小概率事件在一次觀察中是不可能出現(xiàn)的。的。 B、如果在一次觀察中出現(xiàn)了小概率事件,、如果在一次觀察中出現(xiàn)了小概率事件,那么,合理的想法,是否定原有事件具有小那么,合理的想法,是否定原有事件具有小概率從假設
55、。概率從假設。(4)步驟:)步驟:v建立虛無假設,建立虛無假設,v根據需要選擇適當?shù)娘@著性水平(小概率的值,根據需要選擇適當?shù)娘@著性水平(小概率的值,通常有通常有 0.05, =0.010.05, =0.01等等)v根據樣本數(shù)據計算出統(tǒng)計值,并根據顯著性水根據樣本數(shù)據計算出統(tǒng)計值,并根據顯著性水平查出對應的臨界值。平查出對應的臨界值。v將臨界值與統(tǒng)計值比較,若統(tǒng)計值將臨界值與統(tǒng)計值比較,若統(tǒng)計值Z的絕對值小的絕對值小于臨界值,則樣本統(tǒng)計值落入接受域,接受虛無于臨界值,則樣本統(tǒng)計值落入接受域,接受虛無假設,反之,則樣本統(tǒng)計值落入拒絕域,拒絕虛假設,反之,則樣本統(tǒng)計值落入拒絕域,拒絕虛無假設,接受
56、研究假設。無假設,接受研究假設。(5)總體均值檢驗)總體均值檢驗v例:見書例:見書v公式:公式:vX:樣本平均值:樣本平均值vM:假設平均值:假設平均值v書上例書上例12nSMXz/v 例12 某單位職工上月平均收人為210元,本月調查了100名職工,平均月收入為220元,標準差為15元。問該單位職工本月平均收入與上月相比是否有變化?例題v解:首先建立虛無假設(用H0表示)和研究假設(用H1表示),即有vH0:M=210 H1:M210 v選擇顯著性水平a =005,由標準正態(tài)分布查vZ(0.05/2)=1.96v然后根據樣本數(shù)據計算統(tǒng)計值,其公式為:v v由于, 所以,拒絕虛無假v設,接受研
57、究假設,即從總體上來說,該單位職工月平均收入與上月相比有變化。2202106.6715100 xzsn(0.05/2)6.671.96zzNoImagev解 首先建立虛無假設(用 表示)和研究假設(用 表示),即有: v v 選擇顯著性水平 a=0.05 ,查表得 v 計算統(tǒng)計量 由于 Z=6.67 ,所以,拒絕虛無假設,接受研究假設。即從總體上說,該單位職工月平均收入與上月相比有變化。0H1H96. 1Z)205. 0(210:210:10MHMH67. 610015210220nSM-XZ96. 1Z)205. 0((6)總體百分比的假設檢驗)總體百分比的假設檢驗v例:見書例例:見書例13
58、v公式:公式:nppppZ)1 (000v 例例13 一所大學全體學生中抽煙者的比例為一所大學全體學生中抽煙者的比例為35,經過學習和戒煙宣傳后,隨機抽取,經過學習和戒煙宣傳后,隨機抽取100名大學生進行調查,結果發(fā)現(xiàn)抽煙者為名大學生進行調查,結果發(fā)現(xiàn)抽煙者為25名。問戒煙宣傳是否收到了成效名。問戒煙宣傳是否收到了成效?v解 設 v 選擇顯著性水平 a=0.05 ,查表得 v 計算統(tǒng)計量 由于 ,所以,拒絕虛無假設,接受研究假設。即從總體上說,戒煙宣傳收到了成效。35. 0:35. 0:1100pHpH56 . 1Z)05. 0(1 . 210035. 0135. 035. 025. 0n)p
59、-(1pp-pZ0001 . 2Z65. 105. 0Z任務三:雙變量統(tǒng)計分析v交互分類與 檢驗v不同層次變量的相關測量與檢驗v回歸分析2交互分類v 交互分類是一種專門用來分析兩個定類變量(或一個定類,一個定序變量)之間關系的方法。它是將研究所得的一組數(shù)據按照兩個不同的變量進行綜合的分類,其結果通常以交互分類表的形式反映出來,又稱列聯(lián)表。 表3-1 千戶家庭居住地與戶主從事的產業(yè)產業(yè)地區(qū)總數(shù)東部中部西部農業(yè)28301472工業(yè)248330122700商業(yè)、服務業(yè)2056130206建筑業(yè)43714運輸0178總數(shù)3004202801000 從表中可以清楚地看到每種地區(qū)條件下,戶主從事產業(yè)的分布
60、情況。因此這樣的表又叫做條件次數(shù)表。表的最下一行和最右一列分別是每種地區(qū)和產業(yè)的總次數(shù),稱為邊緣次數(shù),其分布稱為邊緣分布。其余的次數(shù)稱為條件次數(shù)。每一條件下的分布稱為條件分布。 條件次數(shù)表的數(shù)字是絕對數(shù)字,由于各個類別的基數(shù)不同,相互之間無法進行比較,因而不能看出兩變量之間的關系。為了克服這一缺點,使各個類別之間可比,應將表中的絕對數(shù)字轉換成相對數(shù)字百分數(shù),這樣制作成的表稱為條件百分表。 表3-2 千戶家庭所在地區(qū)與戶主從事的產業(yè) 產業(yè)地區(qū)東部中部西部農業(yè)9.3%7.1%5.0%工業(yè)82.778.743.6商業(yè)、服務業(yè)6.713.346.4建筑業(yè)1.30.72.5運輸業(yè)00.22.5總數(shù)300
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年時光的落幕黑金色年終匯報的魅力
- 2025年陽春公共衛(wèi)生醫(yī)院筆試及答案
- 2025年深圳教師事業(yè)編考試試題及答案
- 2025年-運營商通信類筆試及答案
- 2025年小學科學教師編筆試及答案
- 2026上海證券交易所員工招聘筆試模擬試題及答案解析
- 2025年興安盟事業(yè)編公告筆試及答案
- 2025年紅旗區(qū)事業(yè)編考試真題及答案
- 2026年《鉆探技術的創(chuàng)新與發(fā)展趨勢》
- 2026曲靖市事業(yè)單位公開招聘工作人員(889人)考試備考試題及答案解析
- 2025年網約車司機收入分成合同
- 2026年海南財金銀河私募基金管理有限公司招聘備考題庫參考答案詳解
- 2026年GRE數(shù)學部分測試及答案
- 浙江省寧波市鎮(zhèn)海中學2026屆高二上數(shù)學期末教學質量檢測模擬試題含解析
- (2025年)電力交易員練習試題附答案
- 2026年咨詢工程師現(xiàn)代咨詢方法與實務模擬測試含答案
- 甘肅省酒泉市2025-2026學年高一上學期期末語文試題(解析版)
- GB/T 3634.1-2025氫氣第1部分:工業(yè)氫
- JJG 499-2021 精密露點儀檢定規(guī)程
- T-CPQS A0011-2022 二手車車況檢測及評估通則
- 吸毒的危害性后果
評論
0/150
提交評論