版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
背景統(tǒng)計(jì)分析中,我們常常會(huì)遇到一些定性的數(shù)據(jù)性別(男、女)態(tài)度(喜歡、不喜歡)性別對(duì)態(tài)度是否有影響1.可使用列聯(lián)表分析技術(shù)2.可運(yùn)用對(duì)數(shù)線性模型與Logistic模型分析技術(shù)2025/11/261主要內(nèi)容2025/11/262第一節(jié)
分類數(shù)據(jù)與列聯(lián)表
一、分類數(shù)據(jù)
二、列聯(lián)表的構(gòu)造
三、列聯(lián)表的分布2025/11/263分類變量的結(jié)果表現(xiàn)為類別例如:性別(男,女)各類別用符號(hào)或數(shù)字代碼來測(cè)度使用分類或順序尺度你吸煙嗎?1.是;2.否你贊成還是反對(duì)這一改革方案?1.贊成;2.反對(duì)對(duì)分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用
檢驗(yàn)數(shù)值型數(shù)據(jù)也可以轉(zhuǎn)化為分類數(shù)據(jù)一、分類數(shù)據(jù)2025/11/264由兩個(gè)以上的變量交叉分類的頻數(shù)分布表行變量的類別用r
表示,ri
表示第i
個(gè)類別列變量的類別用c
表示,cj
表示第j
個(gè)類別每種組合的觀察頻數(shù)用fij
表示表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表一個(gè)
r行c
列的列聯(lián)表稱為r
c
列聯(lián)表二、列聯(lián)表的構(gòu)造-----列聯(lián)表
(contingencytable)2025/11/265列聯(lián)表的結(jié)構(gòu)(22列聯(lián)表)列(cj)合計(jì)j=1j=1i=1f11f12f11+f12i=2f21f22f21+f22合計(jì)f11+f21f12+f22n列(cj)行(ri)2025/11/266列聯(lián)表的結(jié)構(gòu)
(rc列聯(lián)表的一般表示)列(cj)合計(jì)j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計(jì)c1c2…n列(cj)行(ri)fij
表示第i
行第j
列的觀察頻數(shù)2025/11/267例題分析一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對(duì)該方案32753331141合計(jì)10012090110420【例】一個(gè)集團(tuán)公司在四個(gè)不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個(gè)分公司共抽取420個(gè)樣本單位(人),了解職工對(duì)此項(xiàng)改革的看法,調(diào)查結(jié)果如下表2025/11/268邊緣分布行邊緣分布行觀察值的合計(jì)數(shù)的分布例如,贊成改革方案的共有279人,反對(duì)改革方案的141人列邊緣分布列觀察值的合計(jì)數(shù)的分布例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y
的分布,或在變量Y
條件下變量X
的分布每個(gè)具體的觀察值稱為條件頻數(shù)二、列聯(lián)表的分布----觀察值的分布2025/11/269觀察值的分布(圖示)一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對(duì)該方案32453331141合計(jì)10012090110420行邊緣分布列邊緣分布條件頻數(shù)2025/11/2610條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對(duì)比為在相同的基數(shù)上進(jìn)行比較,可以計(jì)算相應(yīng)的百分比,稱為百分比分布行百分比:行的每一個(gè)觀察頻數(shù)除以相應(yīng)的行合計(jì)數(shù)(fij
/ri)列百分比:列的每一個(gè)觀察頻數(shù)除以相應(yīng)的列合計(jì)數(shù)(fij
/cj)總百分比:每一個(gè)觀察值除以觀察值的總個(gè)數(shù)(fij
/n)百分比分布(概念要點(diǎn))2025/11/2611百分比分布(圖示)一分公司二分公司三分公司四分公司合計(jì)贊成該方案24.4%26.9%20.4%28.3%66.4%68.0%62.5%63.3571.8%—16.2%17.8%13.6%18.8%—反對(duì)該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合計(jì)23.8%28.6%21.4%26.2%100%總百分比列百分比行百分比2025/11/2612假定行變量和列變量是獨(dú)立的一個(gè)實(shí)際頻數(shù)fij
的期望頻數(shù)eij
,是總頻數(shù)的個(gè)數(shù)n乘以該實(shí)際頻數(shù)fij
落入第i
行和第j列的概率,即期望頻數(shù)的分布2025/11/2613期望頻數(shù)的分布(例題分析)由于觀察頻數(shù)的總數(shù)為n
,所以f11
的期望頻數(shù)e11應(yīng)為例如,第1行和第1列的實(shí)際頻數(shù)為f11
,它落在第1行的概率估計(jì)值為該行的頻數(shù)之和r1除以總頻數(shù)的個(gè)數(shù)n
,即:r1/n;它落在第1列的概率的估計(jì)值為該列的頻數(shù)之和c1除以總頻數(shù)的個(gè)數(shù)n
,即:c1/n。根據(jù)概率的乘法公式,該頻數(shù)落在第1行和第1列的概率應(yīng)為2025/11/2614期望頻數(shù)的分布(例題分析)一分公司二分公司三分公司四分公司贊成該方案實(shí)際頻數(shù)68755779期望頻數(shù)66806073反對(duì)該方案實(shí)際頻數(shù)32753331期望頻數(shù)344030372025/11/2615第二節(jié)
檢驗(yàn)一、
統(tǒng)計(jì)量二、擬合優(yōu)度檢驗(yàn)2025/11/2616用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于測(cè)定兩個(gè)分類變量之間的相關(guān)程度計(jì)算公式為
其自由度為
式中--列聯(lián)表中第i行第j列類別的實(shí)際頻數(shù)
--列聯(lián)表中第i行第j列類別的期望頻數(shù)一、
統(tǒng)計(jì)量2025/11/2617條件百分表的方向(例題數(shù)據(jù))變量X條件下變量Y的分布,或在變量Y條件下變量X的分布差值的大小可以反映變量之間相關(guān)程度的高低。在廣告宣傳戰(zhàn)之前,A公司的市場(chǎng)占有率為45%,B公司的市場(chǎng)占有率為40%,其他公司的市場(chǎng)占有率為15%。相關(guān)系數(shù)計(jì)算公式為V的取值范圍是0V1故要擴(kuò)大犯罪青少年的樣本量,如擴(kuò)大到50%。第3步:在函數(shù)分類中選“統(tǒng)計(jì)”,在函數(shù)名中選該地區(qū)有未犯罪記錄的青少年10000名,數(shù)值型數(shù)據(jù)也可以轉(zhuǎn)化為分類數(shù)據(jù)每種組合的觀察頻數(shù)用fij表示域得到P值為0.第4步:在對(duì)話框“Actual_range”輸入觀察數(shù)據(jù)區(qū)域分別計(jì)算系數(shù)、C系數(shù)和V系數(shù),并分析相關(guān)程度第1步:將觀察值輸入一列,將期望值輸入一列
統(tǒng)計(jì)量(例題分析)實(shí)際頻數(shù)(fij)期望頻數(shù)(eij)fij-eij(fij-eij)2(fij-eij)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計(jì):3.03192025/11/2618二、擬合優(yōu)度檢驗(yàn)(品質(zhì)數(shù)據(jù)的假設(shè)檢驗(yàn))品質(zhì)數(shù)據(jù)比例檢驗(yàn)獨(dú)立性檢驗(yàn)Z檢驗(yàn)一個(gè)總體
檢驗(yàn)Z檢驗(yàn)
檢驗(yàn)兩個(gè)以上總體兩個(gè)總體2025/11/2619從條件百分表可知,完整家庭犯罪青少年所占比重為29%,C的取值范圍是0C<1【例】一種原料來自三個(gè)不同地區(qū),原料質(zhì)量被分成三個(gè)不同等級(jí)。相關(guān)系數(shù)(原理分析)例如,贊成改革方案的共有279人,反對(duì)改革方案的141人你贊成還是反對(duì)這一改革方案?其原因是擴(kuò)大了犯罪青少年的抽取數(shù)量。第2步:選擇“函數(shù)”選項(xiàng)行變量的類別用r表示,ri表示第i個(gè)類別016711,所以拒絕原假設(shè)統(tǒng)計(jì)量(例題分析)將各期望頻數(shù)代入的計(jì)算公式得H0:1=2=3=4a、b、c、d均為條件頻數(shù)列聯(lián)表的結(jié)構(gòu)(22列聯(lián)表)檢驗(yàn)多個(gè)比例是否相等檢驗(yàn)的步驟—提出假設(shè)H0:1=2=…=j;H1:
1,2,…,j
不全相等
—計(jì)算檢驗(yàn)的統(tǒng)計(jì)量擬合優(yōu)度檢驗(yàn)(goodnessoffittest)—進(jìn)行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值
2
若2>
2,拒絕H0;若2<
2,接受H02025/11/2620C的取值范圍是0C<1每個(gè)單元中的期望頻數(shù)不能過小,否則檢驗(yàn)失效。【例】一種原料來自三個(gè)不同地區(qū),原料質(zhì)量被分成三個(gè)不同等級(jí)。行觀察值的合計(jì)數(shù)的分布V的取值范圍是0V1因變量方向編制條件百分表,則得如下結(jié)果:“CHITEST”,點(diǎn)擊“確定”【例】為了提高市場(chǎng)占有率,A公司和B公司同時(shí)開展了廣告宣傳。你贊成還是反對(duì)這一改革方案?列聯(lián)表的結(jié)構(gòu)(22列聯(lián)表)二、擬合優(yōu)度檢驗(yàn)H0:1=2=…=j;例如,社會(huì)學(xué)家欲研究家庭狀況(自變量)對(duì)青少年犯罪條件百分表的方向(例題數(shù)據(jù))C的取值范圍是0C<1H0:
1=
2=
3=
4
H1:
1,
2,
3,
4
不全相等
=0.1df=(2-1)(4-1)=3臨界值(s):擬合優(yōu)度檢驗(yàn)(例題分析)統(tǒng)計(jì)量:在=0.1的水平上不能拒絕H0可以認(rèn)為四個(gè)分公司對(duì)改革方案的贊成比例是一致的決策:結(jié)論:6.2513.0319=0.10
【例】為了提高市場(chǎng)占有率,A公司和B公司同時(shí)開展了廣告宣傳。在廣告宣傳戰(zhàn)之前,A公司的市場(chǎng)占有率為45%,B公司的市場(chǎng)占有率為40%,其他公司的市場(chǎng)占有率為15%。為了了解廣告戰(zhàn)之后A、B和其他公司的市場(chǎng)占有率是否發(fā)生變化,隨機(jī)抽取了200名消費(fèi)者,其中102人表示準(zhǔn)備購(gòu)買A公司產(chǎn)品,82人表示準(zhǔn)備購(gòu)買B公司產(chǎn)品,另外16人表示準(zhǔn)備購(gòu)買其他公司產(chǎn)品。檢驗(yàn)廣告戰(zhàn)前后各公司的市場(chǎng)占有率是否發(fā)生了變化(0.05)擬合優(yōu)度檢驗(yàn)(例題分析)2025/11/2622H0:
1=0.45
2=0.4
3=0.15
H1:原假設(shè)中至少有一個(gè)不成立
=0.05df=(2-1)(3-1)=2臨界值(s):擬合優(yōu)度檢驗(yàn)(例題分析)統(tǒng)計(jì)量:
在=0.05的水平上拒絕H0可以認(rèn)為廣告后各公司產(chǎn)品市場(chǎng)占有率發(fā)生顯著變化決策:結(jié)論:08.185.99=0.05
23第1步:將觀察值輸入一列,將期望值輸入一列第2步:選擇“函數(shù)”選項(xiàng)第3步:在函數(shù)分類中選“統(tǒng)計(jì)”,在函數(shù)名中選“CHITEST”,點(diǎn)擊“確定”第4步:在對(duì)話框“Actual_range”輸入觀察數(shù)據(jù)區(qū)域在對(duì)話框“Expected_range”輸入期望數(shù)據(jù)區(qū)
域得到P值為0.016711,所以拒絕原假設(shè)
擬合優(yōu)度檢驗(yàn)(例題分析—用P值檢驗(yàn))
24第三節(jié)
列聯(lián)表中的相關(guān)測(cè)量一、
相關(guān)系數(shù)二、列聯(lián)相關(guān)系數(shù)三、V
相關(guān)系數(shù)2025/11/2625品質(zhì)相關(guān)對(duì)品質(zhì)數(shù)據(jù)(分類和順序數(shù)據(jù))之間相關(guān)程度的測(cè)度列聯(lián)表變量的相關(guān)屬于品質(zhì)相關(guān)列聯(lián)表相關(guān)測(cè)量的統(tǒng)計(jì)量主要有
相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)V
相關(guān)系數(shù)列聯(lián)表中的相關(guān)測(cè)量2025/11/2626測(cè)度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對(duì)于22列聯(lián)表,
系數(shù)的值在0~1之間
相關(guān)系數(shù)計(jì)算公式為
式中n為列聯(lián)表的總頻數(shù),即樣本量一、
相關(guān)系數(shù)(correlationcoefficient)2025/11/2627一個(gè)簡(jiǎn)化的22列聯(lián)表
相關(guān)系數(shù)(原理分析)因素Y因素X合計(jì)x1x2y1aba+by2cdc+d合計(jì)a+cb+dn2025/11/2628a、b、c、d均為條件頻數(shù)當(dāng)變量X,Y相互獨(dú)立,不存在相關(guān)關(guān)系時(shí),頻數(shù)間應(yīng)有下面的關(guān)系:化簡(jiǎn)后有:差值的大小可以反映變量之間相關(guān)程度的高低。差值越大,說明兩個(gè)變量的相關(guān)程度越高。
系數(shù)就是以差值為基礎(chǔ),實(shí)現(xiàn)對(duì)兩個(gè)變量相關(guān)程度的測(cè)量。
相關(guān)系數(shù)(原理分析)2025/11/2629列聯(lián)表中每個(gè)單元格的期望頻數(shù)分別為
相關(guān)系數(shù)(原理分析)將各期望頻數(shù)代入
的計(jì)算公式得2025/11/2630將
代入
相關(guān)系數(shù)的計(jì)算公式得
相關(guān)系數(shù)(原理分析)ad等于bc,
=0,表明變量X與Y
之間獨(dú)立若b=0
,c=0,或a=0
,d=0,意味著各觀察頻數(shù)全部落在對(duì)角線上,此時(shí)|
|=1,表明變量X與Y
之間完全相關(guān)列聯(lián)表中變量的位置可以互換,
的符號(hào)沒有實(shí)際意義,故取絕對(duì)值即可2025/11/2631用于測(cè)度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計(jì)算公式為二、列聯(lián)相關(guān)系數(shù)(coefficientofcontingency)C的取值范圍是0C<1C=0表明列聯(lián)表中的兩個(gè)變量獨(dú)立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較2025/11/2632計(jì)算公式為三、V相關(guān)系數(shù)(Vcorrelationcoefficient)2.V的取值范圍是0V13.V=0表明列聯(lián)表中的兩個(gè)變量獨(dú)立4.V=1表明列聯(lián)表中的兩個(gè)變量完全相關(guān)5.不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較6.當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時(shí)V=
2025/11/2633同一個(gè)列聯(lián)表,
、C、V的結(jié)果會(huì)不同不同的列聯(lián)表,
、C、V的結(jié)果也不同在對(duì)不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時(shí),不同列聯(lián)表中的行與行、列與列的個(gè)數(shù)要相同,并且采用同一種系數(shù)四、
、C、V的比較2025/11/2634列聯(lián)表中的相關(guān)測(cè)量(例題分析)【例】一種原料來自三個(gè)不同地區(qū),原料質(zhì)量被分成三個(gè)不同等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗(yàn),結(jié)果如下表。分別計(jì)算系數(shù)、C系數(shù)和V系數(shù),并分析相關(guān)程度地區(qū)一級(jí)二級(jí)三級(jí)合計(jì)甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計(jì)1621881505002025/11/2635列聯(lián)表中的相關(guān)測(cè)量(例題分析)解:已知n=500,
=19.82,列聯(lián)表為33結(jié)論:三個(gè)系數(shù)均不高,表明產(chǎn)地和原料等級(jí)之間的相關(guān)程度不高2025/11/2636第四節(jié)列聯(lián)分析中應(yīng)注意的問題一、條件百分表的方向二、分布的期望準(zhǔn)則2025/11/2637對(duì)于具有因果關(guān)系的兩個(gè)品質(zhì)變量X與Y,在列聯(lián)表中的位置有習(xí)慣的處理,即將自變量(X)置于列的位置,將因變量(Y)置于行的位置,這樣可以更好地表現(xiàn)原因?qū)Y(jié)果的影響。一、條件百分表的方向價(jià)值取向Y職業(yè)X制造業(yè)服務(wù)業(yè)物質(zhì)報(bào)酬(%)105724556人情關(guān)系(%)40283544合計(jì)(%)145100801002025/11/2638如果因變量在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,例如,為了滿足分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GB-T 39003.1-2020工業(yè)自動(dòng)化系統(tǒng)工程用工程數(shù)據(jù)交換格式 自動(dòng)化標(biāo)識(shí)語(yǔ)言 第1部分:架構(gòu)和通 用要求》專題研究報(bào)告
- 《GB-T 11322.1-2013射頻電纜 第0部分:詳細(xì)規(guī)范設(shè)計(jì)指南 第1篇 同軸電纜》專題研究報(bào)告
- 《GB-T 31181-2014假肢 踝足裝置和足部組件 要求和試驗(yàn)方法》專題研究報(bào)告
- 《GB-T 38842-2020實(shí) 用超導(dǎo)線的分類和檢測(cè)方法 一般特性和指南》專題研究報(bào)告
- 《GBT 34475-2017 尿素級(jí)奧氏體不銹鋼棒》專題研究報(bào)告
- 《GB-T 7268-2015電力系統(tǒng)保護(hù)及其自動(dòng)化裝置用插箱及插件面板基本尺寸系列》專題研究報(bào)告
- Tiamo-basical-method-1參考資料說明
- 《幼兒文學(xué)》課件-6.2幼兒圖畫故事特點(diǎn)
- 種子行業(yè)種子銷售經(jīng)理崗位招聘考試試卷及答案
- 2026年消防安全工作計(jì)劃(2篇)
- 學(xué)堂在線 雨課堂 文物精與文化中國(guó) 期末考試答案
- 關(guān)于印發(fā)《2026年度安全生產(chǎn)工作計(jì)劃》的通知
- 寬容和感恩的培訓(xùn)
- 廣東省汕頭市金平區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期期末考試數(shù)學(xué)試題
- 過敏性休克的搶救流程
- 常用機(jī)床電氣檢修課件 課題十一 T612 型臥式鏜床電氣檢修
- 全國(guó)人大機(jī)關(guān)直屬事業(yè)單位2026年度公開招聘工作人員考試模擬卷帶答案解析
- 云肩非遺模板
- 頭頸部腫瘤介紹
- 安全監(jiān)理工作總程序
- 2026年中國(guó)宏觀經(jīng)濟(jì)展望分析報(bào)告:底部夯實(shí)亮點(diǎn)引領(lǐng)未來方向
評(píng)論
0/150
提交評(píng)論