版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、會(huì)計(jì)學(xué)1社會(huì)社會(huì)(shhu)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)(盧淑華盧淑華),第十章第十章第一頁(yè),共35頁(yè)。學(xué)生上網(wǎng)調(diào)查(統(tǒng)計(jì)各項(xiàng)比例,能發(fā)現(xiàn)什么(shn me)問題?)男生(nnshng)女生(nshng)聊天玩游戲網(wǎng)戀學(xué)習(xí)2050151520501515第2頁(yè)/共35頁(yè)第二頁(yè),共35頁(yè)。Nij后者可以(ky)通過前者求出 p N N p 1i 1 j 12、列聯(lián)表中變量(binling)的分布1)聯(lián)合分布對(duì)于二變量來(lái)說,為了知道(zh do)分布,集合中的變量值,必須同時(shí)具有x和y兩個(gè)變量的取值。( x1 y1 N11)( x2 y2 N12)( x1 yrN1r)此稱聯(lián)合分布( xi yj Nij)( xc
2、 yr Ncr)Nij表示頻次時(shí)聯(lián)合頻次分布表Pij 表示概率時(shí) 聯(lián)合概率分布表ijNijc ri 1 j 1c rij第3頁(yè)/共35頁(yè)第三頁(yè),共35頁(yè)。2)邊緣分布:對(duì)聯(lián)合(linh)分布進(jìn)行簡(jiǎn)比,只研究其中某一變量的分布,而不管另一變量的取值,這樣就得到邊緣分布。按行加總y的邊緣分布:P y yr P1r P2 r Pcr Pr按列加總x的邊緣分布:Px xc Pc1 P2c Pcr Pc第4頁(yè)/共35頁(yè)第四頁(yè),共35頁(yè)。3)條件分布:將其中一個(gè)(y )變量控制起來(lái)取固定值,再看另一變量的分布,即條件分布。控制x時(shí),條件分布中的每一項(xiàng)都以邊緣分布的 N1* N 2* N c* 為分母控制y
3、時(shí),條件分布中的每一項(xiàng)都以邊緣分布的 N *1 N *2 N *r 為分母第5頁(yè)/共35頁(yè)第五頁(yè),共35頁(yè)。3、列聯(lián)表中的相互(xingh)獨(dú)立性:1)列聯(lián)表研究定類變量之間的關(guān)系,實(shí)際上是通過條件分布的比較進(jìn)行的。如果兩個(gè)變量之間沒有(mi yu)關(guān)系,則稱變量之間是相互獨(dú)立的。2)如果兩個(gè)變量之間是相互獨(dú)立的,則必然存在變量的條件分布與其邊緣分布相同 。第6頁(yè)/共35頁(yè)第六頁(yè),共35頁(yè)。條件(tiojin)分布=邊緣分布是列聯(lián)表檢驗(yàn)的基礎(chǔ):(控制(kngzh)x時(shí))N* jNNN i*NijNN* jNNijNi*N*1NN 21N 2*N11N1*Pij Pi*P* j 第7頁(yè)/共35頁(yè)
4、第七頁(yè),共35頁(yè)。nin jPi 第二節(jié) 列聯(lián)表的檢驗(yàn)(jinyn)一、原假設(shè):將總體(zngt)中變量間無(wú)關(guān)系或相互獨(dú)立作為檢驗(yàn)的原假設(shè)(jish)。H 0 : pijpi* p* j總體 pi* 和 p* j 未知時(shí),用樣本 p i 和 P j 代替。P j n n第8頁(yè)/共35頁(yè)第八頁(yè),共35頁(yè)。22c r2 2ijEijni* n* jnE np* jij第9頁(yè)/共35頁(yè)第九頁(yè),共35頁(yè)。統(tǒng)計(jì)(tngj)量的討論1、對(duì)于(duy)22列聯(lián)表,由于格數(shù)過少,為減少作為離散觀測(cè)(gunc)值與作為連續(xù)型變量x值之間的偏差,可作連續(xù)性修正:22 22Eij 2、二項(xiàng)總體2 22E1 E2p0
5、 為總體成數(shù)1 2第10頁(yè)/共35頁(yè)第十頁(yè),共35頁(yè)。男女泡吧8030逛商店2070男女(nnn)休閑愛好第11頁(yè)/共35頁(yè)第十一頁(yè),共35頁(yè)。 xni Ei x r 14、使用統(tǒng)計(jì)(tngj)量 x 對(duì)列聯(lián)表迚行檢驗(yàn),每一格值的 E值時(shí) nij Eij 值的波勱就會(huì)較大(jio d)。2那么(n me)在計(jì)算3、對(duì)多項(xiàng)總體:Ei2統(tǒng)計(jì)量:r2i 12pEii 0 nij2要保持在一定數(shù)目乊上。如果有的格值 Eij 過小,2xEij第12頁(yè)/共35頁(yè)第十二頁(yè),共35頁(yè)。每格要求(yoqi):處理方法(fngf):將期望值偏小的格值合并。右例,做檢驗(yàn)。Eij20 30 3 1nij182942E
6、 ij 5第13頁(yè)/共35頁(yè)第十三頁(yè),共35頁(yè)。注意:列聯(lián)表就其檢驗(yàn)內(nèi)容來(lái)看是雙邊檢驗(yàn),但從形式(xngsh)上看,卻又很像單邊檢驗(yàn)。其判斷的內(nèi)容僅是變量間是否存在關(guān)系。至于方向,由于列聯(lián)表屬定類變量,因此是不存在的。第14頁(yè)/共35頁(yè)第十四頁(yè),共35頁(yè)。ni Ei xEi 1x r 1列聯(lián)表檢驗(yàn)(jinyn)步驟1、 H0H1i222、統(tǒng)計(jì)(tngj)量:r23、 4、比較第15頁(yè)/共35頁(yè)第十五頁(yè),共35頁(yè)。例:以下是老、中、青三代對(duì)某影片的抽樣,能否認(rèn)為三代人對(duì)該影片評(píng)價(jià)(pngji)有顯著差異老中青很高一般(ybn)454739262122第16頁(yè)/共35頁(yè)第十六頁(yè),共35頁(yè)。第三節(jié)
7、列聯(lián)強(qiáng)度(qingd)一、變量間的相關(guān)1、列聯(lián)表中的頻次分布情況,不僅是檢驗(yàn)是否存在關(guān)系的依據(jù),同時(shí)也是度量變量間關(guān)系強(qiáng)弱的依據(jù)。相關(guān)性程度越高,說明社會(huì)現(xiàn)象與社會(huì)現(xiàn)象間的關(guān)系愈密切。2、列聯(lián)表中變量間的關(guān)系的強(qiáng)度分析,可以(ky)將頻次轉(zhuǎn)化為條件分布,然后比較自變量取不同值時(shí),因變量條件分布的不同。第17頁(yè)/共35頁(yè)第十七頁(yè),共35頁(yè)。例右表中,男生(nnshng)上網(wǎng)玩游生;想一想,當(dāng)x取值大于2時(shí),怎樣(znyng)比較?戲的比例高于女生(nshng);而上網(wǎng)聊天的比例低于女 y x男生女生聊天玩游戲 40 67% 10 25%30 33% 30 75%第18頁(yè)/共35頁(yè)第十八頁(yè),共35
8、頁(yè)。即:ad bc二、 2 2表 系數(shù)(xsh)和系數(shù)(xsh)列聯(lián)表中兩個(gè)(lin )變量都只有二種取值時(shí),就是 22表yxacbdx1x2y1y2當(dāng)變量間無(wú)關(guān)系時(shí)(獨(dú)立)a ba c b d對(duì)于22表,無(wú)論 系數(shù)或系數(shù),都以差值 ad bc為基礎(chǔ)進(jìn)行的討論,同時(shí),也把關(guān)系強(qiáng)度的取值范圍(fnwi)定義在1,1之間。第19頁(yè)/共35頁(yè)第十九頁(yè),共35頁(yè)。1、 系數(shù)(xsh)ad bca bc d a cb d 0 當(dāng)兩變量相互獨(dú)立 1 b、c為零, 值最大1a、d為零, 值最小-1 1 一般情況(qngkung)前例中計(jì)算第20頁(yè)/共35頁(yè)第二十頁(yè),共35頁(yè)。Q 2、系數(shù)ad - bcad
9、bc當(dāng)a、b、c、d中有一個(gè)是零時(shí),則 Q 1對(duì)應(yīng)的實(shí)際(shj)情況是配對(duì)樣本研究3、 、Q 系數(shù)的選擇當(dāng)自變量的不同取值都會(huì)影響因變量時(shí),用 系數(shù)。當(dāng)存在控制組時(shí),用系數(shù)第21頁(yè)/共35頁(yè)第二十一頁(yè),共35頁(yè)。xx 值構(gòu)成(guchng) 系數(shù)4、r c 列聯(lián)表222Eij 期望(qwng)頻次 Eij 是基于無(wú)相關(guān)前提下計(jì)量出來(lái)的,2因 愈大,表示變量間距離(jl)無(wú)相關(guān)性愈遠(yuǎn)。2 x2 n其與22表中 系數(shù)是一致,22表中是 r c表中 系數(shù)的特例。第22頁(yè)/共35頁(yè)第二十二頁(yè),共35頁(yè)。x nc值在0,1但永遠(yuǎn)(yngyun)小于1,又出現(xiàn)了v系數(shù):由于r c 表的數(shù)增多后, 值增加
10、,沒有上限,無(wú)法比較,因此以c系數(shù)(xsh)修正。xc 222minr 1, c 1V 1V 的取值:o V第23頁(yè)/共35頁(yè)第二十三頁(yè),共35頁(yè)。表示(biosh)所減少的相對(duì)誤差,越大表示(biosh)y與x關(guān)2)以減少(jinsho)誤差比例為基礎(chǔ)的相關(guān)性測(cè)量PRE不受變量層次(cngc)的限制,通過現(xiàn)象之間的關(guān)系研究,從一個(gè)現(xiàn)象預(yù)測(cè)另一個(gè)現(xiàn)象。PRE E1 E 2E1E1 :不知y與x有關(guān)系時(shí),預(yù)測(cè)y的全部誤差 E 2 :知道y與x有關(guān)系后,用x去預(yù)測(cè)y的全部誤差E1 E2E1系越密切。第24頁(yè)/共35頁(yè)第二十四頁(yè),共35頁(yè)。誤差(wch)為: jnn max為 nn maxEPRE的
11、取值范圍:PRE=0:兩變量是無(wú)相關(guān)(知道x與否無(wú)助于y的預(yù)測(cè),1 E 2 誤差不變)PRE=1:兩變量是完全相關(guān)的(知道x與y有關(guān)系后,可以消除預(yù)測(cè)的全部誤差)0 PRE 1:其他E1 :不知y與x 有關(guān),用y的邊緣和 n的最大值去猜y值,猜中的頻次會(huì)更多。全部E 2 :知道有關(guān)后,先看它屬于x的哪一類,然后(rnhu)用這一類的眾值去猜y值,誤差ciji 1 j第25頁(yè)/共35頁(yè)第二十五頁(yè),共35頁(yè)。 max n max nn max n 兩種系數(shù)(xsh):* jij * jci 11) 系數(shù)(xsh) E1 E2 E1即:每列最高頻次pn c之和 y邊緣和中最高頻次pn c觀察總數(shù) y
12、邊緣和中最高頻次 的取值范圍:x與y無(wú)相關(guān): 0 ;x與y全相關(guān): 1第26頁(yè)/共35頁(yè)第二十六頁(yè),共35頁(yè)。PRE,所得(su d) 值稱作 y ,NDPRE,所得(su d) 值稱作 x, NDDy Dx D D y D D x 值的非對(duì)稱性:1)以x為自變量,用對(duì)y的預(yù)測(cè)(yc)來(lái)定義yyy2)以y為自變量,用對(duì)x的預(yù)測(cè)(yc)來(lái)定義xxx3)如果x和y孰因孰果不明顯的情況,這時(shí)可同時(shí)計(jì)算 y 和 x ,并取其平均值,作為x和y間的相關(guān)程度。xxN y NDy D y x y x 第27頁(yè)/共35頁(yè)第二十七頁(yè),共35頁(yè)。邊緣分布所提供(tgng)的信息。c rn 1 n Enn Ei 1
13、 j 1 j 11n nEn系數(shù)(xsh)又有修正: 系數(shù)xsh: 對(duì) E1 和 E 2 的定義比當(dāng)不知道x與y有關(guān)系預(yù)測(cè)y時(shí),充分考慮到y(tǒng)值2rij 2* j1 2 i*r21* jj 1的取值范圍:x與y無(wú)相關(guān): 0(邊緣分布與條件分布相同)x與y全相關(guān): 1(各行、各列均只有一個(gè)不為0的頻次)第28頁(yè)/共35頁(yè)第二十八頁(yè),共35頁(yè)。以前(yqin)例為參照的推導(dǎo):1、不知x與y有關(guān)(yugun):猜游戲與聊天(lio tin):用邊緣分布:40%,60%隨機(jī)指派40人,猜對(duì)游戲的人數(shù)4040/100=16猜錯(cuò)的人數(shù)40-4040/100=40(1-40/100)=24同理:隨機(jī)指派60人
14、,猜對(duì)聊天的人數(shù)6060/100=36猜錯(cuò)的人數(shù)60-6060/100=60(1-60/100)=24第29頁(yè)/共35頁(yè)第二十九頁(yè),共35頁(yè)。j1 n * jE1即為猜錯(cuò)人數(shù)(rn sh)之和。推廣:1 r 2n n n*2n) n*2 (1 n*1nE1 n*1 (1 ) n*r (第30頁(yè)/共35頁(yè)第三十頁(yè),共35頁(yè)。知道(zh do)x與y有關(guān)后:用y的條件分布來(lái)猜y值當(dāng)x=男生時(shí)隨機(jī)10人,猜對(duì)聊天的人數(shù):1010/50猜錯(cuò)的人數(shù):10-1010/50隨機(jī)40人,猜對(duì)游戲(yux)的人數(shù):4040/50猜錯(cuò)的人數(shù):40-4040/50猜錯(cuò)二者相加:=(10-1010/50)+(40-4040/50)=50-1/50 (102 +402 )同理:當(dāng)x=女生時(shí)?第31頁(yè)/共35頁(yè)第三十一頁(yè),共35頁(yè)。j1E2即為全部(qunb)誤差之和。推廣(tugung):1 rn1*n 2 ijn i*E 2 (n1* n n 21j ) (n 2* ) c第32頁(yè)/共35頁(yè)第三十二頁(yè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院醫(yī)保科年度工作總結(jié)
- 退役軍人服務(wù)保障體系標(biāo)準(zhǔn)化建設(shè)
- 求職者面試技巧全套教程
- 一般工貿(mào)行業(yè)新員工三級(jí)安全培訓(xùn)考試試題及答案
- 建設(shè)工程施工合同糾紛要素式起訴狀模板修改無(wú)約束
- 保險(xiǎn)講師培訓(xùn)
- 環(huán)境友好催化技術(shù)課件
- 調(diào)色年終總結(jié)和配料(3篇)
- 公務(wù)員法執(zhí)行情況自查報(bào)告
- 2026年醫(yī)學(xué)科研項(xiàng)目合同
- 2026年游戲AB測(cè)試實(shí)施方法含答案
- 2025湖南湘西鶴盛原煙發(fā)展有限責(zé)任公司招聘擬錄用人員筆試歷年備考題庫(kù)附帶答案詳解
- 江蘇省2025年普通高中學(xué)業(yè)水平合格性考試英語(yǔ)試卷(含答案)
- 枕骨骨折的護(hù)理課件
- TCEC電力行業(yè)數(shù)據(jù)分類分級(jí)規(guī)范-2024
- 駱駝的養(yǎng)殖技術(shù)與常見病防治
- GB/T 26951-2025焊縫無(wú)損檢測(cè)磁粉檢測(cè)
- 2025及未來(lái)5-10年高壓管匯項(xiàng)目投資價(jià)值市場(chǎng)數(shù)據(jù)分析報(bào)告
- 腹部手術(shù)圍手術(shù)期疼痛管理指南(2025版)課件
- 2025年衛(wèi)生人才評(píng)價(jià)考試(臨床醫(yī)學(xué)工程技術(shù)中級(jí))歷年參考題庫(kù)含答案
- 呼吸康復(fù)科普脫口秀
評(píng)論
0/150
提交評(píng)論