應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述第1頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

在數(shù)據(jù)收集、整理完畢后,進(jìn)行深入統(tǒng)計(jì)分析之前,首要的工作就是去了解這個(gè)數(shù)據(jù)的整體情況,隨后考慮作深入的推斷。用少量數(shù)字(描述指標(biāo))概括大量原始數(shù)字,對(duì)數(shù)據(jù)進(jìn)行描述的統(tǒng)計(jì)方法即為描述性統(tǒng)計(jì)分析。統(tǒng)計(jì)描述

連續(xù)變量的統(tǒng)計(jì)描述

分類變量的統(tǒng)計(jì)描述第2頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月集中趨勢(shì)的描述指標(biāo)

算術(shù)均數(shù):適合單峰和基本對(duì)稱的分布

中位數(shù):適用于任意分布類型

截尾均數(shù):數(shù)據(jù)中有極端值,用截尾均數(shù)更好

幾何均數(shù):適用于原始數(shù)據(jù)分布不對(duì)稱,但經(jīng)過(guò)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料

眾數(shù)(Mode):樣本數(shù)據(jù)中出現(xiàn)頻次最大的那個(gè)數(shù)字

調(diào)和均數(shù)(H):較少使用,觀察值x倒數(shù)之均數(shù)的倒數(shù),常用于完成的工作量相等而所用時(shí)間不同,求平均速度的情況第3頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

全距大體了解數(shù)據(jù)的分布范圍,用于預(yù)備性檢查

方差和標(biāo)準(zhǔn)差適用于正態(tài)分布

百分位數(shù)如中位數(shù)(P50)、四分位數(shù)(P25、P50、P75)

四分位間距即P75-P25,適用于任意分布類型,不受極端值影響

變異系數(shù)(CV)

S/,適用于測(cè)量尺度相差太大或數(shù)據(jù)量綱不同時(shí),比較兩組數(shù)據(jù)離散程度的大小離散趨勢(shì)的描述指標(biāo)第4頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月SPSS的許多模塊均可完成統(tǒng)計(jì)描述的任務(wù),除各種用于統(tǒng)計(jì)推斷的過(guò)程會(huì)附帶進(jìn)行相關(guān)的統(tǒng)計(jì)描述外,SPSS還專門提供了幾個(gè)用于連續(xù)變量統(tǒng)計(jì)描述的過(guò)程,均集中于Analyze-DescriptiveStatistics子菜單中。Frequencies過(guò)程

Descriptives過(guò)程

Explore過(guò)程Ratio過(guò)程第5頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Frequencies:產(chǎn)生原始數(shù)據(jù)的頻數(shù)表,并能計(jì)算各種百分?jǐn)?shù),并可繪制頻數(shù)圖,如連續(xù)型變量的直方圖,或分類變量的餅圖或條圖。下面以demo.sav為例,對(duì)人群的年齡數(shù)據(jù)(age)進(jìn)行描述。Frequencies過(guò)程第6頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

若無(wú)變量標(biāo)簽,則列表框中只顯示變量名

對(duì)話框中,從左邊變量列表中選擇要分析的變量,放入右邊的Variables(變量)列表中至少一個(gè)變量選入后,OK按鈕才可使用Frequencies過(guò)程變量標(biāo)簽變量名第7頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

鼠標(biāo)右鍵單擊變量,可以獲得更多變量信息

選擇下拉按鈕,顯示所有定義的值標(biāo)簽Frequencies過(guò)程第8頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月:表示該變量為數(shù)值型變量:表示該變量為字符型變量,且右下角的<表示短字符,即變量長(zhǎng)度<=8位Frequencies過(guò)程第9頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Statistics:設(shè)定要分析的統(tǒng)計(jì)量分位數(shù)值集中趨勢(shì)離散趨勢(shì)分布指標(biāo)若數(shù)據(jù)為組中值,將其選中本例選擇四分位數(shù)和5%、95%分位數(shù)Frequencies過(guò)程第10頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月本例選中繪制直方圖圖表類型:箱式圖、餅圖、直方圖等Frequencies過(guò)程Charts:設(shè)定要繪制的統(tǒng)計(jì)圖第11頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Format:在SPSS對(duì)話框中,用于設(shè)定結(jié)果文件中的數(shù)據(jù)格式,通常默認(rèn)即可。數(shù)據(jù)排序方式多變量分析時(shí)的顯示方式設(shè)定組別超過(guò)n組時(shí)不顯示表格Frequencies過(guò)程第12頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

通過(guò)大綱視圖可以快速定位各項(xiàng)結(jié)果例如:點(diǎn)擊大綱視圖上的Histogram,則可快速定位至

age的頻數(shù)直方圖Frequencies過(guò)程第13頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月分析結(jié)果(1)統(tǒng)計(jì)量

人群年齡無(wú)缺失值,四分位數(shù)為33歲、41歲、51歲,即人群中有1/4小于33歲,1/2小于41歲,1/4大于51歲。另外,90%的人在24~64歲之間。Frequencies過(guò)程第14頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Frequencies過(guò)程分析結(jié)果(2)頻數(shù)表Frequency:頻數(shù)Percent:百分比=當(dāng)前頻數(shù)/總數(shù)(包括缺失值)ValidPercent:有效百分比=當(dāng)前頻數(shù)/有效總數(shù)(不包括缺失值)CumulativePercent:累積百分比=累積頻數(shù)/有效總數(shù)(不包括缺失值)第15頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Frequencies過(guò)程分析結(jié)果(3)頻數(shù)直方圖第16頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Descriptive:一般性統(tǒng)計(jì)描述,相對(duì)于Frequencies,它不能繪制統(tǒng)計(jì)圖,所能計(jì)算的統(tǒng)計(jì)量也較少,適用于對(duì)服從正態(tài)分布的連續(xù)型變量進(jìn)行描繪。同樣以demo.sav為例,對(duì)人群的年齡數(shù)據(jù)(age)進(jìn)行描述。Descriptives過(guò)程第17頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

單擊中間的箭頭,可以實(shí)現(xiàn)變量從一張表移入另一張表,現(xiàn)將變量age移入右邊variable列表中Descriptives過(guò)程第18頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Options:設(shè)定要分析的統(tǒng)計(jì)量及數(shù)據(jù)的顯示順序本例選擇:均數(shù)、標(biāo)準(zhǔn)差、最大值、最小值、峰度系數(shù)、偏度系數(shù)等Descriptives過(guò)程第19頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

人群年齡的最小值為18歲,最大值為77歲,均數(shù)42.06歲,標(biāo)準(zhǔn)差12.29歲,偏度系數(shù)0.299,峰度系數(shù)-0.602,基本近似正態(tài)。Descriptives過(guò)程分析結(jié)果描述性統(tǒng)計(jì)量第20頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Explore:對(duì)連續(xù)型資料分布不清楚時(shí)的探索性分析,可以分類別進(jìn)行描述(Frequencies和Descriptives不行),計(jì)算多種描述統(tǒng)計(jì)量,給出各種統(tǒng)計(jì)圖,進(jìn)行簡(jiǎn)單參數(shù)估計(jì)。以demo.sav為例,對(duì)男女性(gender)的年齡(age)分別進(jìn)行描述。Explore過(guò)程第21頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月要進(jìn)行分析的應(yīng)變量:age分類變量:genderExplore過(guò)程第22頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月點(diǎn)估計(jì)中的穩(wěn)健估計(jì):M估計(jì)極端值百分位數(shù)一般描述

默認(rèn)情況下,選擇的是Descriptives,本例選擇默認(rèn)Explore過(guò)程第23頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月箱式圖用于正態(tài)性檢驗(yàn)的Q-Q圖莖葉圖直方圖Levene’s方差齊性檢驗(yàn)選項(xiàng)Explore過(guò)程第24頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

缺失值的設(shè)置,一般默認(rèn)即可Explore過(guò)程第25頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

本例無(wú)缺失值,有效人數(shù)女性3179人,男性3221人Explore過(guò)程分析結(jié)果(1)缺失值報(bào)告第26頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

現(xiàn)僅對(duì)女性的分析結(jié)果依次解釋,查看詳情Explore過(guò)程分析結(jié)果(2)統(tǒng)計(jì)量第27頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月集中趨勢(shì)指標(biāo)、離散趨勢(shì)指標(biāo)分布特征指標(biāo)、參數(shù)估計(jì)Explore過(guò)程分析結(jié)果第28頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

集中趨勢(shì)指標(biāo):3179名女性的平均年齡為41.74歲(Mean),去掉兩側(cè)各5%的極端值后,截尾均數(shù)為41.45歲(5%TrimmedMean),中位數(shù)41.00歲(Median),本例上述三指標(biāo)值基本相同,可推測(cè)數(shù)據(jù)應(yīng)當(dāng)是對(duì)稱分布的。Explore過(guò)程

離散趨勢(shì)指標(biāo):年齡的方差為142.988歲2(Variance),其平方根即標(biāo)準(zhǔn)差為11.958歲(Std.Deviation)。全部女性中最小的18歲(Minimum),最大的76歲(Maximum)。兩者之差即全距58歲(Range),中間一半女性的年齡差即四分位數(shù)間距17歲(InterquartileRange)。第29頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

分布特征指標(biāo):表明數(shù)據(jù)偏離正態(tài)分布程度的偏度系數(shù)(Skewness)為0.327,峰度系數(shù)(Kurtosis)為-0.534。偏度系數(shù)大于0為正偏態(tài),峰度系數(shù)小于0表明峰比正態(tài)低,本例偏度和峰度系數(shù)均接近0,因此認(rèn)為近似正態(tài)分布。

參數(shù)估計(jì):均數(shù)(Mean)的標(biāo)準(zhǔn)誤(Std.Error)為0.212歲,相應(yīng)的總體均數(shù)95%可信區(qū)間(95%ConfidenceIntervalforMean)為41.32~42.15歲,表明有95%的可能性認(rèn)為該區(qū)間包含了總體均數(shù)。Explore過(guò)程第30頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Explore過(guò)程分析結(jié)果(3)莖葉圖第31頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Explore過(guò)程分析結(jié)果(4)箱式圖最小值:18歲最大值:76歲四分位間距:17歲第32頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Ratio:功能較特殊,用于對(duì)兩個(gè)連續(xù)性變量計(jì)算相對(duì)比指標(biāo),它可以計(jì)算一系列非常專業(yè)的相對(duì)比描述指標(biāo),相對(duì)而言使用面較窄,在此不詳述。Ratio過(guò)程第33頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月SPSS的許多分析過(guò)程均可完成統(tǒng)計(jì)描述的任務(wù),還專門提供了用于分類變量統(tǒng)計(jì)描述的過(guò)程,均集中于Analyze-DescriptiveStatistics子菜單中。

Frequencies過(guò)程

Crosstabs過(guò)程第34頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Frequencies:主要針對(duì)分類輸出頻數(shù)表,從而得到頻數(shù)、百分?jǐn)?shù)、累計(jì)百分比,給出原始頻數(shù)表,眾數(shù),條圖,餅圖等。以demo.sav為例,分別對(duì)人群的教育水平(ed)、職業(yè)滿意度(jobsat)進(jìn)行描述。Frequencies過(guò)程第35頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月6400人的教育水平和職業(yè)滿意度的數(shù)據(jù)都是完整的,無(wú)缺失值。Frequencies過(guò)程分析結(jié)果(1)缺失值報(bào)告第36頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Frequencies過(guò)程分析結(jié)果(2)頻數(shù)表第37頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Crosstabs:用于輸出交叉列聯(lián)表,以demo.sav為例,描述人群的婚姻情況marital(0、1)、退休狀況retire(0、1)的交叉頻數(shù)分布Crosstabs過(guò)程第38頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月用于分類變量統(tǒng)計(jì)推斷時(shí)的參數(shù)設(shè)定,此例暫不使用Crosstabs過(guò)程行變量:ed列變量:jubocat第39頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Cells:在SPSS對(duì)話框中,對(duì)于單元格要顯示的參數(shù)進(jìn)行設(shè)定合計(jì)百分位數(shù)殘差非整權(quán)重設(shè)置Crosstabs過(guò)程第40頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月6400人的婚姻狀況和退休狀況的數(shù)據(jù)都是完整的,無(wú)缺失值。Crosstabs過(guò)程分析結(jié)果(1)缺失值報(bào)告第41頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月

婚姻狀況(行)和退休狀況(列)的交叉表Crosstabs過(guò)程分析結(jié)果(2)交叉表行百分比列百分比第42頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月交叉分組下的頻數(shù)分析Crosstabs過(guò)程應(yīng)用

目的:掌握多變量的聯(lián)合分布特征,分析變量間的關(guān)系。功能:產(chǎn)生描述多變量聯(lián)合分布的列聯(lián)表比較兩個(gè)(或以上)樣本率或比例差異(卡方檢驗(yàn))變量間的關(guān)聯(lián)度分析第43頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月1、變量關(guān)系概述變量間的關(guān)系:有關(guān)與無(wú)關(guān)。有關(guān):如果一個(gè)變量的取值發(fā)生變化,另外一個(gè)變量的取值也相應(yīng)發(fā)生變化無(wú)關(guān):如果一個(gè)變量的變化不引起另一個(gè)變量的變化。第44頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月性別與四級(jí)英語(yǔ)考試通過(guò)率的相關(guān)統(tǒng)計(jì)表述:結(jié)果顯示,當(dāng)性別取值不同時(shí),通過(guò)率變量的取值并未發(fā)生變化,因此性別與考試通過(guò)率無(wú)關(guān)。自變量的不同取值在因變量上無(wú)差異,兩變量無(wú)關(guān)。自變量的不同取值在因變量上有差異,兩變量有關(guān)。因變量自變量第45頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月表述:統(tǒng)計(jì)結(jié)果顯示,當(dāng)性別取值不同時(shí),收入變量的取值發(fā)生了變化,因此性別與月收入有關(guān)。自變量因變量第46頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月2、雙變量關(guān)系的統(tǒng)計(jì)類型第47頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月觀測(cè)頻數(shù)行變量列邊緣分布行邊緣分布列變量期望頻數(shù)列聯(lián)表的格式第48頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月列聯(lián)分析——行列變量間的關(guān)系

兩變量是否相互獨(dú)立。兩變量是否有共變趨勢(shì)。一變量的變化多大程度上能由另一變量的變化來(lái)解釋。第49頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月卡方測(cè)量的原理:卡方測(cè)量用來(lái)考察兩變量是否獨(dú)立(無(wú)關(guān))。其原理是根據(jù)這一概率定理:若兩變量無(wú)關(guān),則兩變量中聯(lián)合事件發(fā)生的概率應(yīng)等于各自獨(dú)立發(fā)生的概率乘積。在列聯(lián)表中,這一定理就具體轉(zhuǎn)化為:若兩變量無(wú)關(guān),則兩變量中條件概率應(yīng)等于各自邊緣概率的乘積。反之,則兩變量有關(guān),或兩變量不獨(dú)立。第50頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月由此可見(jiàn),期望值與觀察值的差距越大,說(shuō)明兩變量越不獨(dú)立,也就越相關(guān)。因此,Pearson卡方的表達(dá)式如下:當(dāng)為四格表時(shí),卡方的取值在0~∞之間??ǚ街翟酱?,行列變量的關(guān)聯(lián)性越強(qiáng)。第51頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月列聯(lián)表的產(chǎn)生:

Analyze-DescriptiveStatistics-Crosstabs第52頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月界面說(shuō)明【Rows】:用于選擇行*列表中的行變量?!綜olumns】:用于選擇行*列表中的列變量。【Layer】:層變量?!綝isplayclusteredbarcharts】:顯示復(fù)式條圖。【Suppresstable】:不輸出行*列表?!綞xact】:針對(duì)2*2以上的行*列表設(shè)定計(jì)算確切概率的方法。注:安裝SPSS時(shí)除非特別選定,否則Exact模塊一般不安裝。第53頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月列聯(lián)表所研究的問(wèn)題城鎮(zhèn)和農(nóng)村的儲(chǔ)戶收入水平狀況相同嗎?行變量:戶口列變量:月收入不同年齡段的儲(chǔ)戶對(duì)物價(jià)水平的看法一致嗎?行變量:年齡段列變量:物價(jià)水平城鄉(xiāng)儲(chǔ)戶認(rèn)為存錢合算的比例是否相同?行變量:戶口列變量:什么合算第54頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月回答城鄉(xiāng)儲(chǔ)戶收入水平是否相同的問(wèn)題,需要引入卡方檢驗(yàn)。第55頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月1、卡方檢驗(yàn)步驟提出假設(shè)H0:行、列變量獨(dú)立(對(duì)立假設(shè)為?)計(jì)算檢驗(yàn)統(tǒng)計(jì)量(卡方統(tǒng)計(jì)量服從(r-1)*(c-1)個(gè)自由度的卡方分布)確定檢驗(yàn)水平與界值結(jié)果判斷:查界值表、看P值大小第56頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月卡方檢驗(yàn)操作:Statistics選項(xiàng)第57頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月【Cells】:用于定義列聯(lián)表單元格中需要計(jì)算的指標(biāo):Counts:是否輸出實(shí)際觀察數(shù)(Observed)和理論數(shù)(Expected);Percentages:是否輸出行百分?jǐn)?shù)(Row)、列百分?jǐn)?shù)(Column)以及合計(jì)百分?jǐn)?shù)(Total);Residuals:選擇殘差的顯示方式;【Format】:用于選擇行變量是升序還是降序排列。第58頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月結(jié)果:城鄉(xiāng)儲(chǔ)戶的收入水平?jīng)]有明顯差異。第59頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月Pearson卡方值的影響因素實(shí)際頻數(shù)與期望頻數(shù)之差期望頻數(shù)的大小列聯(lián)表的單元格子數(shù)樣本量大小第60頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月2、卡方檢驗(yàn)的校正自由度為1時(shí),期望頻數(shù)均大于5:連續(xù)性校正(ContinuityCorrection)20%的單元格期望頻數(shù)小于5:似然比卡方檢驗(yàn)(LikelihoodRatio)T<5andn<40或T<1時(shí):確切概率法(Fisher‘sExactTest)第61頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月例1:城鎮(zhèn)對(duì)象感到存錢合算的比例是否高于農(nóng)村對(duì)象?第62頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月第63頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月例2:城鄉(xiāng)儲(chǔ)戶對(duì)“未來(lái)收入的變化趨勢(shì)”的態(tài)度是否相同第64頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月第65頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月3、行列變量的關(guān)聯(lián)度分析該關(guān)聯(lián)度類似于參數(shù)檢驗(yàn)中相關(guān)系數(shù)的含義,取值多在(-1,1)區(qū)間可描述行列變量的關(guān)聯(lián)強(qiáng)度,多數(shù)是對(duì)Pearson卡方測(cè)量值進(jìn)行的修正。為兩變量相關(guān)研究中的非參數(shù)方法,卡方檢驗(yàn)中的關(guān)聯(lián)度分析不太常用。第66頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月3.1、兩定類變量的關(guān)聯(lián)度列聯(lián)系數(shù)(Contingencycoefficient):取值0~1,其取值隨著行列數(shù)的增加而增大Phi系數(shù):取值-1~1,適用于四格表,對(duì)樣本量進(jìn)行了修正V系數(shù):取值0~1,對(duì)樣本量和行列數(shù)進(jìn)行修正;四格表時(shí),等于Phi系數(shù)第67頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月例:居民儲(chǔ)蓄調(diào)查中了解城鄉(xiāng)戶口與“買東西還是存錢合算”的關(guān)聯(lián)度第68頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月3.2、兩定序變量的關(guān)聯(lián)度同序?qū)?shù)(P)、異序?qū)?shù)(Q):當(dāng)一個(gè)變量為升序排列時(shí),另一變量序列中有后面的一個(gè)變量值大于前面的一個(gè)變量值,則記為一個(gè)同序?qū)Γ环駝t為異序?qū)?。Kendall’stau-b:行列數(shù)相等時(shí)Kendall’stau-c:任意列聯(lián)表Gamma系數(shù):四格表檢驗(yàn)第69頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月例3:居民收入水平與對(duì)物價(jià)水平評(píng)價(jià)的關(guān)聯(lián)度第70頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月評(píng)價(jià)關(guān)聯(lián)度主要看Value值大小。第71頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月3.3、其他關(guān)聯(lián)度一個(gè)定類變量,一個(gè)定距變量的關(guān)聯(lián)度:Eta系數(shù),類似方差分析的非參數(shù)檢驗(yàn)兩定距變量(或定序變量)的關(guān)聯(lián)度:相關(guān)(Correlations):計(jì)算Pearson和Spearman相關(guān)系數(shù)第72頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月4、配對(duì)計(jì)數(shù)資料的卡方檢驗(yàn)例子:海爾公司的市場(chǎng)調(diào)查數(shù)據(jù):對(duì)每個(gè)消費(fèi)者調(diào)查兩個(gè)問(wèn)題:1、是否購(gòu)買過(guò)海爾冰箱(是、否)?2、是否購(gòu)買過(guò)海爾洗衣機(jī)(是、否)?問(wèn)1:海爾冰箱和洗衣機(jī)的購(gòu)買率是否有差別?問(wèn)2:每位消費(fèi)者對(duì)海爾冰箱和洗衣機(jī)的購(gòu)買一致性程度如何?第73頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月第74頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月4、配對(duì)計(jì)數(shù)資料的卡方檢驗(yàn)McNemar:配對(duì)計(jì)數(shù)資料的卡方檢驗(yàn)。零假設(shè)為兩變量的陽(yáng)性率無(wú)差別Kappa一致性檢驗(yàn):系數(shù)取值-1~1。測(cè)量同一觀測(cè)對(duì)象在兩變量(兩變量服從二項(xiàng)分布)上取值的一致性程度。其絕對(duì)值越接近1,說(shuō)明一致性程度越高。一般來(lái)說(shuō):系數(shù)>=0.7,一致性程度較高;0.4~0.7,一致性程度一般;<0.4,一致性較弱第75頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月第76頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月第77頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月例:兩種方法同時(shí)檢測(cè)患者乙肝抗體的陽(yáng)性率兩種方法的陽(yáng)性率有無(wú)差別??jī)煞N方法的檢測(cè)情況是否一致?第78頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月五、多選項(xiàng)分析目的:解決問(wèn)卷設(shè)計(jì)中的多選項(xiàng)問(wèn)題的分析多選項(xiàng)分析步驟:先將多選項(xiàng)問(wèn)題分解,分解方法(是否丟失信息、是否易于分析):二分法:把每個(gè)選項(xiàng)均轉(zhuǎn)為二分類變量有序分類法:把該問(wèn)題按順序轉(zhuǎn)為多個(gè)問(wèn)題再進(jìn)行頻數(shù)分析第79頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月例子:高考志愿調(diào)查

請(qǐng)按順序選擇你想報(bào)考的三所大學(xué)北大清華人大北師大北京理工大學(xué)北外第一

第二

第三

第80頁(yè),課件共88頁(yè),創(chuàng)作于2023年2月二分法分解你報(bào)考北大嗎?1、是2、否你報(bào)考清華嗎?1、是2、否你報(bào)考北師大嗎?1、是2、否你報(bào)考北外嗎?1、是2、否你報(bào)考人大嗎?1、是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論