已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Analysisofnominaldata,分類數(shù)據(jù)分析,分類數(shù)據(jù)分析簡介,分類數(shù)據(jù)也稱名義數(shù)據(jù),是社會科學研究的組成部分,其數(shù)據(jù)信息僅代表數(shù)據(jù)類別。例如種族,1=白種人,2=黃種人,3=黑人。根據(jù)每個類別的數(shù)量,可以分析它們之間的關(guān)系。分類數(shù)據(jù)的分析要求研究者應(yīng)首先決定如何分類。,分類數(shù)據(jù)分析的應(yīng)用范圍,政治學領(lǐng)域:研究政治立場是否影響政治派別。社會學和心理學領(lǐng)域:分析不同類別的人不同的心理特征。公共政策分析領(lǐng)域:研究不同政策在不同地區(qū)產(chǎn)生的效果。文化傳播領(lǐng)域:研究人們對媒體的看法。分類數(shù)據(jù)分析是社會科學中最重要的課題之一。一方面因為它的用途廣泛,另一方面因為它解決的是基本問題,一些簡單概念的解釋,分類:最理想的分類是這些類別相互區(qū)別并且沒有遺漏。統(tǒng)計過程中都假設(shè)分類是有意義的。自變量和因變量:區(qū)別在于是否引起另外一個變量的變化。取樣:從總體抽取的簡單隨機樣本。符號:I、J表示表格的行數(shù)和列數(shù),X、Y、Z表示變量。,表1:黨派和立場間的關(guān)系,X:黨派,Y:立場,表2:受黨派和地區(qū)影響的立場,Z:地區(qū)=西部X:黨派,Y:立場,Z:地區(qū)=非西部X:黨派,Y:立場,表3:標準IJ表格,X:自變量,Y:因變量,相關(guān)程度的測量,相關(guān)程度的測量方法是用一個系數(shù)來表示變量間的相關(guān)程度。選擇何種方法要考慮三個方面:測量方法是否對稱:是否可以確定自變量和因變量。系數(shù)如何解釋:取決于不同的測量方法制定的標準。測量方法的敏感度:盡量使用敏感度較低的方法。,表5:完全相關(guān)的三種類型,Y,Totals,Y,Totals,a嚴格完全相關(guān),b隱含完全相關(guān),c弱完全相關(guān),干擾因素和解決辦法,邊際分布不均勻(如表6):調(diào)整數(shù)據(jù)將表格標準化選擇對邊際總數(shù)不敏感的測量方法行列不相等:選擇可以達到最大值的測量方法。,表6:不同邊際分布,相同相關(guān)程度,(a),(b),22表格的測量方法,1、百分比法2、差額比率法3、YulesQ4、YulesY5、6、相關(guān)系數(shù),百分比法,如果因變量在自變量的一個分類中的百分比發(fā)生了變化,那么這兩個變量就是相關(guān)的;如果不發(fā)生變化,就是獨立的。百分比法的性質(zhì):對因變量的邊際總數(shù)不敏感。需要較大的樣本容量。,百分比法,0.90.4=0.5,差額比率法,Y:立場,差額比率法的性質(zhì),差額比率法的性質(zhì),差額比率的性質(zhì),差額比率的性質(zhì),差額比率的取值范圍是從0到,等于1.0說明獨立,小于1.0表示消極相關(guān),大于1.0表示積極相關(guān)差額比率對邊際總數(shù)不敏感。差額比率是對稱的差額比率在弱完全相關(guān)時就達到了最大值。,差額比率的方差,當樣本容量大于25時,我們可以計算出差額比率的方差。,我們可以計算置信區(qū)間,YulesQ,YulesQ是差額比率的一個函數(shù),定義如下:,它的方差可以由以下公式計算:,YulesQ的性質(zhì),因為Q是差額比率的一個函數(shù),因此基本具有和差額比率相同的性質(zhì)。Q的取值范圍是從-1.0到1.0,0說明獨立。Q在弱完全相關(guān)就取到最大值。Q是對稱的。,YulesY,YulesY也是差額比率的一個簡單函數(shù),定義如下:,它的方差可以由以下公式計算:,基于的測量方法,定義:,性質(zhì):取值范圍是從0到1.0。0說明獨立,只有嚴格完全相關(guān)時才達到最大值。對邊際總數(shù)敏感。它是對稱的。,相關(guān)系數(shù),在22表格中,計算公式是:,相關(guān)系數(shù)的性質(zhì),取值范圍是從-1.0到1.0。0說明獨立,在嚴格完全相關(guān)時取得最大值。平方表示因變量受自變量影響的百分比對邊際總數(shù)敏感行列交換不改變結(jié)果的大小,只改變符號。,IJ表格的測量方法,IJ表格的測量方法大致可以分成三類:基于差額比率的方法基于的方法錯誤減少比例方法(PRE),IJ表格中的差額比率法,IJ表格包含著t=(I-1)(J-1)個22表格,對于每一個22表格都可以計算出和。差額比率的基本形式是:,i=1,2,I-1;j=1,2,J-1,是估計值公式,與22表格,中有著相同的解釋。,基于的測量方法,幾種函數(shù)的模型,錯誤減少比例方法(PRE),對于樣本個體,我們可以在兩種情況下預(yù)測:第一種情況,不知道樣本在X中的類別;第二種情況,知道樣本在X中的類別。PRE就是比較兩種情況下預(yù)測錯誤的比例。,PRE的性質(zhì),取值范圍是從0到1.0。0說明獨立,1.0說明完全相關(guān)。PRE是不對稱的,即需要區(qū)分自變量和因變量。在樣本高度不均勻時,會出現(xiàn)不獨立但是結(jié)果為0的情況。,GoodmanandKruskalsLambda,Lambda方法是PRE方法的一種,原理是分別計算在兩種情況下預(yù)測錯誤的比例,然后進行比較。,第一種情況下的錯誤比例:,第二種情況下的錯誤比例:,GoodmanandKruskalsLambda,根據(jù)PRE的原理,我們定義:,Lambda的方差,其中的含義是恰好在這行上的每列最大值之和。根據(jù)方差我們可以計算出置信區(qū)間:,Lambda的對稱形式,最常見的方法就是將個體隨機地對半分給X和Y。第一種情況下,預(yù)測Y的正確率是,預(yù)測X的正確率是,錯誤率是第二種情況下,預(yù)測Y的正確率是,預(yù)測X的正確率是,錯誤率是,Lambda的對稱形式,那么錯誤降低比例就是:經(jīng)過整理后:,Goodman和KruskalsTau,Tau是另外一種PRE方法,同樣是在兩種情況下進行預(yù)測。不同的是Tau中猜測的樣本要保持原始數(shù)據(jù)的分布。公式:,表1:黨派和立場間的關(guān)系,X:黨派,Y:立場,Tau方法的算例,第一種情況:1538人中,一共有574+564=1138人不是革命派,比例是1138/1538=0.74。因此在400人中,大約有4000.74=295.97人是預(yù)測錯誤的。同理,我們可以算出大概有359.78人在預(yù)測中立派時預(yù)測錯誤,357.18人在預(yù)測保守派時預(yù)測錯誤。于是總共的錯誤數(shù)是:295.97+359.73+357.18=1012.93第二種情況:對于民主黨人士,民主黨人士非革命派有241+153=394人,394/587=0.67,因此應(yīng)該有193*0.67=129.54人預(yù)測錯誤。同理計算出中立派和保守派的錯誤數(shù)量分別是142.05和113.12。于是對于民主黨人士預(yù)測錯誤的數(shù)量是129.54+142.05+113.12=384.71相同的方法計算獨立黨和共和黨最后得出第二種情況的總共的錯誤數(shù)量是:384.71+360.00+231.71=976.42于是根據(jù)PRE的原理我們定義:,各種測量方法的總結(jié),盡管變量間相關(guān)程度的測量方法有很多種,但是仍然難以避免各種各樣的干擾因素。比如表1,表1樣本的分布一方面取決于總體真實的分布,但是我們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026中能建西北城市建設(shè)有限公司社會成熟型人才招聘筆試備考試題及答案解析
- 2026湖北恩施州來鳳縣國投集團招聘人員5人筆試備考題庫及答案解析
- 2026天津城投集團安泊科技有限公司招聘1人考試重點試題及答案解析
- 2026寧夏銀川市西夏區(qū)第二十二幼兒園招聘2人筆試備考題庫及答案解析
- 2026四川華豐科技股份有限公司招聘生產(chǎn)計劃等崗位6人考試重點題庫及答案解析
- 2026年閩江學院單招綜合素質(zhì)筆試備考試題含詳細答案解析
- 2026年泰州職業(yè)技術(shù)學院單招職業(yè)技能考試備考試題含詳細答案解析
- 2026天津市博文中學初中部教師招聘2人筆試備考試題及答案解析
- 2026吳忠賽馬新型建材有限公司招聘2人筆試備考題庫及答案解析
- 2026山東日照市東港區(qū)新東港控股集團有限公司職業(yè)經(jīng)理人招聘1人筆試備考題庫及答案解析
- NB-SH-T 0945-2017 合成有機酯型電氣絕緣液 含2025年第1號修改單
- 2026年細胞治療 免疫性疾病治療項目商業(yè)計劃書
- 化工復產(chǎn)安全培訓
- NBT 11898-2025《綠色電力消費評價技術(shù)規(guī)范》
- 2026年總經(jīng)理工作計劃
- 四年級數(shù)學(三位數(shù)乘兩位數(shù))計算題專項練習及答案
- 肋骨骨折護理查房
- 家具制造工藝流程及質(zhì)量檢驗標準
- 《老年視功能衰退評估規(guī)范》
- 項目資金預(yù)警管理辦法
- 社會不教、精英不講坎兒還得自己過(揭秘人才成長規(guī)律)
評論
0/150
提交評論