社會科學研究方法 課件 第十一章 資料分析_第1頁
社會科學研究方法 課件 第十一章 資料分析_第2頁
社會科學研究方法 課件 第十一章 資料分析_第3頁
社會科學研究方法 課件 第十一章 資料分析_第4頁
社會科學研究方法 課件 第十一章 資料分析_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第十一章資料分析第十一章資料分析第一節(jié)

定量資料的整理第二節(jié)

定量資料分析第三節(jié)

定性資料的整理第四節(jié)

定性資料分析第一節(jié)

定量資料的整理一、資料審核資料審核(dataauditing)是資料處理的第一步,是指研究者對所收集的原始資料(即問卷)進行審閱,校正錯填、誤填的答案,剔出亂填、空白和嚴重缺答的廢卷。目的是使原始資料具有較高的準確性、完整性和真實性,從而為后續(xù)的資料錄入與統(tǒng)計分析打下好的基礎。資料的審核工作包含兩方面的內(nèi)容:一是檢查問卷資料中的問題;二是重新向被調(diào)查者核實信息。第一節(jié)

定量資料的整理二、資料轉(zhuǎn)換到了資料處理階段,我們需要將被調(diào)查者對問卷中問題的回答轉(zhuǎn)換成供計算機識別的數(shù)字。表11-1就是一份問卷中被調(diào)查者對前幾個問題的回答,以及將他們的答案轉(zhuǎn)換成的數(shù)字。第一節(jié)

定量資料的整理三、數(shù)據(jù)錄入當問卷的答案被轉(zhuǎn)化成數(shù)字后,接下來的工作就是將這些數(shù)字資料錄入計算機,以便利用專門的統(tǒng)計分析軟件如SPSS、SAS等進行分析。數(shù)據(jù)的錄入有兩種主要的方式:一種方式是直接在SPSS軟件中進行錄入;另一種方式是采用專門的數(shù)據(jù)庫軟件如Excel、FoxPro等進行錄入。第一節(jié)

定量資料的整理四、數(shù)據(jù)清理有效范圍清理對于問卷中的任何一個變量來說,它的有效編碼值往往都有某種范圍,而當數(shù)據(jù)中的數(shù)字超出了這一范圍時,便可以肯定這個數(shù)字一定是錯的。比如,如果在數(shù)據(jù)文件的“性別”這一變量欄中,出現(xiàn)了數(shù)字5或者7、8等,我們馬上可以判定這是錯誤的數(shù)值。因為根據(jù)編碼手冊中的規(guī)定,“性別”這一變量的賦值是1=男、2=女、0=無回答,凡是超出這三者范圍的其他數(shù)值,肯定都是錯誤的。第一節(jié)

定量資料的整理四、數(shù)據(jù)清理有效范圍清理要想檢查出所有不符合要求的數(shù)值,我們只需在計算機上,用SPSS軟件(或其他軟件)執(zhí)行一條統(tǒng)計各變量頻數(shù)分布(frequency)的命令。計算機很快就能給出下述形式的結(jié)果(見表11-2):第一節(jié)

定量資料的整理四、數(shù)據(jù)清理邏輯一致性清理邏輯一致性清理是指從另一種角度來查找數(shù)據(jù)中所存在的問題。它比有效范圍清理要稍微復雜一些,基本思路是依據(jù)問卷中的問題相互之間所存在的某種內(nèi)在的邏輯關系,來檢查前后數(shù)據(jù)之間的合理性。例如編碼為“男性”的個案數(shù)據(jù)中,出現(xiàn)了“懷孕次數(shù)”的答案數(shù)字;編碼為“獨生子女”的個案中,出現(xiàn)了“哥哥、姐姐的個數(shù)與年齡”的答案數(shù)字;等等。第二節(jié)

定量資料分析一、單變量統(tǒng)計分析集中趨勢分析集中趨勢分析(centraltendencyanalysis)指的是用一個典型值或代表值來反映一組數(shù)據(jù)的一般水平,或者說反映一組數(shù)據(jù)向某個典型值集中的情況。集中趨勢統(tǒng)計量有平均數(shù)(也稱均值)、眾數(shù)和中位數(shù)三種,其中最常用的是平均數(shù)。平均數(shù)的定義是總體各單位數(shù)值之和除以總體單位數(shù)目之商。統(tǒng)計分析中習慣以X來表示平均數(shù)。其計算公式如下:第二節(jié)

定量資料分析一、單變量統(tǒng)計分析集中趨勢分析如果是單值分組資料,那么,計算平均數(shù)時首先要將每一個變量值乘以所對應的頻數(shù)f,然后將各組的數(shù)值之和全部相加,并除以單位總數(shù)(也即各組頻數(shù)之和)。其公式如下:第二節(jié)

定量資料分析一、單變量統(tǒng)計分析集中趨勢分析在調(diào)查收入、年齡等方面的情況時,常常會得到組距分組形式的資料。這時,若要計算樣本的平均數(shù),就需要先計算出各組的組中值,然后再按照上述單值分組資料計算平均數(shù)的公式計算。組中值的計算公式如下:第二節(jié)

定量資料分析一、單變量統(tǒng)計分析離散趨勢分析離散趨勢分析(dispersiontendencyanalysis)指的是用一個特別的數(shù)值來反映一組數(shù)據(jù)相互之間的離散程度。組中值,然后再按照上述單值分組資料計算平均數(shù)的公式計算。組中值的計算公式。用得最多也是最重要的離散趨勢統(tǒng)計量,其計算公式如下:第二節(jié)

定量資料分析一、單變量統(tǒng)計分析區(qū)間估計區(qū)間估計(intervalestimation)的實質(zhì)就是在一定的可信度(置信度)下,用樣本統(tǒng)計值的某個范圍(置信區(qū)間)來估計總體的參數(shù)值。區(qū)間估計的結(jié)果可以采取下述方式來表述:“我們有95%的把握認為,全市職工的月工資收入在182~218元之間”或者“全省人口中,女性占50%~52%的可能性為99%”。區(qū)間估計中的可靠性或把握性是指用某個區(qū)間去估計總體參數(shù)時,成功的可能性有多大。第二節(jié)

定量資料分析一、單變量統(tǒng)計分析區(qū)間估計(1)總體均值的區(qū)間估計??傮w均值的區(qū)間估計公式如下:其中,

為樣本平均數(shù);S為樣本標準差;(1-α)為置信度,Z(1-α)是其所對應的臨界值;n為樣本規(guī)模。第二節(jié)

定量資料分析一、單變量統(tǒng)計分析區(qū)間估計(2)總體百分數(shù)的區(qū)間估計??傮w百分數(shù)的區(qū)間估計公式如下:這里,p為樣本中的百分比;其他同上。第二節(jié)

定量資料分析一、單變量統(tǒng)計分析假設檢驗假設檢驗(hypothesistest),就是先對總體的某一參數(shù)做出假設,然后用樣本的統(tǒng)計量進行驗證,以確定假設是否為總體所接受。假設檢驗所依據(jù)的是概率論中的小概率原理,即“小概率事件在一次觀察中不可能出現(xiàn)”的原理。第二節(jié)

定量資料分析一、單變量統(tǒng)計分析假設檢驗假設檢驗的具體方法和步驟如下:(1)建立虛無假設和研究假設,通常是將原假設作為虛無假設。(2)根據(jù)需要選擇適當?shù)娘@著性水平α(即概率的大?。?,通常有α=0

05、α=0

01等。(3)根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計值,并根據(jù)顯著性水平查出對應的臨界值。(4)將臨界值與統(tǒng)計值進行比較,若臨界值大于統(tǒng)計值的絕對值,則接受虛無假設;反之,則接受研究假設。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析交互分類與

檢驗交互分類(cross

tabulation)是一種專門用來分析兩個定類變量(或一個定類變量和一個定序變量)之間關系的統(tǒng)計分析方法。它是將研究所得的一組數(shù)據(jù)按照兩個不同的變量進行綜合的分類,其結(jié)果通常以交互分類表(又稱列聯(lián)表)的形式反映出來。其作用可以從下列例子中看出。假設在一次抽樣調(diào)查中,我們得到表11-3的結(jié)果。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析交互分類與

檢驗從這一結(jié)果中,我們只能得到“該總體中持贊成態(tài)度和持反對態(tài)度的人數(shù)大致相等”的結(jié)論。但是,當我們按性別對此結(jié)果進行交互分類統(tǒng)計時,又有表11-4的結(jié)果。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析交互分類與

檢驗要保證樣本中所體現(xiàn)的變量間關系也反映了總體的情況,就必須對它們進行

檢驗(讀作卡方檢驗)。為了說明χ2檢驗的必要性,我們先來看下面的例子。調(diào)查某地區(qū)中學生的升學意愿,得到表11-5的結(jié)果。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析交互分類與

檢驗如果僅僅從交互分類表中的百分比來看,我們也許會得到這樣的結(jié)論:兩類中學生之間在是否想考大學這方面存在明顯差別,城市中學生想考大學的比例明顯高于農(nóng)村中學生的比例(二者之間的差別達到了13%左右)。但是,如果用這一結(jié)果來反映總體的情況,那么就會歪曲現(xiàn)實。通過計算,得出表115數(shù)據(jù)的

值為3

692,小于顯著度為0.05的臨界值3.841。所以,我們可以得出結(jié)論:表11-5中所表現(xiàn)出來的兩類中學生之間的差異,是抽樣的隨機誤差造成的,它在總體中并不存在。我們也可以說,總體中兩類中學生之間在是否想考大學這方面不存在明顯差別。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析交互分類與

檢驗當然,

檢驗也有其弱點。這主要是由于

值的大小不僅與數(shù)據(jù)的分布有關,同時還與樣本的規(guī)模有關。當樣本足夠大時,一些很小的分布差異也可以通過

檢驗達到顯著性水平。從表11-6中所列的三個交互分類表中,我們可以明白這一道理。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析不同層次變量的相關測量與檢驗如果兩個變量都是定類層次,或一個定類一個定序,可以采用λ系數(shù)進行測量。它具有消減誤差比例的意義。消減誤差比例(proportionatereductioninerror,PRE)指的是知道X的值時所減少的誤差(E1-E2)與總誤差的比。PRE越大,表示以X值去預測Y值時能夠減少的誤差所占的比例越大。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析不同層次變量的相關測量與檢驗如果兩個變量都是定序變量,可以用Gamma系數(shù)來測量它們之間的相關關系。當兩個變量一個為定類(或定序)變量,另一個為定距(以上)變量時,我們可以用相關比率(correlationratio)或eta系數(shù)來測量二者間的相關程度。對于兩個定距變量來說,由于其數(shù)學特征的不同,我們可以用更精確一些的相關系數(shù)來反映它們之間的相關程度。第二節(jié)

定量資料分析二、雙變量統(tǒng)計分析不同層次變量的相關測量與檢驗表11-7總結(jié)了各種層次變量的相關測量與檢驗方法,同時,需要注意的是,各種相關測量的方法,目的都是理解兩個變量在“樣本”中相關程度的強弱或大小。第二節(jié)

定量資料分析三、多變量統(tǒng)計分析闡釋模式闡釋模式(elaborationmodel)是一種通過引進并控制第三變量來進一步了解和探討兩變量之間關系性質(zhì)的統(tǒng)計分析方法。根據(jù)具體作用的不同,闡釋模式可以分為三種類型:因果分析、闡明分析和條件分析。因果分析的目標,是檢定被看作自變量的x與被看作因變量的y之間,是否確實存在著因果關系。闡明分析的目標是探討因果關系的作用方式或作用途徑。條件分析所關注的是原關系在不同條件下是否會有所不同。第二節(jié)

定量資料分析三、多變量統(tǒng)計分析闡釋模式因果分析通常需引進若干前置變量(第三變量),以判明x與y之間的因果關系是否為虛假的,即二者的關系是否為前置變量影響的結(jié)果。當引入和控制的第三變量數(shù)目越多,且都不影響和改變原來兩個變量之間的關系性質(zhì)時,我們對二者間關系的信心也就越大。假定我們要研究住戶的擁擠程度對夫妻間沖突的影響,調(diào)查所得到資料如表11-8所示。第二節(jié)

定量資料分析三、多變量統(tǒng)計分析闡釋模式我們不能簡單地依據(jù)表118的結(jié)果就下結(jié)論說“住戶的擁擠程度是夫妻沖突的原因”,因為或許還有其他的因素與這兩個變量都相關且這兩個變量同時受到其他變量的影響。比如,家庭的經(jīng)濟水平就可能是影響這二者的第三因素。我們將家庭經(jīng)濟水平分為高、中、低三組,在每一組中再來看原來兩個變量之間的關系,假定此時得到表11-9的結(jié)果。第二節(jié)

定量資料分析三、多變量統(tǒng)計分析闡釋模式從操作上看,因果分析、闡明分析、條件分析這三者的統(tǒng)計分析方法都是相同的,即都是用分表法來控制第三變量,然后用分表的結(jié)果與原關系進行比較。一項具體的分析究竟是屬于因果分析,還是屬于闡明分析,或是條件分析,關鍵在于研究者的理論假設和理論分析框架,即在理論分析框架中,第三變量處于什么位置,扮演什么角色。第二節(jié)

定量資料分析三、多變量統(tǒng)計分析多元回歸分析為了用多個自變量來估計或預測一個因變量的數(shù)值,以及了解這些自變量中的哪一個對因變量的影響最大,我們需要進行多元回歸分析(multipleregressionanalysis)。多元回歸方程的表達式如下:常常需要將這些b值化為標準值,相應地,多元回歸方程也應轉(zhuǎn)化為標準化回歸方程:第二節(jié)

定量資料分析三、多變量統(tǒng)計分析多元回歸分析在復相關系數(shù)與B系數(shù)之間、每一自變量的分別決定系數(shù)與總的決定系數(shù)之間,存在著下列關系:多元回歸方程中各種系數(shù)的計算都比較復雜,通常是用計算機來進行計算。在SPSS等統(tǒng)計分析軟件中,都有計算這些系數(shù)的工具,我們只需熟悉和掌握這些軟件的使用方法。第三節(jié)

定性資料的整理一、整理筆記與建立檔案分析定性資料的第一步是對這種凌亂的記錄資料進行整理。它主要包括分類、建檔、編碼等具體內(nèi)容,傳統(tǒng)的做法主要為手工操作將材料分門別類地寫在卡片上,分別標以不同的代碼,然后按不同的類別歸類放置。通常的方式是先將實地記錄或現(xiàn)場筆記全部輸入計算機,存在磁盤上,變成可以隨時調(diào)用、不斷復制、任意組織和無數(shù)次處理的文件。計算機對定性資料分析的幫助作用除了體現(xiàn)在文字處理功能上外,還體現(xiàn)在許多專門處理定性資料的分析軟件上,如Ethnograph、Nvivo等,它們使得研究者分析定性資料的能力大大加強。第三節(jié)

定性資料的整理一、整理筆記與建立檔案在資料整理的過程中,研究者要著手建立各種資料檔案。巴比就曾建議研究者建立下列幾種類型的資料檔案:一是背景檔案,特別是對一些研究社會運動或重大社會事件的定性研究而言,這種背景檔案十分重要。二是傳記檔案。三是參考書目檔案,將資料分析過程中,甚至整個研究過程中所查閱、記錄下來的各種書目、文獻資料都進行系統(tǒng)的整理和歸檔。四是分析檔案,即根據(jù)分析的主題將各種資料分別集中,這是資料分析過程中最主要的檔案類型。第三節(jié)

定性資料的整理二、定性資料的編碼在定性研究中,編碼則是資料分析中的一個完整的部分。研究者將原始資料組織成概念類別,創(chuàng)造出主題或概念,然后用這些主題或概念來分析資料。編碼是兩種同時發(fā)生的活動:資料的機械減少與類別化分析。施特勞斯定義了三種定性資料的編碼類型,即開放式編碼、軸心式編碼、選擇式編碼。第三節(jié)

定性資料的整理二、定性資料的編碼開放式編碼開放式編碼(opencoding)具體做法是,研究者先設置一些主題,同時,將最初的代碼或標簽分配到資料中,以便將大量零散的、混雜的資料轉(zhuǎn)變成不同的類別。在這一過程中,研究者可以不受任何約束地創(chuàng)造新的主題,也可以在后來的分析中改變原來的編碼。需注意的是,此時的主題處于一種比較低的抽象層次上,大部分來源于研究者最初的研究問題、相關文獻中的概念、社會背景中人們所用的詞語,以及研究者在沉浸于資料的過程中的突發(fā)奇想。第三節(jié)

定性資料的整理二、定性資料的編碼開放式編碼研究者的大部分編碼主題是產(chǎn)生于閱讀資料和實地記錄的過程之中的。無論開始時是否有一份概念名單,研究者在開放式編碼結(jié)束后都應有一張這樣的主題名單。這種主題名單有三種主要的作用:(1)它可以幫助研究者一眼就看到新出現(xiàn)的主題;(2)它可以幫助研究者在今后的開放式編碼中發(fā)現(xiàn)主題;(3)它可以幫助研究者建立一個包含研究中全部主題的空間,以便在今后進一步的分析中識別、排列、結(jié)合、拋棄和進行擴充。第三節(jié)

定性資料的整理二、定性資料的編碼軸心式編碼軸心式編碼著重于發(fā)現(xiàn)和建立類別之間的各種聯(lián)系,包括因果關系、時間關系、語義關系等。在軸心式編碼過程中,研究者思考原因和結(jié)果、階段和過程,并尋找將它們聚合在一起的類別或概念。軸心式編碼可以刺激對概念與主題間聯(lián)系的思考,同時它也提出新的問題。它可以提示放棄某些主題或是更深入地探討另一些主題。第三節(jié)

定性資料的整理二、定性資料的編碼選擇式編碼選擇式編碼(selectivecoding)是在瀏覽資料和進行開放式或軸心式編碼工作的基礎上,有選擇地查找那些能夠說明主題的個案,并對資料進行比較和對照。在選擇式編碼過程中,主要的主題或概念始終指引著研究者的研究。他不斷地對在早期編碼中所識別的特定主題進行再組織,并探討和分析多個不同的重要主題。選擇式編碼也可以說是在主題中找到一個可以統(tǒng)領其他相關主題的核心主題,將所有的研究結(jié)果統(tǒng)一在這個核心主題的范圍之內(nèi)。第三節(jié)

定性資料的整理三、形成概念定性研究者根據(jù)資料來形成新的概念,或提煉概念。概念形成是定性資料分析過程中一個完整的部分,并且它在資料收集時就已經(jīng)開始。因此,概念化是定性資料分析過程中用以組織資料、概括資料含義的一種主要方式。在整理定性資料的過程中,研究者往往會通過向資料提出評論性的問題來進行概念化或者形成概念。概念的形成為定性資料分析提供了一種很好的基礎和框架。第三節(jié)

定性資料的整理四、撰寫分析型備忘錄定性研究的一個重要特征是研究者總得不停地記筆記。分析型備忘錄(analyticmemo)是實地筆記的一個特殊類型。它是實地研究者對于編碼過程的想法和觀點的一種備忘錄或一種討論記錄。分析型備忘錄鍛造了具體資料或者粗略證據(jù)與較為抽象的理論思考之間的鏈條。它包含著一種研究者對資料和編碼的主動反應及思考。分析型備忘錄的寫作方式可以是多種多樣的,每個研究者可能都會采用他們自己所習慣的方式。第四節(jié)

定性資料分析一、定性資料分析的基本過程定性資料分析的過程是一個對資料進行分類、描述、綜合、歸納的過程。定性資料分析的基本邏輯是歸納法,即從具體的、個別的、經(jīng)驗的事例中逐步概括、抽象出概念和理論,其主要工作任務可以概括為對信息的組織、歸類和對信息內(nèi)涵的提取。在定性資料分析過程中,研究者所采取的典型方法就是對觀察、訪談所得到的資料進行重新研讀,并按照基本的社會科學范疇對它們進行分類。盡管定性資料分析的過程可以說貫穿于整個研究的始終,但主要還是在資料收集結(jié)束后。第四節(jié)

定性資料分析一、定性資料分析的基本過程這種分析大致可以分為初步瀏覽、閱讀編碼、分析抽象三個不同的階段,每一個階段的具體內(nèi)容及做法如下。首先把所有觀察記錄和訪談筆記等資料粗略地瀏覽一遍,其目的是對全部資料的整體有所了解和熟悉,同時可以重新回想起許多實地調(diào)查時的情景和感受。在初步瀏覽的基礎上,研究者重新開始逐段逐行地仔細閱讀每一段實地記錄,分析每一段筆記的內(nèi)容,并且在閱讀中進行資料的各種編碼工作。最后再次回過頭來,根據(jù)不同的標準或從不同的角度,仔細審閱和思考資料中所做的各種記號,思考和比較各種不同的主題及分析型備忘錄,看看哪些東西反復出現(xiàn),看看哪些資料中存在突出差異,并從中歸納或抽象出解釋和說明現(xiàn)象和社會生活過程的主要變量、關系和模式。第四節(jié)

定性資料分析二、定性資料分析方法連續(xù)接近法連續(xù)接近法(successiveapproximation)指的是這樣一種方法,它用不斷反復和循環(huán)的步驟,使得研究者從開始時一個比較含糊的觀念以及雜亂、具體的資料細節(jié),到達一個具有概括性的綜合分析的結(jié)果。經(jīng)過多次的反復和循環(huán),修改后的概念和模型幾乎“接近”了所有的證據(jù),并且這種經(jīng)過連續(xù)、一遍又一遍修改的概念和模型也更加準確。第四節(jié)

定性資料分析二、定性資料分析方法舉例說明法舉例說明法(illustrativemethod)即用經(jīng)驗證據(jù)來說明某種理論。這是定性資料分析中最為普遍的一種方法。舉例說明法在具體操作上可以分為兩種不同的方式:一種方式主要表明理論模型是如何說明或解釋了特定個案或特定現(xiàn)象的。另一種方式則是對一種理論模型的“平行說明”,即研究者平行列舉多個不同的個案。第四節(jié)

定性資料分析二、定性資料分析方法比較分析法比較分析法是從先前已有的理論或從歸納中發(fā)展出相關的規(guī)律或關系模型的思想開始,將注意力集中在少數(shù)規(guī)律上,用其他替換的解釋與之進行比較。根據(jù)具體的比較方式的不同,定性資料分析中的比較分析法可以分為兩種類型:一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論