版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第八章調(diào)查資料的處理與基礎(chǔ)分析【本章要點】□資料的審核與編碼□數(shù)據(jù)錄入的方法□數(shù)據(jù)自動清理和數(shù)據(jù)的圖形化□數(shù)據(jù)的描述性統(tǒng)計分析□交叉列表分析導(dǎo)入案例第一節(jié)調(diào)查資料的處理一、資料的審核(1)不完整答卷的審核與處理。
(2)明顯錯誤答案的審核與處理。(3)無興趣答卷的審核與處理。(4)對開放性問題無序回答的審核與處理。小案例8-1:某問卷中有這樣兩個問題:問題5:逛街購物對我來說是一種享受?!跏仲澇伞踬澇伞醪毁澇梢膊环磳Α醪毁澇伞跏植毁澇蓡栴}15:逛街是我生活中的意見愉快的事?!跏仲澇伞踬澇伞醪毁澇梢膊环磳Α醪毁澇伞跏植毁澇蛇@兩個問題雖然在語義上有些差別,但是對兩個問題回答的態(tài)度應(yīng)該是一致的,可能程度不同而已。如果出現(xiàn)某個受訪者在“問題5”上選擇了“贊成”,而在“問題15”選擇了“不贊成”,則出現(xiàn)了答案的邏輯矛盾,其原因可能是受訪者的心不在焉等,包含相互矛盾答案的問卷是不合格的,相應(yīng)的數(shù)據(jù)應(yīng)該予以刪除。二、編碼(一)問卷編碼的內(nèi)容1.問卷代碼編碼2.封閉式問題的編碼(1)順序編碼法(2)分組編碼法3.開放式問題的編碼(二)問卷編碼時應(yīng)該注意的幾個問題1.提倡使用統(tǒng)一編碼表和對編碼表進行測試。2.編碼的合理性。3.編碼的廣泛性和概括性。4.編碼的唯一性和排斥性。5.嚴格界定回答問題的角度。6.詳略適當(dāng)。三、數(shù)據(jù)錄入通常采用SPSS軟件來進行數(shù)據(jù)錄入與分析處理。打開SPSS軟件,首先進入變量視圖窗口(variableview),對數(shù)據(jù)進入實質(zhì)性的編碼定義過程,下面以一個關(guān)于美國家庭汽車保有量調(diào)查為例(見圖8.1)進行說明。(一)定義數(shù)值的類型(DefineVariableType)定義數(shù)值的類型可以通過點擊類型進行設(shè)置,設(shè)置方式如圖8.2所示:對話框中列出如下8種數(shù)據(jù)類型:1.Numeric:數(shù)值型,同時定義數(shù)值的寬度(Width),即整數(shù)部分+小數(shù)點+小數(shù)部分的位數(shù),默認為8位;定義小數(shù)位數(shù)(DecimalPlaces),默認為2位。2.Comma:加顯逗號的數(shù)值型,即整數(shù)部分每3位數(shù)加一逗號,其余定義方式同數(shù)值型。3.Dot:3位加點數(shù)值型,無論數(shù)值大小,均以整數(shù)形式顯示,每3位加一小點(但不是小數(shù)點),可定義小數(shù)位置,但都顯示0,且小數(shù)點用逗號表示。如1.2345顯示為12.345,00(實際是12345E-4).4.Scientificnotation:科學(xué)記數(shù)型,同時定義數(shù)值寬度(Width)和小數(shù)位數(shù)(DecimalPlaces),在數(shù)據(jù)管理窗口中以指數(shù)形式顯示。如定義數(shù)值寬度為9,小數(shù)位數(shù)為2,則345.678顯示為3.46E+02。5.Date:日期型,用戶可從系統(tǒng)提供的日期顯示形式中選擇自己需要的。如選擇mm/dd/yy形式,則2007年6月25日顯示為06/25/07。6.Dollar:貨幣型,用戶可從系統(tǒng)提供的日期顯示形式中選擇自己需要的,并定義數(shù)值寬度和小數(shù)位數(shù),顯示形式為數(shù)值前有$。7.Customcurrency:常用型,顯示為整數(shù)部分每3位加一逗號,用戶可定義數(shù)值寬度和小數(shù)位數(shù)。如12345.678顯示為12,345.678。8.String:字符型,用戶可定義字符長度(Characters)以便輸入字符。(二)對變量值進行定義通過點擊變量值(value)進行定義,定義方式如圖8.3所示:(三)數(shù)據(jù)錄入完成所有變量定義以后,就可以進入數(shù)據(jù)視圖窗口(dataview),根據(jù)編碼把數(shù)據(jù)錄入到SPSS軟件中,然后把數(shù)據(jù)進行保存(SPSS軟件中的數(shù)據(jù)都是以.sav為擴展名),以便以后的分析。美國家庭汽車保有量的資料錄入如表8—4所示:四、數(shù)據(jù)自動清理數(shù)據(jù)自動清理包括檢查數(shù)據(jù)的一致性和缺失值的處理。SPSS在數(shù)據(jù)的檢查與篩選(screeningdata)方面為我們提供了很多有用的功能。通常通過以下兩種方法對數(shù)據(jù)進行檢查與篩選:(一)一致性檢查1.導(dǎo)致奇異值和極端值的原因分析2.奇異值和極端值的檢測3.減少奇異值和極端值影響的方法(二)缺失值處理1.剔除有缺失值的觀測單位2.對缺失值進行估計后補上。3.將缺失值作為常數(shù)值,如作為“0”。五、數(shù)據(jù)的圖形化數(shù)據(jù)自動清理完成后,就可以進行數(shù)據(jù)分析了。通過對應(yīng)的圖表,讓讀者迅速了解數(shù)據(jù)的整體情況(如數(shù)據(jù)的分布特征、集中趨勢與離散趨勢等),獲得相關(guān)的信息與結(jié)論。在SPSS軟件中,提供了相當(dāng)強大的圖形功能(詳見第九章)。第二節(jié)描述性統(tǒng)計分析一、數(shù)據(jù)的集中趨勢分析1.算術(shù)平均數(shù)(Mean)算術(shù)平均數(shù),也稱為均值,是調(diào)查所得的全部數(shù)據(jù)之和除以數(shù)據(jù)個數(shù)的結(jié)果。算術(shù)平均數(shù)的計算公式為:2.調(diào)和平均數(shù)調(diào)和平均數(shù)又稱倒數(shù)平均數(shù),是指各變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。計算公式為:3.幾何平均數(shù)幾何平均數(shù)是指n個變量值乘積的n次方根,一般用符號表示,適用于對比率數(shù)據(jù)的平均,主要用于計算平均增長率與平均發(fā)展速度。計算公式為:4.眾數(shù)(Mode):一個統(tǒng)計總體或變量數(shù)列中出現(xiàn)次數(shù)最多、頻率最高的變量值(或?qū)傩员憩F(xiàn))。5.中位數(shù)(Median):指將變量值按大小順序排列以后,位于數(shù)列中間位置的變量值。6.算術(shù)平均數(shù)、中位數(shù)、眾數(shù)的關(guān)系從分布角度看,眾數(shù)是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,算術(shù)平均數(shù)則是全部數(shù)據(jù)的平均值。對稱分布:右偏分布:左偏分布:二、數(shù)據(jù)的離散程度分析(一)極差(Range)極差又稱全距,是指變量數(shù)列中最大變量值與最小變量值之差,一般用符號R表示。其計算公式為:極差=最大標(biāo)志值-最小標(biāo)志值根據(jù)組距數(shù)列求極差的計算公式為:極差=最高組上限-最低組下限(二)平均差(AverageDeviation)平均差是指各變量值與其算術(shù)平均數(shù)離差絕對值的算術(shù)平均數(shù)。一般用符號AD表示。(1)資料未分組時,平均差的計算公式為:(2)資料分組時,平均差的計算公式為:(三)方差與標(biāo)準差方差(Variance)是指一組數(shù)據(jù)的各變量值與其算術(shù)平均數(shù)離差平方的算術(shù)平均數(shù),是測度數(shù)據(jù)離散程度的主要方法,用表示。標(biāo)準差(StandardDeviation),是方差的算術(shù)平方根,又叫均方差。(1)未分組資料時,方差與標(biāo)準差的計算公式如下:方差的公式為:標(biāo)準差的公式為:(2)分組資料時,方差與標(biāo)準差的計算公式如下:方差的公式為:標(biāo)準差的公式為:式中,X為變量值;f為各組次數(shù);為算術(shù)平均數(shù);為方差;N為總體單位數(shù);為標(biāo)準差。資料鏈接8-1(四)離散系數(shù)離散系數(shù)是測定總體中各單位標(biāo)志值變異的相對量指標(biāo),以消除不同總體之間在計量單位、平均水平方面的不可比因素。常用的離散系數(shù)主要是標(biāo)準差離散系數(shù)。其公式分別為:【例8—2】甲乙兩個橡膠廠某年生產(chǎn)某種輪胎的行駛里程資料如表8—6。要求比較兩廠輪胎的質(zhì)量哪一個較穩(wěn)定。第三節(jié)交叉列表分析一、交叉列表分析的意義(一)交叉列表分析的含義交叉列表分析是指同時將兩個或兩個以上有一定聯(lián)系的變量及其變量值按照一定的順序交叉排列在一張統(tǒng)計表內(nèi),使各變量值成為不同變量的結(jié)點,從中分析變量之間的相關(guān)關(guān)系,進而得出科學(xué)結(jié)論的一種數(shù)據(jù)分析技術(shù)。(二)交叉列表分析的意義(1)通俗易懂。(2)分析深入全面。(3)分析結(jié)果應(yīng)用廣泛。(4)分析結(jié)果使用方便。(5)分析過程操作簡單、容易掌握。二、交叉列表分析中變量的選擇與確定制作出來的交叉列表能否對經(jīng)營管理措施有幫助,關(guān)鍵取決于交叉列表分析中變量的選擇與確定。下面舉例說明變量的選擇與確定不當(dāng),會產(chǎn)生錯誤的結(jié)論?!纠?—3】國外某保險公司關(guān)于交通事故調(diào)查的分析國外某保險公司關(guān)于交通事故調(diào)查的最初記錄顯示,該公司保戶中有62%從未在駕駛時出過事故,如表8—8所示。表8—8小汽車駕駛者的事故比率下述數(shù)據(jù)進而被分類為男性和女性的事故比率,以確定性別同事故的多少是否有某種聯(lián)系,表8—9顯示了具體的情況。表8—9男性和女性小汽車駕駛者的事故比率表8—9中顯示,男性小汽車駕駛者從未在駕駛是出過事故占男性調(diào)查者的56%,女性小汽車駕駛者從未在駕駛是出過事故占女性調(diào)查者的68%,這一數(shù)據(jù)表明男性的事故比率高于女性,性別是影響事故比率的一個重要因素。有人(尤其是男性)開始懷疑調(diào)查的正確性,覺得應(yīng)該把其他因素考慮進來。一個可能的解釋是:男性開車開得多所以事故多。從而,把“駕駛路程”作為第三個變量因素加入進行研究,如表8—10所示。表8—10男女小汽車駕駛者的里程與事故比率表8—10顯示,不管男性和女性小汽車駕駛者事故發(fā)生率完成一樣,不同的是駕駛里程超過10000公里的駕駛員中,不論男性女性駕駛員,從未在駕駛是出過事故的比率都為52%。這說明小汽車駕駛者事故發(fā)生率的多少是與駕駛里程呈正相關(guān),而與駕駛員的性別無顯著關(guān)系。表8—11所顯示的男性駕駛員的事故比率之所以會高于女性,是因為男性駕駛員的駕駛里程數(shù)多于女性駕駛員。表8—11中顯示,在男性駕駛員中駕駛里程超過10000公里的比率為70.76%,在女性駕駛員中駕駛里程超過10000公里的比率為27.55%。表8—11小汽車駕駛者的里程數(shù)與性別的數(shù)據(jù)表三、兩變量交叉列表分析(一)兩變量交叉列表(二)兩變量交叉列表中相關(guān)關(guān)系的分類第一類是“顯然的高相關(guān)”。第二類是“不顯然的高相關(guān)”。第三類是“結(jié)構(gòu)的相關(guān)”。第四類是“辛普森悖論”(Simpson‘sParadox)。資料鏈接8-2四、三變量交叉列表分析(一)更加精確地表達原有兩變量之間的關(guān)系(二)顯示原有兩個變量的聯(lián)系是虛假的(三)顯示原先被隱含的關(guān)系(四)可能顯示原有的聯(lián)系沒有改變【思考題】1.調(diào)查資料的處理包括哪些步驟?2.調(diào)查資料的審核包括哪些內(nèi)容?3.如何對問卷中封閉式問題進行編碼?4.如何對問卷中開放式問題進行編碼?5.數(shù)據(jù)自動清理包括哪些內(nèi)容?6.對于缺失數(shù)據(jù)處理的方法有哪些?7.數(shù)據(jù)集中趨勢的指標(biāo)有哪些?各有何其特色?8.數(shù)據(jù)離散趨勢的指標(biāo)有哪些?各有何其特色?9.什么是交叉列表?如何正確的選擇和確定交叉列表中的變量?10.什么是兩變量交叉列表?11.怎樣對兩變量交叉列表中的兩變量相關(guān)關(guān)系進行判斷?12.什么是三變量交叉列表?【案例分析討論】銷售業(yè)績調(diào)查CoatalStar
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深圳市勞務(wù)員考試題庫及答案
- 人衛(wèi)技師考試題庫及答案
- 輔警職責(zé)培訓(xùn)課件
- 輔警作風(fēng)建設(shè)培訓(xùn)課件
- 護理對醫(yī)療質(zhì)量改進的貢獻
- 2026年深圳中考語文文言文翻譯專項試卷(附答案可下載)
- 2026年深圳中考英語臨考沖刺押題試卷(附答案可下載)
- 2026年深圳中考物理易混考點辨析試卷(附答案可下載)
- 2026年深圳中考生物專題整合訓(xùn)練試卷(附答案可下載)
- 2026年深圳中考生物名師原創(chuàng)預(yù)測試卷(附答案可下載)
- 半導(dǎo)體semi F81 中文版
- DBJ50-T-405-2021城市道路占道施工作業(yè)交通組織設(shè)計標(biāo)準
- 急性腎衰竭的臨床表現(xiàn)
- 設(shè)計質(zhì)量、進度、保密等保證措施
- 建筑工程崗前實踐報告1500字
- 甲狀腺手術(shù)甲狀旁腺保護
- 2026年全年日歷表帶農(nóng)歷(A4可編輯可直接打?。╊A(yù)留備注位置
- 重慶市沙坪壩區(qū)南開中學(xué)校2022-2023學(xué)年七年級上學(xué)期期末地理試題
- 小學(xué)語文五年下冊《兩莖燈草》說課稿(附教學(xué)反思、板書)課件
- 曼娜回憶錄的小說全文
- 飲食與心理健康:食物對情緒的影響
評論
0/150
提交評論