版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
市場調研Marketing
Research**學院****
二零零八
·
一*****本科課程
本講內容了解數(shù)據(jù)準備的含義;掌握數(shù)據(jù)準備的步驟和操作方法;了解常見的數(shù)據(jù)分析技術分類方法;掌握數(shù)據(jù)描述主要指標含義和方法;掌握列聯(lián)表、方差分析的應用;理解因子分析、聚類分析和判別分析的聯(lián)系和分析方法。第8講數(shù)據(jù)分析
學習導航數(shù)據(jù)準備列聯(lián)表分析方差分析分析技術分類與數(shù)據(jù)描述數(shù)據(jù)分析技術數(shù)據(jù)準備的步驟聚類分析判別分析分析技術分類數(shù)據(jù)描述因子分析數(shù)據(jù)準備★物理檢查★數(shù)據(jù)編碼★數(shù)據(jù)錄入★數(shù)據(jù)清理★數(shù)據(jù)轉換★數(shù)據(jù)保存★集中趨勢分析★頻數(shù)分析★離散趨勢分析★數(shù)據(jù)分布★定義問題★構造相關矩陣★提取因子★因子命名★判斷模型擬合情況★擬定分析方案★選擇距離指標★確定族群數(shù)目★族群解釋和命名★定義問題★選擇判別方法★估計判別函數(shù)系數(shù)及其顯著性★運用判別函數(shù)進行判別★估算判別的有效性第8講數(shù)據(jù)分析
數(shù)據(jù)準備的含義數(shù)據(jù)分析包含兩個基本工作步驟:數(shù)據(jù)準備和數(shù)據(jù)分析。數(shù)據(jù)準備:是對收集來的原始數(shù)據(jù)進行一列處理,形成數(shù)據(jù)分析所需的標準數(shù)據(jù)表的過程。數(shù)據(jù)分析:是運用一定的分析方法對數(shù)據(jù)進行處理,使其顯示出解決管理決策問題和營銷研究問題所需信息的過程。數(shù)據(jù)準備一般包括問卷的物理檢查、編碼、錄入、清理、轉換、保存等步驟。
第8講數(shù)據(jù)分析
數(shù)據(jù)準備的步驟物理檢查數(shù)據(jù)編碼數(shù)據(jù)錄入數(shù)據(jù)清理數(shù)據(jù)轉換數(shù)據(jù)保存第8講數(shù)據(jù)分析
物理檢查檢查的內容包括:①問卷是否填寫完整;②是否存在規(guī)律性回答③是否存在沒有按要求回答,并盡可能了解其中的原因。
問卷不完整的處理方法:①數(shù)據(jù)缺失較少,直接保留記錄,按記錄的實際情況進入分析,所缺數(shù)據(jù)按缺失值處理;②當樣本量較小時,缺失值又十分重要,根據(jù)問卷作業(yè)證明記載信息進行回訪,盡可能補上缺失值;③當樣本量較大時,問卷的缺失值較多,采用直接丟棄整份問卷或部分數(shù)據(jù)。
第8講數(shù)據(jù)分析
數(shù)據(jù)編碼矩陣式原則:是針對整體數(shù)據(jù)編排格式而言的,即最終數(shù)據(jù)表必須是一張由若干行和若干列組成的矩陣式數(shù)據(jù)表格。
排他性原則:在一定范圍內,一個編碼只能對應一個變量或答案,每個答案(包括沒有作答、無法作答等情況)都有一個代碼與之對應,不能存在相互交叉。需要強調的是,當一個變量的答案是多選時,對于每一種答案應采用一個代碼進行列示,對受訪者沒有選中(注意:應區(qū)別沒有回答的代碼)的答案分配一個統(tǒng)一的代碼。
【例】您的性別是:□男□女這一問題的編碼應包括:變量:性別,或gend=性別答案:0=女;1=男;2=?jīng)]有回答
第8講數(shù)據(jù)分析
編碼的另外兩種情況一是多維編碼,或稱復合編碼,即一個編碼包含的信息是多維的,如同身份證號碼包含省份、城市、生日、性別等信息一樣。多維編碼一般僅僅用于標識定類變量,不利于統(tǒng)計分析,應謹慎使用;二是定性資料編碼。定性資料的編碼絕非輕而易舉,研究人員除了解編碼原則以外,還必須對手頭資料的研究目的有一定理解,更重要的是對文字信息的洞察力。研究者應首先建立起一套編碼單位,對文本(最好是電子文本)進行手工編碼,再進行計算機分析。第8講數(shù)據(jù)分析
數(shù)據(jù)錄入如果通過電腦輔助電話訪談(CATI)或電腦輔助人員訪談(CAPI)收集數(shù)據(jù),研究者可以直接得到電子版數(shù)據(jù)表。對于非電腦輔助調查,研究者需要通過一定的手段將數(shù)據(jù)轉錄為電子表格。手工鍵盤錄入應采用二次錄入,通過兩次錄入的結果對比檢查有無差異,或者抽取部分問卷錄入結果進行核查,核查比例一般不低于25%。第8講數(shù)據(jù)分析
數(shù)據(jù)清理數(shù)據(jù)清理的任務包括檢查數(shù)據(jù)的一致性和處理缺失值。一致性檢查包括三項基本工作:第一,檢查有無超出編碼定義范圍的數(shù)據(jù)存在;第二,檢查有無答案的邏輯矛盾;第三,檢查有無兩行或多行數(shù)據(jù)完全一致或絕大部分一致。缺失值處理方法一般有:①用均值代替;②用估計值代替;③整例刪除;④結對刪除。第8講數(shù)據(jù)分析
數(shù)據(jù)轉換重新編碼:出于受訪者便利或事先無法預計等原因,問卷設計中的某些數(shù)據(jù)可能需要進行反向編碼、重新分組編碼等操作。反向編碼就是將原有編碼進行反向替代。數(shù)據(jù)編輯單變量重新標度。如指數(shù)形式或對數(shù)形式等;變量組合運算??赡苄鑼Χ鄠€變量進行四則運算等;量綱轉換。對不同變量的定量值進行可比性處理;賦權。在必要時可能對不同的問卷進行賦權,增加特定目標受訪者對最終結果的影響力。第8講數(shù)據(jù)分析
數(shù)據(jù)轉換數(shù)據(jù)保存應注意以下幾點:第一,多份實時備份,手工輸入數(shù)據(jù)文件被破壞帶來的物質和精神損失是巨大的;第二,保存格式通用,因為數(shù)據(jù)表可能供分析員在不同的軟件上使用,保存格式通用可以省去很多麻煩,節(jié)約大量的時間;第三,數(shù)據(jù)表需編號,數(shù)據(jù)表編號最好采用文字加數(shù)字的方法,便于識別數(shù)據(jù)內容和狀態(tài),這一點對于大規(guī)模數(shù)據(jù)分析十分重要。第8講數(shù)據(jù)分析
數(shù)據(jù)分析技術分類依據(jù)測量尺度不同,數(shù)據(jù)分析技術被分為非測量型數(shù)據(jù)技術(nonmetric)和測量型數(shù)據(jù)技術(metric),非測量型數(shù)據(jù)包括定類尺度和定序尺度,它們在本質上主要反映事物的分類,沒有真正的測量含義;測量型數(shù)據(jù)包括定距尺度和定比尺度,它們都能夠測量變量的值。依據(jù)統(tǒng)計技術屬性,數(shù)據(jù)分析技術被分為因果技術(dependencetechnique)和相依技術(interdependencetechnique),因果技術適用于一個或多個變量作為因變量,其他變量作為自變量的情況;相依技術適用于變量沒有自變量和因變量之分,只是測試變量之間的相關性或個體之間變量的相似程度。按分析變量數(shù)量的不同,數(shù)據(jù)分析技術被分為單元統(tǒng)計技術(univariatetechnique)和多元統(tǒng)計技術(multivariatetechnique)。單元分析技術適用于單個元素分析,單元素的衡量指標或多或少;多元統(tǒng)計技術適用于分析多個元素之間的關系,或多個元素同時對某一個因素的影響。
第8講數(shù)據(jù)分析
數(shù)據(jù)描述技術集中趨勢:用來反映數(shù)據(jù)的一般水平,常用的指標有平均值、中位數(shù)和眾數(shù)等;離散趨勢:主要用來反映數(shù)據(jù)之間的差異程度,常用的指標有方差、標準差、全距、最大值和最小值。頻數(shù)分析:利于研究者初步觀察一些統(tǒng)計規(guī)律。數(shù)據(jù)分布:統(tǒng)計分析中,通常要假設樣本的分布屬于正態(tài)分布,因此要用偏度和峰度兩個指標來檢查樣本是否符合正態(tài)分布。
第8講數(shù)據(jù)分析
描述統(tǒng)計分析案例某保險公司有20個保險銷售分公司,各公司2006年取得的銷售業(yè)績(單位:萬元)如下,對銷售業(yè)績進行描述分析。
公司編號銷售業(yè)績公司編號銷售業(yè)績公司編號銷售業(yè)績公司編號銷售業(yè)績1265.36315.311403.616318.52286.17570.112265.517326.03340.48512.013356.618373.24410.89422.114632.619350.45418.210305.015521.420421.8第8講數(shù)據(jù)分析
銷售業(yè)績的描述性分析變量全距最小值最大值銷售業(yè)績367.3265.3632.6樣本量均值標準差方差20390.745101.610510324.691第8講數(shù)據(jù)分析
聯(lián)列表技術列聯(lián)表的本質:是兩個或兩個以上變量的交叉頻數(shù)分布表,它既可以幫助研究者初步描述和判斷變量之間的關系,也可以用構造卡方統(tǒng)計量來檢驗變量的關系。
第8講數(shù)據(jù)分析
列聯(lián)表分析實例例:顧客對產(chǎn)品屬性重要性評價的最終答案如下,那么不同年齡受訪者的評價是否具有顯著的差別?
年齡段重要性評價年齡合計≤25周歲25~34周歲35~44周歲45~59周歲≥60周歲彩電品牌1222612154792202411115731823930534183073058合計7810339225247第8講數(shù)據(jù)分析
列聯(lián)表的分析結果統(tǒng)計量檢驗統(tǒng)計量值自由度雙側近似概率Pearson卡方(PearsonChi-Square)24.28312.019對數(shù)似然比方法計算的卡方(LikelihoodRatio)25.15012.014線性相關的卡方(Linear-by-LinearAssociation)8.1751.004有效樣本量247列聯(lián)表分析在SPSS中的實現(xiàn):點擊Analyze→Descriptive
Statitics→Crosstabs,選中“彩電品牌”到Row(s),“年齡”到“Column(s)”,點擊下方【statistics】,選中“Chi-square”,依次點擊【continue】【ok】,結果如下:第8講數(shù)據(jù)分析
方差分析方差分析通常用于某一個或多個變量在兩組或兩組以上的組別之間的均值是否存在顯著差異,各組別的均值大小如何。方差分析通常假設各組均值相等,如F統(tǒng)計量拒絕原假設,我們就認為某變量在各組別之間存在顯著差異,企業(yè)應采取不同的策略。
第8講數(shù)據(jù)分析
因子分析因子分析是一種用于數(shù)據(jù)簡化和降維的多元統(tǒng)計分析方法。面對眾多內在相關的變量,因子分析試圖使用少數(shù)幾個隨機變量來描述眾多變量所體現(xiàn)的一種基本結構,從而將數(shù)據(jù)維度降至一個可以掌握的水平。因子分析是解決多重共線性問題的有效手段,能夠有效探索變量之間的內在結構。
第8講數(shù)據(jù)分析
聚類分析聚類分析:就是實現(xiàn)分類的一種多元統(tǒng)計方法,它根據(jù)聚類變量將受訪者分成相對同質的族群。與因子分析不同,聚類分析通過將具有同質性的受訪者個體聚為較少數(shù)量的族群來減少個體數(shù)量,即個體數(shù)量并不變化,而因子分析通過減少變量的數(shù)量來達到降維目的。
第8講數(shù)據(jù)分析
判別分析判別分析:是在已有的觀察數(shù)據(jù)及其所屬類別信息的基礎上,建立判別式,然后對未
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026新疆生產(chǎn)建設兵團建設工程(集團)有限責任公司員工招競聘15人備考題庫(第五批次)及參考答案詳解1套
- 2026廣西北海市合浦縣民政局招錄城鎮(zhèn)公益性崗位人員11人備考題庫及完整答案詳解一套
- 2026年藥品研發(fā)工程師筆試題目集
- 2026年生物技術與應用知識考核試題集
- 2026年心理咨詢服務流程優(yōu)化試題
- 2026年醫(yī)藥銷售人員專業(yè)知能測試筆試練習題
- 2026年金融投資風險控制學員測試題
- 2026年現(xiàn)代企業(yè)管理技能考核訓練題目
- 2026年世界歷史發(fā)展脈絡及文化交流考試題
- 2026年現(xiàn)代通信網(wǎng)絡技術中的安全與風控問題庫
- 廣東省佛山市南海區(qū)2025-2026學年上學期期末八年級數(shù)學試卷(含答案)
- 2026元旦主題班會:馬年猜猜樂新春祝福版 教學課件
- 浙江省杭州市富陽區(qū)2023-2024學年四年級上學期語文期末試卷
- 環(huán)境影響評估投標方案(技術方案)
- JTG-T3651-2022公路鋼結構橋梁制造和安裝施工規(guī)范
- 河南中美鋁業(yè)有限公司登封市陳樓鋁土礦礦山地質環(huán)境保護與土地復墾方案
- 海南省定安縣龍河鎮(zhèn)大嶺建筑用花崗巖礦山 環(huán)評報告
- 大學生畢業(yè)論文寫作教程全套教學課件
- 110kV旗潘線π接入社旗陌陂110kV輸電線路施工方案(OPGW光纜)解析
- 王洪圖黃帝內經(jīng)80課時講稿
- 鼎甲異構數(shù)據(jù)同步軟件用戶手冊
評論
0/150
提交評論