第五章基本統(tǒng)計(jì)分析.ppt_第1頁(yè)
第五章基本統(tǒng)計(jì)分析.ppt_第2頁(yè)
第五章基本統(tǒng)計(jì)分析.ppt_第3頁(yè)
第五章基本統(tǒng)計(jì)分析.ppt_第4頁(yè)
第五章基本統(tǒng)計(jì)分析.ppt_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 SPSS的基本統(tǒng)計(jì)分析,SPSS的基本統(tǒng)計(jì)分析,頻數(shù)分析-對(duì)應(yīng)表格法,計(jì)算描述統(tǒng)計(jì)量-對(duì)應(yīng)數(shù)值法,探索性描述分析-結(jié)合,交叉分組下的頻數(shù)分析,多選項(xiàng)分析,統(tǒng)計(jì)圖-對(duì)應(yīng)圖形法,頻數(shù)分析,目的 粗略把握變量的總體分布狀況。 例: 對(duì)某個(gè)問(wèn)題的總體看法,如新業(yè)務(wù)的使用愿望、教學(xué)效果等 對(duì)某事物的客觀描述,如通話的漫游類型、大客戶的行業(yè)分布 采用的方法 制作頻數(shù)分布表:包括計(jì)算 頻數(shù)、累計(jì)頻數(shù)、百分比、累計(jì)百分比 繪制統(tǒng)計(jì)圖形:條形圖(品質(zhì)數(shù)據(jù))、餅圖、 直方圖(數(shù)量數(shù)據(jù)),頻數(shù)分析,基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-frequenci

2、es (2)選擇幾個(gè)待分析的變量到variables框. (3)chart選項(xiàng),選擇所需要的圖形,頻數(shù)分析,應(yīng)用舉例 移動(dòng)通話的漫游類型分析 特點(diǎn):定類數(shù)據(jù) 使用頻數(shù)、百分比、總數(shù)(不可缺少的) 不使用頻數(shù)表中給出的累計(jì)頻數(shù)和累計(jì)百分比 移動(dòng)通話時(shí)間分析、移動(dòng)客戶話費(fèi)分析 特點(diǎn):數(shù)量數(shù)據(jù) 除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用累計(jì)頻數(shù)和累計(jì)百分比,頻數(shù)分析,數(shù)據(jù)中存在缺失值 使用有效百分比(分母為有效樣本數(shù)) 例:學(xué)生成績(jī)得優(yōu)率、得良率 frequencies-format 頻數(shù)分布表輸出按變量值、頻數(shù)升序、降序輸出,頻數(shù)分析,頻數(shù)分析中的其他分析 計(jì)算中位數(shù)、分位數(shù):適用于定序、定距數(shù)據(jù)

3、 數(shù)據(jù)按升序排序后,找到若干個(gè)分位點(diǎn)上的變量值 quartiles:計(jì)算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups: n等份 percentile: 自定義百分位點(diǎn) 計(jì)算眾數(shù):適用于定類數(shù)據(jù)(但必須是數(shù)值型),頻數(shù)分析,頻數(shù)分析中的其他分析 分位數(shù)的應(yīng)用 從一個(gè)側(cè)面比較兩組樣本數(shù)據(jù)的集中趨勢(shì) 例:( QL=50,QU=80) 和 (QL=70,QU=75) 的比較 在排除極端值影響的條件下,通過(guò)計(jì)算分位數(shù)差,比較兩組樣本數(shù)據(jù)的離散程度 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比較 分位數(shù)、中

4、位數(shù)、眾數(shù)的應(yīng)用舉例 不同類型的移動(dòng)客戶月話費(fèi)比較(數(shù)據(jù)拆分) 利用分位數(shù)(不顯示頻數(shù)分布表),計(jì)算描述統(tǒng)計(jì)量,目的 精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)、對(duì)稱程度、陡峭程度。 基本方法 計(jì)算基本描述統(tǒng)計(jì)量,計(jì)算描述統(tǒng)計(jì)量,描述集中趨勢(shì)的統(tǒng)計(jì)量 均值(mean):表示某變量所有變量值集中趨勢(shì)或平均水平的統(tǒng)計(jì)量。 適用于定距數(shù)據(jù)。 特點(diǎn):利用了全部數(shù)據(jù),易受極端值的影響。 描述離散程度的統(tǒng)計(jì)量 標(biāo)準(zhǔn)差(standard deviation-Std Dev):表示某變量的所有變量值離散趨勢(shì)的統(tǒng)計(jì)量。 SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差。 方差(variance):標(biāo)準(zhǔn)差的平方。 SP

5、SS中計(jì)算的是樣本方差。 極差 (range):最大值(minimum)-最小值(minimum),計(jì)算描述統(tǒng)計(jì)量,描述對(duì)稱程度的統(tǒng)計(jì)量 偏度(skewness):描述某變量所有變量值分布形態(tài)的偏斜程度和方向的統(tǒng)計(jì)量. 偏度為0表示對(duì)稱; 大于0表示正偏差大(右偏),眾數(shù)比均值小,極值大于均值; 小于0表示負(fù)偏差大(左偏)。,計(jì)算描述統(tǒng)計(jì)量,描述陡峭程度的統(tǒng)計(jì)量 峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。 峭度為0表示與正態(tài)分布峭度相同。 大于0表示比正態(tài)分布陡,尖峰。 小于0表示比正態(tài)分布緩;平峰。,計(jì)算描述統(tǒng)計(jì)量,其他統(tǒng)計(jì)量 均值標(biāo)準(zhǔn)誤差(S.E means)

6、 中心極限定理認(rèn)為:樣本均值N(u,2/n) 反映樣本均值與總體真值間的平均離散程度 樣本數(shù)越大,樣本均值的離散程度越小,對(duì)真值的估計(jì)越準(zhǔn)確,計(jì)算描述統(tǒng)計(jì)量,基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-descripive (2)選擇將參加計(jì)算的數(shù)值型變量名到variables框。 僅適用于數(shù)值型變量 分析比較男生和女生的學(xué)習(xí)成績(jī) 比較集中趨勢(shì) 比較離散趨勢(shì) 比較偏斜程度 比較陡峭程度 實(shí)現(xiàn)方式:數(shù)據(jù)拆分,其他功能 數(shù)據(jù)標(biāo)準(zhǔn)化處理 新變量的均值為0,標(biāo)準(zhǔn)差為1; 小于0表示在平均水平下,大于0反之. 正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布(68%,

7、95%,99%) save standardized values as variables選項(xiàng) 將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變量中. 數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例 快速找到移動(dòng)話費(fèi)出眾的客戶 網(wǎng)通集團(tuán)企業(yè)效益評(píng)價(jià),計(jì)算描述統(tǒng)計(jì)量,探索性描述分析,目的:在未知數(shù)據(jù)分布特點(diǎn)情況下,通過(guò)計(jì)算詳盡描述統(tǒng)計(jì)量,輔助全面的統(tǒng)計(jì)圖,認(rèn)識(shí)數(shù)據(jù)分布。 基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-Explore (2)選擇將參加計(jì)算的數(shù)值型變量名到Dependent list框。 (3)進(jìn)行分組描述分析時(shí),將分組變量選入Fact list框 描述統(tǒng)

8、計(jì)量: M統(tǒng)計(jì)量:集中趨勢(shì)的估計(jì)值,不受極端值影響。用于判斷有無(wú)異常值。,探索性描述分析,相關(guān)圖形 箱線圖 莖葉圖 直方圖 正態(tài)分布圖:檢驗(yàn)變量是否符合正態(tài)分布 方差齊性檢驗(yàn):各組離散程度是否相同 H0:方差相等 舉例:兩班學(xué)生成績(jī)分布情況,離散程度是否相同。,交叉分組下的頻數(shù)分析,目的 通過(guò)了解不同變量在不同水平下的數(shù)據(jù)分布情況 ,判斷水平對(duì)變量是否有影響 例:女生的學(xué)習(xí)成績(jī)比男生好嗎?(兩變量) 不同專業(yè)的女生學(xué)習(xí)成績(jī)都比男生好嗎? (三變量) 分析的主要步驟 產(chǎn)生交叉列聯(lián)表 分析列聯(lián)表中變量間的關(guān)系 針對(duì)定類數(shù)據(jù)和定序數(shù)據(jù)的頻數(shù)分析,產(chǎn)生交叉列聯(lián)表,什么是列聯(lián)表 多個(gè)變量在不同取值下的數(shù)

9、據(jù)分布頻數(shù)表,列變量,行變量,工商管理,控制變量,頻數(shù),產(chǎn)生交叉列聯(lián)表,基本操作步驟 (1)菜單選項(xiàng): analyze-descriptive statistics- crosstabs (2)選擇一個(gè)變量作為行變量到row框. (3)選擇一個(gè)變量作為列變量到column框. (4)可選一個(gè)或多個(gè)變量作為控制變量到layer框. (5)是否顯示各分組的條圖(display clustered bar charts ),產(chǎn)生交叉列聯(lián)表,定距數(shù)據(jù)可做適當(dāng)分組后再產(chǎn)生列聯(lián)表 僅利用頻數(shù),信息利用不充分 進(jìn)一步計(jì)算 cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比. row:行百分比(Row pct)

10、; column:列百分比(Col pct); total:總百分比(Tot pct);,分析列聯(lián)表中變量間的關(guān)系,目的: 通過(guò)列聯(lián)表分析,檢驗(yàn)行列變量之間是否獨(dú)立。 方法: 卡方檢驗(yàn):對(duì)品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量(這里兩變量均為定類數(shù)據(jù)或定序數(shù)據(jù)),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗(yàn)基本步驟 (1)H0:行列變量之間無(wú)關(guān)聯(lián)或相互獨(dú)立 (2)構(gòu)造卡方統(tǒng)計(jì)量 統(tǒng)計(jì)量服從(r-1)*(c-1)個(gè)自由度的卡方分布 count:觀察(實(shí)際)頻數(shù) expected count:期望頻數(shù) (期望頻數(shù)反映的是H0成立情況下的數(shù)據(jù)分布特征),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗(yàn)基本步驟 (3)計(jì)算卡方統(tǒng)計(jì)量的值,

11、并得到該統(tǒng)計(jì)量值的概率P值 (4)決策。概率P與顯著性水平比較,小于等于則拒絕H0,否則不能拒絕 實(shí)現(xiàn)步驟 statistics選項(xiàng) cells選項(xiàng),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗(yàn)的要求: 一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過(guò)20%,否則會(huì)夸大卡方值,容易得出拒絕結(jié)論,可以采用精確檢驗(yàn)。 卡方值會(huì)受樣本數(shù)的影響 行列變量相關(guān)性的其他測(cè)度指標(biāo) Nominal: phi系數(shù):在22列聯(lián)表中 ,通常-1,1,負(fù)號(hào)無(wú)實(shí)際意義 列聯(lián)C系數(shù)(contingency coefficient), 通常為0,1) V系數(shù) 0,1 值越大表示行列變量的相關(guān)性越大,分析列聯(lián)表中變量間的關(guān)系,Ordina

12、l 反映定序變量一致性指標(biāo) 行變量等級(jí)越高,列變量等級(jí)也越高或越低一致性高 行變量等級(jí)越高,列變量等級(jí)不定不一致 指標(biāo)絕對(duì)值越大越相關(guān),越接近0越無(wú)關(guān),定序變量一致性檢驗(yàn),年齡與工資收入交叉列聯(lián)表 低 中 高 青 400 0 0 中 0 500 0 老0 0 600 低 中 高 青 0 0 500 中 0 6000 老 400 0 0,一致,一致,應(yīng)用舉例,不同行業(yè)大客戶的價(jià)值一致嗎? 受教育程度越高通信支出比例越高嗎? 離網(wǎng)客戶和在網(wǎng)客戶的通話類型結(jié)構(gòu)一致嗎?,多選項(xiàng)分析,什么是多選項(xiàng)問(wèn)題? (1)即:在回答某些問(wèn)題時(shí),答案在兩個(gè)以上 例如:請(qǐng)問(wèn)您平時(shí)主要的休閑娛樂(lè)方式是: a.看電視、聽廣

13、播b.玩游戲c.體育運(yùn)動(dòng)d.逛街購(gòu)物e.經(jīng)常去港澳游玩f.看書學(xué)習(xí) g.喝酒聊天h.工作太忙,沒(méi)時(shí)間休閑娛樂(lè) 又如:您經(jīng)常瀏覽的網(wǎng)站?在下列品牌中您信任哪些品牌? (2)多選項(xiàng)問(wèn)題不能直接處理。因?yàn)镾PSS中的一個(gè)變量對(duì)每一個(gè)答案只能取一個(gè)值。,多選項(xiàng)分析,多選項(xiàng)問(wèn)題的處理方法 (1)思路: 將一個(gè)問(wèn)題定義成幾個(gè)變量,用這幾個(gè)變量來(lái)描述該問(wèn)題的幾個(gè)可能被選擇的答案。 分別做頻數(shù)分析或交叉分組下的頻數(shù)分析 (2)方法: 多選項(xiàng)二分法(multiple dichotomies method)和多選項(xiàng)分類法(multiple category method) 普通頻數(shù)分析和交叉分組下的頻數(shù)分析,多選

14、項(xiàng)分析,多選項(xiàng)二分法 將每個(gè)答案作為一個(gè)變量,每個(gè)變量只有兩個(gè)取值(0或1)。 例如:,多選項(xiàng)分析,多選項(xiàng)分類法: 預(yù)先估計(jì)多選項(xiàng)問(wèn)題可能被選擇的最多答案數(shù).為每個(gè)答案建立一個(gè)變量,取值為多選項(xiàng)問(wèn)題的可選答案. 例如:最多可選三個(gè)學(xué)校,多選項(xiàng)分析,多選項(xiàng)分析的基本思路 定義多選項(xiàng)變量集 多選項(xiàng)頻數(shù)分析 多選項(xiàng)交叉分組下的頻數(shù)分析,多選項(xiàng)分析,定義多選項(xiàng)變量集 目的:將已分解的變量定義為一個(gè)集合,便于進(jìn)行多選項(xiàng)分析 菜單選項(xiàng):analyze-multiple response-define sets 從原變量中選取被分解的變量(數(shù)值型)到variables in sets框 指定被分解的變量是按

15、多選項(xiàng)二分法(dichotomies)分解還是按多選項(xiàng)分類法(categories)分解的. 為變量集命名。系統(tǒng)自動(dòng)在名字前加字符$.,多選項(xiàng)分析,多選項(xiàng)頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-frequencies 選擇待分析的多選項(xiàng)變量集到tables for 框。 缺失數(shù)據(jù)處理:只要有一個(gè)變量含有缺失值就將該個(gè)案剔除 exclude cases list wise within dichotomies:只用于二分變量多項(xiàng)選擇的分析。 exclude cases list wise within categories:只用于分類變量多項(xiàng)選擇的分析。,多選項(xiàng)分

16、析,多選項(xiàng)交叉分析下的頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-crosstabs 選擇行變量并定義取值范圍 選擇列變量并定義取值范圍 選擇控制變量并定義取值范圍 其他選項(xiàng) 常用分析指標(biāo): 應(yīng)答人數(shù)百分比(percent of cases):選擇該項(xiàng)的人占總?cè)藬?shù)的比例(較大) 應(yīng)答次數(shù)百分比(percent of responses):選擇該項(xiàng)的次數(shù)占總應(yīng)答次數(shù)的比例(較?。?多選項(xiàng)分析,多選項(xiàng)分析實(shí)例 在某次市場(chǎng)調(diào)查中收集了北京、上海和廣州三個(gè)城市的受訪者對(duì)幾種常見(jiàn)飲料的喜好情況,可選的飲料有茶、牛奶、咖啡、果汁、礦泉水。(數(shù)據(jù)是從原始數(shù)據(jù)庫(kù)中抽出的一小部分資料

17、),作以下分析: 采用二分法組織數(shù)據(jù) 受訪人群中最受歡迎的飲料是哪種? 男、女喜愛(ài)的飲料有無(wú)差異? 三個(gè)城市的人群對(duì)飲料的喜好有無(wú)差異? 不同學(xué)歷的消費(fèi)者休閑方式有無(wú)差異?,統(tǒng)計(jì)圖形的種類及用途,用于顯示頻數(shù)分布: ( Line和Area也能作,但不很適合) Bar( 不僅僅用于) Pie: Histogram: Boxplot: Error Bar:顯示總體分布 用于判斷數(shù)據(jù)分布 P-P圖 Q-Q圖,統(tǒng)計(jì)圖形的種類及用途,用于時(shí)間序列 Line Area Bar: High-low:類似K線圖 用于觀察數(shù)量變量之間關(guān)系 scatter,統(tǒng)計(jì)圖形的種類及用途,用于數(shù)據(jù)分析 Pareto分析重要

18、因素 Control分析數(shù)據(jù)變異 統(tǒng)計(jì)圖形在SPSS中分為一般統(tǒng)計(jì)圖和交互式統(tǒng)計(jì)圖,條形圖,其他匯總方式的條圖:各科成績(jī)的均值、各省份移動(dòng)收入比例 復(fù)式條圖和堆積條圖:兩班男女生成績(jī)均值,統(tǒng)計(jì)圖的編輯,雙擊圖形進(jìn)入編輯狀態(tài) 圖形的轉(zhuǎn)換:Gallery- 條圖、線圖、面積圖和餅圖之間可互相轉(zhuǎn)換 散點(diǎn)圖和直方圖之間可互相轉(zhuǎn)換 2、圖形的設(shè)置:Chart-options 適用于復(fù)式和堆積圖,統(tǒng)計(jì)圖的編輯,3、圖形坐標(biāo)設(shè)置Chart-Axis Scale Axis:條圖、線圖、面積圖中的縱軸,散點(diǎn)圖、直方圖中的縱軸和橫軸 Categeries:條圖、線圖、面積圖中的橫軸 4、圖形格式設(shè)置Fomat- 注:需選中相應(yīng)的元素,散點(diǎn)圖,1、簡(jiǎn)單散點(diǎn)圖:用于觀察兩變量之間關(guān)系 收入增長(zhǎng)率與業(yè)務(wù)滲透率、GDP之間關(guān)系 2、矩陣散點(diǎn)圖:用于觀察多變量之間的兩兩關(guān)系 n X n矩

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論