《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程》課件.ppt_第1頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程》課件.ppt_第2頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程》課件.ppt_第3頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程》課件.ppt_第4頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程》課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)數(shù)據(jù)分析的基礎(chǔ)課程是基于SPSS和Excel的調(diào)查數(shù)據(jù)分析。第7章描述了統(tǒng)計(jì)分析。本章內(nèi)容:7.1用SPSS對(duì)定量數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析;7.2用SPSS對(duì)多組均值進(jìn)行比較;7.3用電子表格對(duì)定量數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析;7.4利用電子表格找出量表的平均值并進(jìn)行排序;問(wèn)卷收集后,對(duì)于數(shù)字?jǐn)?shù)據(jù)(定量數(shù)據(jù)),通常用均值和中值等統(tǒng)計(jì)量來(lái)描述其集中度趨勢(shì),也用標(biāo)準(zhǔn)差、最小值、最大值和極值差等統(tǒng)計(jì)量來(lái)描述其離差程度。最常用的描述性統(tǒng)計(jì)是均值和標(biāo)準(zhǔn)差。描述統(tǒng)計(jì)數(shù)據(jù)(集中趨勢(shì):平均值)。描述數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)數(shù)據(jù)主要包括平均值和中位數(shù)。平均值:樣本值的算術(shù)平均值。均值是一種常用的統(tǒng)計(jì)數(shù)據(jù),用于衡量數(shù)據(jù)集的

2、趨勢(shì)。它經(jīng)常用于參數(shù)估計(jì)和假設(shè)檢驗(yàn)。假設(shè)一組樣本數(shù)據(jù)為n,樣本量(樣本數(shù)據(jù)數(shù))為n,則樣本均值用(發(fā)音為-bar)表示,計(jì)算公式為:描述統(tǒng)計(jì)量(集中趨勢(shì):中值),描述數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)量主要包括均值、中值等。中位數(shù):排序后一組數(shù)據(jù)中間位置的數(shù)字。中位數(shù)將所有數(shù)據(jù)分為兩部分,每部分包含50%的數(shù)據(jù),其中一部分大于中位數(shù),另一部分小于中位數(shù)。中值代表數(shù)據(jù)的集中趨勢(shì),其值在中間位置,不易受極值的影響,因此與平均值相比稱(chēng)為穩(wěn)健。差異的度量:分散度。論語(yǔ)中有一句話(huà):“不要喪偶,而要忍受不平等?!边@意味著不害怕財(cái)富減少,而是害怕分配不公,這使得貧富差距過(guò)大。富人和窮人的數(shù)量由集中趨勢(shì)統(tǒng)計(jì)來(lái)描述,而他們是否

3、“平等”則由離散程度統(tǒng)計(jì)來(lái)描述(描述數(shù)據(jù)傳播,即衡量集中和分散的程度)。一般來(lái)說(shuō),數(shù)據(jù)越分散,分散統(tǒng)計(jì)的價(jià)值就越大。描述統(tǒng)計(jì)數(shù)據(jù)(離差度:極值范圍)和范圍:極值之間的差異。也就是說(shuō),一組數(shù)據(jù)的極值(最大值)和極值(最小值)之間的差值,也稱(chēng)為總距離。因?yàn)闃O值范圍只使用一組數(shù)據(jù)兩端的信息,所以很容易受到極值的影響,不能完全反映差異。描述統(tǒng)計(jì)數(shù)據(jù)(離差度:標(biāo)準(zhǔn)差和方差)和標(biāo)準(zhǔn)差:樣本中每個(gè)值到平均值的平均距離。標(biāo)準(zhǔn)差實(shí)際上是方差的平方根。方差:從每個(gè)點(diǎn)到平均值的距離的平方的平均值。在實(shí)際應(yīng)用中,方差不像標(biāo)準(zhǔn)差那樣常見(jiàn),因?yàn)樗煌跀?shù)據(jù)維度。兩個(gè)相似的班級(jí)(一班和二班)在同一個(gè)班級(jí)上課,但是兩個(gè)班級(jí)的

4、平均分?jǐn)?shù)和標(biāo)準(zhǔn)偏差是不同的,因?yàn)閮蓚€(gè)老師的評(píng)分標(biāo)準(zhǔn)不同(第7章,同一個(gè)班級(jí)兩個(gè)班級(jí)的分?jǐn)?shù)。sav)。一類(lèi)分?jǐn)?shù)的均值和標(biāo)準(zhǔn)差分別為78.53和9.43,二類(lèi)分?jǐn)?shù)的均值和標(biāo)準(zhǔn)差分別為70.19和7.00。得到90分的張穎比得到82分的劉小萍好嗎?數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù),怎么可能比較合理?雖然具有不同均值和標(biāo)準(zhǔn)差的數(shù)據(jù)不能直接比較,但可以將其標(biāo)準(zhǔn)化,然后將標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行比較。一種標(biāo)準(zhǔn)化的方法是將原始觀察值(也稱(chēng)為得分)和平均值之間的差值除以標(biāo)準(zhǔn)差;獲得的測(cè)量值稱(chēng)為標(biāo)準(zhǔn)分?jǐn)?shù):(x-m)/s(其中m和s是平均值和標(biāo)準(zhǔn)偏差),數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù)在SPSS中獲得。如果需要分組(這里是按類(lèi)分組),首先使用菜單“數(shù)據(jù)”-

5、“拆分文件”。根據(jù)每個(gè)類(lèi)別將數(shù)據(jù)文件分開(kāi),并使用菜單“分析”、“描述性統(tǒng)計(jì)”和“描述性”中的“將標(biāo)準(zhǔn)化值保存為變量”選項(xiàng);結(jié)果顯示在數(shù)據(jù)文件中以“z”開(kāi)頭的變量中。7.1用SPSS對(duì)量化數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,案例7-1護(hù)士工作滿(mǎn)意度調(diào)查分析。為了了解護(hù)士對(duì)護(hù)理工作的滿(mǎn)意度“第七章護(hù)士工作滿(mǎn)意度調(diào)查”的數(shù)據(jù)文件。第7章護(hù)士工作滿(mǎn)意度調(diào)查。xls”包含100名護(hù)士對(duì)其工作、工資和晉升機(jī)會(huì)的滿(mǎn)意度。這三個(gè)方面的得分從0到100,得分越高,滿(mǎn)意度越高。此外,根據(jù)護(hù)士所在醫(yī)院的類(lèi)型,調(diào)查數(shù)據(jù)可分為三類(lèi):私立醫(yī)院、公立醫(yī)院和大學(xué)醫(yī)院。(1)根據(jù)整體數(shù)據(jù)和三個(gè)方面的滿(mǎn)意度,判斷哪個(gè)方面對(duì)護(hù)士最滿(mǎn)意。哪個(gè)方

6、面最不令人滿(mǎn)意?(2)根據(jù)離差度(標(biāo)準(zhǔn)差、最小值、最大值、極值差)的描述,判斷哪個(gè)方面的護(hù)士滿(mǎn)意度差異最大。(3)從醫(yī)院類(lèi)型的數(shù)據(jù)中可以了解到什么?在滿(mǎn)意度的三個(gè)方面,有哪種類(lèi)型的醫(yī)院比其他醫(yī)院更好?7.1用SPSS對(duì)定量數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,例7-2用SPSS (1)和(2)菜單實(shí)現(xiàn)例7-1中的問(wèn)題:“分析”、“描述性統(tǒng)計(jì)”和“描述性”定量變量(數(shù)字?jǐn)?shù)據(jù)):工作、工資、晉升機(jī)會(huì)表72護(hù)士在三個(gè)方面的滿(mǎn)意度,例7-2用SPSS描述和分析定量數(shù)據(jù),例7-2用SPSS實(shí)現(xiàn)例7-1中的問(wèn)題(1)和(2),用表72中的平均值作為柱狀圖。 7.2利用SPSS實(shí)現(xiàn)多組均值的比較,例7-4利用SPSS (

7、3)菜單實(shí)現(xiàn)例7-1中的問(wèn)題:“分析”-“比較均值”-“均值”分析變量(數(shù)值數(shù)據(jù)):工作分組變量、工資和晉升機(jī)會(huì)(分類(lèi)數(shù)據(jù)):醫(yī)院類(lèi)型表75不同醫(yī)院類(lèi)型護(hù)士對(duì)工作、工資和晉升機(jī)會(huì)的滿(mǎn)意度,例7-2利用SPSS比較多組均值,利用SPSS實(shí)現(xiàn)例7-1中的問(wèn)題。 (3)用表75中的平均值作為柱狀圖,用SPSS實(shí)現(xiàn)有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析。在1991年的美國(guó)社會(huì)調(diào)查中,設(shè)計(jì)了一個(gè)問(wèn)題。讓受訪者對(duì)“服從”、“受歡迎”、“為自己著想”、“工作狂”和“幫助他人”的重要性進(jìn)行排名,從中我們可以分析美國(guó)人的思維角度和趨勢(shì),進(jìn)而分析美國(guó)人的社會(huì)價(jià)值觀和人生觀。其中,1代表最重要,2代表第二重要,3代表第三最重要,

8、4代表第四最重要,5代表最不重要。7.2.3利用SPSS對(duì)有序數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,并對(duì)服從、受歡迎、自我考慮、努力工作和樂(lè)于助人的重要性進(jìn)行排序。將P199的調(diào)查問(wèn)卷改為類(lèi)似P60的排名問(wèn)題。你認(rèn)為以下五個(gè)方面的重要性順序是什么?請(qǐng)按排名順序填寫(xiě)1、2、3、4和5。(1是最重要的,2是第二重要的,3是第三最重要的,4是第四最重要的,5是最不重要的)服從受歡迎程度,為自己著想,努力工作,幫助別人,7.2.3利用SPSS實(shí)現(xiàn)有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析,方法1:利用一維頻率分析法獲得被調(diào)查者選擇的每個(gè)答案的百分比(如表7-6所示)。并畫(huà)一個(gè)百分比柱形圖(如圖7-4),表7-6,一維頻率分析五個(gè)方面

9、的重要性,7.2.3,用SPSS對(duì)有序數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,方法2:用描述性統(tǒng)計(jì)分析方法,得到被調(diào)查者選擇的每個(gè)答案的平均值,然后比較平均值,得到五個(gè)方面的重要性順序。表7-8按排序,五個(gè)方面重要性的排序結(jié)果較好。7.2.3有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析通過(guò)SPSS實(shí)現(xiàn)。方法二:采用描述性統(tǒng)計(jì)分析方法,得出被調(diào)查者選擇的每個(gè)答案的平均值,然后將平均值進(jìn)行比較,從而得出五個(gè)方面的重要性順序。最好用柱形圖來(lái)表示柱形圖的五個(gè)方面的重要性。7.2.3利用SPSS實(shí)現(xiàn)有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析,通過(guò)設(shè)置“數(shù)值軸”的“標(biāo)度”標(biāo)簽中的選項(xiàng),將五個(gè)方面重要性的均值線(xiàn)圖(P201)改為右圖(因?yàn)榫翟酱螅匾栽叫?

10、。,7.2.3利用SPSS實(shí)現(xiàn)有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析,考慮是否可以用描述性統(tǒng)計(jì)分析方法來(lái)解決問(wèn)題(2)第4章實(shí)踐2?P129: (2)你對(duì)問(wèn)題2中每個(gè)國(guó)家的結(jié)論是什么?總的來(lái)說(shuō),你覺(jué)得哪個(gè)國(guó)家最好?哪個(gè)國(guó)家總體感覺(jué)最差?7.2.3利用SPSS實(shí)現(xiàn)有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析,利用實(shí)例7-7分析不同性別的被調(diào)查者在五個(gè)方面的重要性順序是否相同。菜單分析-比較表示-表示表7-11顯示了按某一類(lèi)型(男性)的五個(gè)方面重要性的排名結(jié)果,7.2.3使用SPSS實(shí)現(xiàn)了對(duì)排序數(shù)據(jù)的描述性統(tǒng)計(jì)分析,實(shí)例7-7分析了不同性別的被調(diào)查者是否知道這五個(gè)方面在同一順序中的重要性。最好用柱狀圖來(lái)表示不同性別的受訪者對(duì)五個(gè)方

11、面重要性的理解。7.2.3有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析用SPSS實(shí)現(xiàn)。不同性別的受訪者對(duì)五個(gè)方面重要性的理解的平均線(xiàn)圖(P203)被更改為正確的數(shù)字(因?yàn)槠骄翟酱螅匾栽降?。7.2.3利用SPSS對(duì)有序數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,實(shí)例7-8分析不同種族的被調(diào)查者對(duì)五個(gè)方面重要性的理解順序是否相同。菜單“分析”“比較”指的是表7-12不同種族的被調(diào)查者在五個(gè)方面重要性的排名結(jié)果按照一定類(lèi)型(白色)的排名順序更好的顯示出來(lái),7.2.3有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析通過(guò)SPSS實(shí)現(xiàn),實(shí)例7-8分析不同種族的被調(diào)查者在五個(gè)方面重要性的排序是否相同。最好使用柱狀圖來(lái)表示不同種族的受訪者對(duì)這五個(gè)方面重要性的理解。

12、7.2.3有序數(shù)據(jù)的描述性統(tǒng)計(jì)分析用SPSS實(shí)現(xiàn)。不同種族的受訪者對(duì)五個(gè)方面重要性的理解的平均線(xiàn)圖(P204)更改為下圖(因?yàn)槠骄翟酱螅匾栽降?。7.3使用電子表格描述和分析定量數(shù)據(jù)。例7-9有一家美國(guó)銀行1969-1971年474名雇員的數(shù)據(jù)。這474名銀行員工的數(shù)據(jù)可以進(jìn)行統(tǒng)計(jì)分析。(1)這家銀行有多少男女員工?百分比是多少?(2)該行目前的最高、最低和平均年薪是多少?每年應(yīng)該付給員工多少工資?這家銀行員工的平均年薪是否高于當(dāng)時(shí)的平均年薪3萬(wàn)美元?(3)不同職位的男女雇員人數(shù)是多少?職位和性別之間有關(guān)聯(lián)嗎?(4)不同性別員工的平均年薪是多少?男性員工的平均年薪是否高于女性員工?(5)

13、不同職位員工的平均年薪是多少?有顯著的區(qū)別嗎?(6)建立就業(yè)起薪、以往工作經(jīng)歷、工作時(shí)間、受教育年限等的線(xiàn)性回歸模型。作為自變量,當(dāng)前年薪作為因變量。7.3用Excel描述和統(tǒng)計(jì)分析定量數(shù)據(jù),用Excel描述和統(tǒng)計(jì)分析工具問(wèn)“該行目前的最高年薪、最低年薪和平均年薪是多少?每年應(yīng)該付給員工多少工資?”菜單:“工具”-“數(shù)據(jù)分析”,選擇“描述統(tǒng)計(jì)”表7-14銀行員工當(dāng)前年薪,7.3.2在Excel中將分類(lèi)數(shù)據(jù)轉(zhuǎn)換為組中值。許多價(jià)值觀與收入、年齡、消費(fèi)等有關(guān)。在問(wèn)卷中不會(huì)要求被調(diào)查者直接填寫(xiě)他們的價(jià)值觀,因?yàn)樗鼈兩婕皞€(gè)人隱私或?yàn)榱吮徽{(diào)查者的方便。然而,在問(wèn)卷收集之后,統(tǒng)計(jì)分析師有時(shí)想要計(jì)算平均值。7

14、.3.2在Excel中將分類(lèi)數(shù)據(jù)轉(zhuǎn)換為組中值,并在示例7-10中找到平均收入。請(qǐng)?jiān)儐?wèn)你全家的月收入:1。5000元以下,2。5000-10000元,3。1萬(wàn)-1.5萬(wàn)元。15000-20000元,5。對(duì)于20,000元以上的人群,中位數(shù)算法是問(wèn)你全家的月收入:1。2500元、7500元、12500元、17500元和22500元。,7.3.2在Excel中將分類(lèi)數(shù)據(jù)轉(zhuǎn)換為組中值,并在示例7-10中找到平均收入。我想問(wèn)一下你全家的月收入:1。不到5000元,2。5000-10000元,3。1萬(wàn)-1.5萬(wàn)元。15000-20000元,5。20,000元或以上是由IF函數(shù)轉(zhuǎn)換而來(lái)的:=IF (B2=1

15、,2500,IF (B2=2,7500,IF=3,12500,)我想問(wèn)一下你全家的月收入情況:1。2500元。7500元3。12500元4。17500元5。22500元。7.4使用電子表格找出該量表的平均值,并對(duì)其進(jìn)行排名。示例7-11“數(shù)碼相機(jī)注重屬性”問(wèn)卷處理。Q23購(gòu)買(mǎi)數(shù)碼相機(jī)時(shí),請(qǐng)檢查以下屬性的重要性。注意:量表中答案的順序和強(qiáng)度結(jié)構(gòu),中性類(lèi)別在中間最好(p33)。7.4使用電子表格找出該量表的平均值,并對(duì)其進(jìn)行排名。示例7-11“數(shù)碼相機(jī)注重屬性”問(wèn)卷處理。問(wèn)卷收集后,問(wèn)卷調(diào)查者還逐項(xiàng)計(jì)算平均值,然后對(duì)平均值進(jìn)行排序,以判斷受訪者對(duì)哪些屬性進(jìn)行了評(píng)價(jià)。本文介紹了三種求各屬性(尺度)平

16、均值的方法。方法1:使用平均值函數(shù)計(jì)算量表的平均值;方法2:使用描述性統(tǒng)計(jì)分析工具,找出量表的均值;方法3:使用數(shù)據(jù)透視表來(lái)尋找標(biāo)尺的平均值。7.4使用電子表格查找量表的平均值并對(duì)其進(jìn)行排名,示例7-11“數(shù)碼相機(jī)注重屬性”問(wèn)卷處理。表7-15顯示了根據(jù)排名順序?qū)?shù)碼相機(jī)進(jìn)行面向?qū)傩缘呐琶慕Y(jié)果;7.4使用電子表格來(lái)找到該量表的平均值并對(duì)其進(jìn)行排名;第7-12節(jié)分析了男性和女性受訪者對(duì)“面向?qū)傩缘臄?shù)碼相機(jī)”的排名是否相同。(推薦“使用透視表”)表7-16根據(jù)某種類(lèi)型(男性)的排名順序,男性、女性和所有受訪者對(duì)數(shù)碼相機(jī)屬性的排名結(jié)果顯示得更好。練習(xí)題(1),數(shù)據(jù)文件:“第7章銀行員工數(shù)據(jù)(中文)。sav”或“第7章銀行員工數(shù)據(jù)(中文)。xls?!?關(guān)于每個(gè)變量的名稱(chēng)和屬性,請(qǐng)參考教材第7.3節(jié)的P204。)需要應(yīng)用描述性統(tǒng)計(jì)分析方法來(lái)回答以下問(wèn)題:(1)不同性別員工的平均年薪是多少?男性員工的平均年薪是否高于女性員工?(2)不同職位員工的平均年薪是多少?從數(shù)字來(lái)看,哪個(gè)職位的平均年薪最高?請(qǐng)參考實(shí)驗(yàn)7.1練習(xí)題(4),以及“移動(dòng)營(yíng)銷(xiāo)組合”問(wèn)卷的簡(jiǎn)化版。請(qǐng)參考課本第7章“第7章移動(dòng)營(yíng)銷(xiāo)組合調(diào)查數(shù)據(jù)”中附錄P223(或?qū)嶒?yàn)7.4)的數(shù)據(jù)文件。sav”或“第7章移動(dòng)營(yíng)銷(xiāo)組合調(diào)查數(shù)據(jù)”。xls?!币髮?duì)調(diào)查數(shù)據(jù)進(jìn)行基本的統(tǒng)計(jì)分析。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論