數(shù)據(jù)分析方法與技術(shù)-描述性方法統(tǒng)計實驗報告_第1頁
數(shù)據(jù)分析方法與技術(shù)-描述性方法統(tǒng)計實驗報告_第2頁
數(shù)據(jù)分析方法與技術(shù)-描述性方法統(tǒng)計實驗報告_第3頁
數(shù)據(jù)分析方法與技術(shù)-描述性方法統(tǒng)計實驗報告_第4頁
數(shù)據(jù)分析方法與技術(shù)-描述性方法統(tǒng)計實驗報告_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、電子科技大學(xué)政治與公共管理學(xué)院本科教學(xué)實驗報告(實驗)課程名稱:數(shù)據(jù)分析技術(shù)系列實驗電子科技大學(xué)教務(wù)處制表電 子 科 技 大 學(xué)實 驗 報 告學(xué)生姓名: 學(xué) 號: 指導(dǎo)教師: 一、實驗室名稱: 電子政務(wù)可視化實驗室二、實驗項目名稱:描述性統(tǒng)計方法三、實驗原理通過調(diào)查或觀察,采集到樣本以后,常用一些統(tǒng)計量描述這些數(shù)據(jù)的分布狀態(tài),并通過這種認(rèn)識,對數(shù)據(jù)的總體特征進(jìn)行總結(jié)和歸納。數(shù)據(jù)的分布狀態(tài)常通過數(shù)據(jù)的進(jìn)行描寫。本實驗主要對數(shù)據(jù)統(tǒng)計分析的最基礎(chǔ)分析描述性統(tǒng)計分析進(jìn)行實驗,主要包括集中趨勢和離中趨勢分析,其主要算法原理如下:1. 描述集中趨勢的統(tǒng)計(1) 算術(shù)平均值(Mean):樣本數(shù)據(jù)的總和除以樣

2、本數(shù)據(jù)的個數(shù)即是算術(shù)平均值。(2) 中位數(shù)(Median,Me)首先將樣本數(shù)據(jù)(假設(shè)有n個數(shù))按升序或降序排列,如果 n 為奇數(shù),則數(shù)列中間的數(shù)值為中位數(shù);如果n為偶數(shù),則中位數(shù)為其中兩數(shù)值的均值。 (3) 眾數(shù)(Mode,Mo)樣本數(shù)據(jù)中出現(xiàn)頻數(shù)(次數(shù))最多的那個數(shù)稱為眾數(shù)。眾數(shù)不易確定,與中位數(shù)一樣,它不受極值影響。但有時會出現(xiàn)兩個甚至多個眾數(shù),有時又沒有眾數(shù)。所以,眾數(shù)的使用受到嚴(yán)格限制。 (4) 幾何平均數(shù)(Geometric Mean)假定銀行每年本利(本金加利率)為 X1 有 f1 年,年本利為 X2 有f2 年,銀行年本利為X3 有 f3 年, ,年本利為Xn 有 fn 年,則n

3、年銀行平均本利為G,銀行平均年利率G1。 (5) 四分位數(shù)(Quartiles)最低數(shù)與中位數(shù)之間的中位數(shù)是25分位數(shù),原中位數(shù)與最高數(shù)之間的中位數(shù)是75分位數(shù)。類似集中趨勢的度量還有十分位數(shù)和百分位數(shù)。2. 描述離中趨勢的統(tǒng)計量 (1) 極差(Range)是樣本數(shù)據(jù)中最大值與最小值的差值。極值舍棄了最大值與最小值之間的其他數(shù)據(jù)信息,僅僅依靠端點(diǎn)值來確定,因而穩(wěn)定性差。(2) 平均差(Average Difference)指各樣本數(shù)據(jù)與均值間差異絕對值的均值,也稱為平均絕對差。(3) n個數(shù)據(jù)的方差(Variance) 定義如下式,其中 為這 n 個數(shù)的均值。(4) 標(biāo)準(zhǔn)差 (Standard

4、 Deviation, Std Dev)是方差的算術(shù)平方根 。標(biāo)準(zhǔn)差是變量與算術(shù)平均數(shù)的平均離差,也是最常用的反映數(shù)據(jù)離中趨勢的統(tǒng)計量。但是,在抽樣調(diào)查中總體標(biāo)準(zhǔn)差往往未知,需要用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,總體方差的無偏估計量應(yīng)該為原方差乘以修正因子 (n / n1),并由此得到無偏標(biāo)準(zhǔn)差的估計量。四、實驗?zāi)康恼莆粘S玫拿枋鲂越y(tǒng)計方法的原理及操作,包括:算術(shù)平均值、中位數(shù)、眾數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、極差、平均差、方差、標(biāo)準(zhǔn)差等。五、實驗內(nèi)容及步驟使用“Analyze” 萊單中的“Descriptive Statistics”功能進(jìn)行描述性統(tǒng)計分析。1.頻數(shù)分析“Frequencies” 過

5、程通過單個數(shù)據(jù)的頻數(shù)分析(Frequencies )來達(dá)到整理數(shù)據(jù)的目的,利用該過程,得到一系列描述數(shù)據(jù)分布狀況的統(tǒng)計量。單擊“Frequencies ” 命令則可打開相應(yīng)對話框(如圖示),對對話框中各選項進(jìn)行設(shè)置。圖 1(1)對話框左側(cè)的源變量名列表框中,給出了當(dāng)前數(shù)據(jù)文件中所有變量的變量名。(2)“Variable(s)” 列表框,在變量名列表框中單擊變量名以后,單擊對話框中間的右箭頭按鈕,將變量名移到該列表框中。選定變量名以后,將對選定變量的數(shù)據(jù)進(jìn)行頻數(shù)分析。(3)選擇“Display frequency tables” 選項,將在瀏覽器中顯示頻數(shù)分布表,否則只顯示直方圖,不顯示頻數(shù)表。

6、(4)若單擊“Statistics” 按鈕,則打開統(tǒng)計量選擇對話框,如圖示,該對話框中各選項的意義如下。圖 2 “Percentile Values” 選項區(qū),可計算并顯示如下內(nèi)容: 四分位數(shù)(“ Quartiles” )、等間隔n 分位數(shù)(“Cut points for” 后文本框中輸入數(shù)值為 n ) 和不等間隔“ Percentile(s)” 分位數(shù) p %、q % ?!癙ercentile(s)” 選項后面的文本框中依次先后輸人數(shù)值p、q,單擊“Add” 按鈕,顯示在文本框中,利用“Change” 和“Remove” 按鈕,可以對文本框中列表進(jìn)行修改?!癈entral Tendency”

7、將顯示樣本的集中趨勢,如計算并顯示樣本數(shù)據(jù)的均值“Mean” ,數(shù)據(jù)的中位值“Median” ,數(shù)據(jù)的眾數(shù)“Mode” ,數(shù)據(jù)的累加和“sum” ?!癡alues are group midpoints”選項,表示假設(shè)數(shù)據(jù)已經(jīng)分組,數(shù)據(jù)取值為組中值,選擇此項,可計算百分位數(shù)統(tǒng)計和數(shù)據(jù)的中位數(shù)?!癉ispersion” 選項區(qū)將計算并顯示數(shù)據(jù)的離中趨勢,如計算并顯示標(biāo)準(zhǔn)差“std. Deviation” ,方差“Variance”,極差“Range”,最小值“Minimum” ,最大值“Maximum” ,和標(biāo)準(zhǔn)誤(平均值的標(biāo)準(zhǔn)誤差)“S.E. mean” ?!癉istribution”選項區(qū)設(shè)

8、置描述數(shù)據(jù)樣本分布的統(tǒng)計量。如顯示樣本數(shù)據(jù)的偏度“Skewness” 和偏度的標(biāo)準(zhǔn)誤差,樣本數(shù)據(jù)的峰度“Kurtosis” 和峰度的標(biāo)淮誤差。(5)“ Charts” 按鈕是圖形選擇對話框,如圖所示,各選項的意義如下。圖 3“Chart Type” 確定輸出圖形的類型。不生成和顯示圖形選擇“None” 單選項(默認(rèn)選項);生成和顯示條形圖(橫坐標(biāo)非等距坐標(biāo))選擇“Bar charts” ;生成和顯示餅圖選擇“Pie charts” ;生成和顯示直方圖(橫坐標(biāo)為等距坐標(biāo))則選擇“Histograms” 。若選擇“Histograms” 后,“Show normaI curve” 選項為可用,選擇

9、此項后,在生成和輸出直方圖時添加正態(tài)分布曲線。 若選擇“Bar charts ”或“Pie charts” 單選項,對話框底部“Chart Values” 選項區(qū)內(nèi)的選項為可用,該選頊要求確定生成圖形時所用的數(shù)據(jù)變量。若用不同取值的樣本數(shù)作為分類變量的度量,選“Frequencies” (默認(rèn)項);若用不同取值對應(yīng)樣本數(shù)占總樣本的百分?jǐn)?shù)作為分類變量度量,選用“Percentages” 選項。(6)“ Format” 是頻數(shù)分析表的輸出格式選擇對話框,如圖所示,各選項的意義如下。圖 4“Order by” 選項區(qū)設(shè)置表中數(shù)據(jù)的排列、輸出順序。若按照變量值的大小做升序排列(默認(rèn)選項),選“Asce

10、nding values” 單選項;若按照變量值的大小做降序排列,選“Descnding values” 單選項;按照變量值出現(xiàn)的頻數(shù)做升序排列、輸出,選“cIldlng cllun”單選項;按照變量值出現(xiàn)的頻數(shù)做降序排列、輸出,選“D岱ccnding counts” 單選項?!癕ultiple Variables” 選項區(qū)是多變量的表格顯示格式。若選擇“Compare Variables” (默認(rèn)選項),將對應(yīng)于各變量的統(tǒng)計量顯示在一張單獨(dú)的表中。若選擇“Organize output by Variables” 單選項,將對應(yīng)于各變量的統(tǒng)計量分別列表顯示?!癝uppress tables

11、with many categories” 選項是限定頻數(shù)表輸出的范圍,若選擇此項,在后面的文本框中輸入數(shù)值 n ,即輸出數(shù)據(jù)的組數(shù)不得大于窗口中輸入的數(shù)值。默認(rèn)時該數(shù)值為10 。2. 描述性統(tǒng)計分析在“Analyze”子菜單中單擊“Descriptives Statistics”命令(如圖示),打開“Descriptives ”對話框(如圖55所示),可見如下選擇項。圖 5圖 6 從左邊的源變量中選擇合適變量,用箭頭按鈕將其移到“Variables”選項框。對選項框中所有被選中變量數(shù)據(jù)的分布特征進(jìn)行描述?!癝ave standardized values as variables” 選項,是

12、將被選中變量的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理( ),變量名為原變量名前添加字母Z 。新生成的變量和數(shù)據(jù)保存到當(dāng)前數(shù)據(jù)文件內(nèi),并顯示在數(shù)據(jù)編輯器最后一列。 若單擊“Options” 按鈕打開對話框,如右圖所示,各選項意義如下。 “Mean” 選項、“Sum”選項、“Dispersion” 選項區(qū)內(nèi)的選項和“Distribution” 選項區(qū)內(nèi)選項意義與前面頻數(shù)分析中“Statistics” 對話框的內(nèi)容相同。“Display Order” 選項區(qū),用來設(shè)置描述表格中數(shù)據(jù)的顯示順序?!癡ariable list”單選項為默認(rèn)選項,是按照數(shù)據(jù)文件中變量排列的先后順序顯示表格中的描述統(tǒng)計量;“ Alphabeti

13、c” 單選項,按照變量名的字母順序顯示描述統(tǒng)計量;“ Ascending means 單選項,是按照數(shù)據(jù)均值的升序顯示描述統(tǒng)計量;“ Descendi g means” 單選項,則按照數(shù)據(jù)均值的降序顯示描述統(tǒng)計量。六、實驗器材(設(shè)備、元器件):計算機(jī)、打印機(jī)、硒鼓、碳粉、紙張八、實驗數(shù)據(jù)及結(jié)果分析1. 頻數(shù)分析結(jié)果在數(shù)據(jù)編輯器中打開數(shù)據(jù)文件“Employee.sav” ,在“Frequencies” 對話框中的“Variables"選項框中輸人“jobcat” 變量名,單擊“Statistics” 按鈕,打開對話框,選擇全部選項,“Percentile Values” 選項區(qū)中選擇“

14、Percentile(s)” ,并在后面文本框中輸人數(shù)值10,20,25,30,40,50,60,70,75,80,85,90,95,其他對話框中的選項按默認(rèn)情況設(shè)置。設(shè)置完畢后,在“Frequencies” 對話框中單擊“oK” 按鈕,生成表格如表所示。該表為變量“jobcat” 數(shù)據(jù)的頻數(shù)分析表和數(shù)據(jù)統(tǒng)計量描述表。StatisticsEmployment CategoryNValid474Missing0Mean1.41Std. Error of Mean.036Median1.00Mode1Std. Deviation.773Variance.598Skewness1.456Std. E

15、rror of Skewness.112Kurtosis.268Std. Error of Kurtosis.224Range2Minimum1Maximum3Sum669Percentiles101.00201.00251.00301.00401.00501.00601.00701.00751.00802.00853.00903.00953.00Employment CategoryFrequencyPercentValid PercentCumulative PercentValidClerical36376.676.676.6Custodial275.75.782.3Manager841

16、7.717.7100.0Total474100.0100.02. 描述性統(tǒng)計分析結(jié)果打開數(shù)據(jù)文件“Employee.sav” ,在“Descriptive” 對話框中的“Variables"選項框中輸入變量名“salary”,選擇“Options”對話框中的所有選項,單擊“OK” 按鈕,生成如下表格。Descriptive StatisticsNRangeMinimumMaximumSumMeanVarianceSkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStatisticStd. ErrorStatist

17、icStatisticStatisticStd. ErrorStatisticStd. ErrorCurrent Salary474$119,250$15,750$135,000$16,314,875$34,419.57$784.311$17,075.6612.916E82.125.1125.378.224Valid N (listwise)474九、實驗結(jié)論SPSS在數(shù)據(jù)分析方面提供了強(qiáng)大的能力,可以快速地得到豐富的描述性統(tǒng)計分析結(jié)果供數(shù)據(jù)分析人員選用,重點(diǎn)在于理解各輸出參量的含義及其與數(shù)據(jù)分析對象屬性之間的關(guān)系。本實驗的結(jié)果讓我比較好地了解了基于本調(diào)查數(shù)據(jù)的統(tǒng)計分布特征。十、總結(jié)及心得體會利用軟件來進(jìn)行復(fù)雜的統(tǒng)計數(shù)據(jù)分析確實可以帶來極大的便

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論