統(tǒng)計學基礎知識與簡單應用_第1頁
統(tǒng)計學基礎知識與簡單應用_第2頁
統(tǒng)計學基礎知識與簡單應用_第3頁
統(tǒng)計學基礎知識與簡單應用_第4頁
統(tǒng)計學基礎知識與簡單應用_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第4章 統(tǒng)計學基礎及簡單應用劉明祥,信息技術與傳播學院21 統(tǒng)計學基本概念n1 頻率分布及其圖形n假設某商店在10天內(nèi)每天銷售的啤酒數(shù)為36、34、35、36、35、35、33、35、36、37。為分析啤酒每天銷量的分布,可依據(jù)每天啤酒銷售量的值,將啤酒的銷量分成幾組。如32.534.5、34.536.5和36.537.5三組,再分別統(tǒng)計各組的頻數(shù)。n第一組包括銷售量33、34,頻數(shù)為2,頻率為2/10。31 統(tǒng)計學基本概念n2 組距n每組的上下限之差稱為組距。n每組的上下限的平均值稱為組中心。n3 直方圖和頻數(shù)多邊形n把組距作為橫坐標,頻數(shù)作為縱坐標,在每一組上豎起一個長方形,這樣的圖形稱為

2、直方圖。把每個長方形的頂部的中心依次用折線連起來,折線所圍的多邊形稱為頻數(shù)多邊形。41 統(tǒng)計學基本概念n4 累積頻數(shù)和累積頻率n根據(jù)統(tǒng)計出的頻數(shù)分布,把相應的組頻數(shù)相加,稱為累積頻數(shù)。把對應的頻率相加,稱為累積頻率。n5 累積頻率分布圖和累積頻率多邊形圖n以組距為橫坐標,累積頻率為縱坐標,在每組上豎起一個長方形,其底長等于組距,高等于累積頻率,稱為累積頻率分布圖;用折線連接各個長方形的中點,得到累積頻率多邊形圖。51 統(tǒng)計學基本概念n2 中心位置特征值:平均數(shù)、中位數(shù)和眾數(shù)n均值:數(shù)據(jù)的算術平均值,n中位數(shù):用于表示數(shù)據(jù)的中間位置。將數(shù)據(jù)按照大小排列,然后取位于中間的一個,即為中位數(shù)。當數(shù)據(jù)個

3、數(shù)為奇數(shù)時,中位數(shù)為位置居中的一個;當數(shù)據(jù)個數(shù)為偶數(shù)時,中位數(shù)為中間位置兩個數(shù)的平均值。nixnx1161 統(tǒng)計學基本概念n眾數(shù):表示數(shù)據(jù)的中間位置特征,一般為一組數(shù)據(jù)中頻數(shù)最大的那個數(shù)。n幾何平均數(shù):n個變量值連乘積的n次方根,主要用于現(xiàn)象的總比率是若干比率的連乘積或現(xiàn)象的總發(fā)展速度是各個時期發(fā)展速度的連乘積的時候。nnxxxxG 321某流水作業(yè)的裝配分三道工序,第一道工序的產(chǎn)品合格率為98%,第二道工序的產(chǎn)品合格率為93%,第三道工序的產(chǎn)品合格率為89%。求各工序的平均產(chǎn)品合格率?71 統(tǒng)計學基本概念n調(diào)和平均數(shù):各個標志值倒數(shù)的算術平均數(shù)的倒數(shù),又稱為倒數(shù)平均數(shù)。 xnXXXHn111

4、1121有甲、乙、丙三種產(chǎn)品,其價格分別是30元、40元、50元,現(xiàn)各購進1萬元的商品,問商品的平均價格是多少。元30.3850140130131xnH81 統(tǒng)計學基本概念n3 變異程度n1 極差:最大值與最小值之差n2 中間位差:極差在一定程度上描述了數(shù)據(jù)的變異程度,但它忽略了中間的所有數(shù)據(jù),并受到最大值和最小值的過大影響。為了排除極值的過大影響,可以排除兩端的一些數(shù)據(jù),只取中間的一部分數(shù)據(jù)的極差。這部分數(shù)據(jù)的極差稱為中間位差。中間位差以其所包含數(shù)據(jù)的百分率命名。例如70%中間位差就是指除去前面和后面各15%的數(shù)據(jù)后,所余中間數(shù)據(jù)的極差。91 統(tǒng)計學基本概念n3 平均離差:表示各個數(shù)據(jù)離開它

5、們的中心位置的平均距離。nxxnii1101 統(tǒng)計學基本概念n4 方差和標準差n是兩個比較理想的描述數(shù)據(jù)變異程度的特征值,設一個樣本的數(shù)據(jù)容量為n,則樣本方差為:nxxsnii122)(nxxsnii12)(標準差111 統(tǒng)計學基本概念n5 總體平均值和總體標準差nixn11nxnii12)(121 統(tǒng)計學基本概念n6 分位數(shù)n若把一批已經(jīng)按大小順序排列起來的數(shù)據(jù)劃分成一特定數(shù)目的組數(shù),每組內(nèi)含有相同數(shù)目的數(shù)據(jù),則此時分割的數(shù)據(jù)稱為分位數(shù)。例如,百分位數(shù)就是把數(shù)據(jù)分成100組,每組內(nèi)含有相同數(shù)目的數(shù)據(jù)。n第90個百分位數(shù),就是指在這一數(shù)據(jù)之下有90%的數(shù)據(jù),在它之上有10%的數(shù)據(jù)。十分位數(shù)和四

6、分位數(shù)就是把數(shù)據(jù)分成10組和4組,在每組中含有相同數(shù)目的數(shù)據(jù)。第三個四分位數(shù)是這樣的一個數(shù)據(jù):有3/4的數(shù)據(jù)在它前面,有1/4的數(shù)據(jù)在它后面。131 統(tǒng)計學基本概念n7 偏度n如果一個分布在中位數(shù)左右兩側(cè)是形狀對稱,則該分布是對稱的。一般情況下,對稱分布的平均數(shù)、中位數(shù)和眾數(shù)都相等,但有些分布不是對稱的。分布的對稱性可用偏度來度量。n偏度定義:3133/Snxxanii其中,S為標準差,x為平均值。根據(jù)a3的值,可分為:右偏a30;無偏:a3=0;左偏:a3Descriptive Statistics-Descriptiven需多組數(shù)據(jù)分類匯總后再進行計算nAnalyze-Reports-Ca

7、se Summaries項172 SPSS統(tǒng)計描述n統(tǒng)計結(jié)果182 SPSS統(tǒng)計描述n在抽樣調(diào)查中,存在著抽樣誤差,標準誤是衡量抽樣誤差大小的統(tǒng)計量,其值小,說明樣本平均數(shù)與總體平均數(shù)較接近;反之,兩者的差異大。nSXS標準差和標準誤是不同的兩個概念,前者說明數(shù)據(jù)與其平均數(shù)的偏離程度,后者說明樣本平均數(shù)與總體平均數(shù)的接近程度。標準誤 Std. Error of Mean 標準差 Standard Deviation192 SPSS統(tǒng)計描述nKurtosis:峰度及其標準誤。若變量服從正態(tài)分布,則其值為0,大于0時比正態(tài)分布峰高,小于0時比正態(tài)分布峰低。nSkewness:偏度及其標準誤,若變量

8、服從正態(tài)分布,則其值為0。大于0時為正偏或右偏,小于0時為負偏或左偏。202 SPSS統(tǒng)計描述n次數(shù)分布(頻數(shù)分布)n次數(shù)分布,是指總體或樣本按隨機變量(數(shù)據(jù))大小次序在出現(xiàn)頻率上的排列。n一般采用次數(shù)分布表、次數(shù)分布直方圖或次數(shù)分布曲線來表示。n例3-1,現(xiàn)有50名學生的成績,原始成績?nèi)绫?3.1所表示,統(tǒng)計次數(shù)分布情況。nAnalyze-Descriptive-Frequencies項進行頻率統(tǒng)計212 SPSS統(tǒng)計描述n次數(shù)分布n結(jié)果見例3-1.sponCharts定義nBar charts:條形圖nPie Charts:餅狀圖nHistograms:直方圖,With normal cu

9、rve,圖中帶有正態(tài)曲線n以例2-1為例,計算次數(shù)分布情況。222 SPSS統(tǒng)計描述n次數(shù)分布20:有20%的數(shù)據(jù)小于65分。60:有60%的數(shù)據(jù)小于83分。80:有80%的數(shù)據(jù)小于88分。232 SPSS統(tǒng)計描述n正態(tài)分布考試成績95.092.590.087.585.082.580.077.575.072.570.067.565.062.560.0考試成績Frequency20100Std. Dev = 7.21 Mean = 79.4N = 100.00242 SPSS統(tǒng)計描述n由圖中可看出,變量基本服從正態(tài)分布。n正態(tài)分布是理論研究與應用中十分重要的一種分布,許多變量都服從正態(tài)分布,如考

10、試成績、某些心理、生理指標等。nSPSS軟件給出了判斷某個變量是否服從正態(tài)分布的方法,可以利用這一點做某些判斷。252 SPSS統(tǒng)計描述nFrequencies過程n可以產(chǎn)生詳細的頻數(shù)表,還可以按要求給出某百分位點的數(shù)值以及常用的條圖、餅圖等。n如果想用Frequencies過程得到我們所熟悉的頻數(shù)表,則先用recode過程產(chǎn)生一個新變量來代表所需的各組段。262 SPSS統(tǒng)計描述nFrequencies過程n某地101例健康男子血清總膽固醇測定結(jié)果如下,請繪制頻數(shù)表、直方圖,計算均數(shù)、標準差、變異系數(shù)、中位數(shù)M、P2.5,P97.5的數(shù)值。n數(shù)據(jù)文件為dguchun.sav272 SPSS統(tǒng)

11、計描述nFrequencies過程n某地101例健康男子血清總膽固醇測定結(jié)果如下,請繪制頻數(shù)表、直方圖,計算均數(shù)、標準差、變異系數(shù)、中位數(shù)M、P2.5,P97.5的數(shù)值。n數(shù)據(jù)文件為dguchun.sav282 SPSS統(tǒng)計描述nDescriptives過程n對變量進行描述性統(tǒng)計分析,計算并列出一系列相應的統(tǒng)計指標。292 SPSS統(tǒng)計描述n例n某市1995年110名7歲男童的身高資料已按頻數(shù)表格式輸入,變量groupmid代表所在組段的組中值,freq代表組段頻數(shù),請求出該資料的均數(shù)、標準差、中位數(shù)和四分位數(shù)間距。High.savn首先利用weight cases加權,然后用Frequenc

12、ies過程求出。302 SPSS統(tǒng)計描述n正態(tài)分布n正態(tài)分布曲線的形狀和位置由平均分 和標準差S所決定。n平均分 對應于單峰位置, 越大,曲線越往右移動。標準差S越大,曲線的單峰位置越低,寬度越大,顯得越“胖”;S越小,曲線的高度越高,寬度越小,顯得越“瘦”。XXX312 SPSS統(tǒng)計描述n正態(tài)分布n在正態(tài)分布曲線圖上,正態(tài)曲線以下,以S為距離單位所包括的面積是按一定比例分配的,若將正態(tài)曲線底邊從-3S到3S分成四等分,每等分距離為1.5S,則每距離間隔之間所包括的面積比例如下所示:322 SPSS統(tǒng)計描述n正態(tài)分布組別區(qū)間范圍區(qū)間面積比例A1.5S3S6.6%BM1.5S43.3%C-1.5

13、SM43.3%D-3S-1.5S6.6%332 SPSS統(tǒng)計描述n正態(tài)分布6.6%6.6%43.3%43.3%差中良好342 SPSS統(tǒng)計描述n正態(tài)分布n利用正態(tài)分布曲線的性質(zhì),可以得到劃分不同學習水平等級的界限和學生人數(shù)比例的理論數(shù)值。n將理論數(shù)值與實際數(shù)值進行比較,可以對學生的實際情況進行判斷。352 SPSS統(tǒng)計描述n -S平面特征數(shù)據(jù)分析模型n1象限,平均水平高,但分離度大,存在低分生n2象限,平均水平低,且分離度大,存在高分生n3 象限,平均水平低,且集中,屬差劣狀態(tài)。n4 象限,平均水平高,且集中,屬優(yōu)良狀態(tài)。X362 SPSS統(tǒng)計描述n例題 P342,例13-3n1 定義變量,輸

14、入數(shù)據(jù)n2 數(shù)據(jù)排序nData-Sort Casesn3 計算平均分與標準差nAnalyze-Descriptive Statistic-Descriptives372 SPSS統(tǒng)計描述n例題 P342,例13-3n4 分組統(tǒng)計平均分和標準差nAnalyze-Reports-Case Summaries382 SPSS統(tǒng)計描述n例題 P342,例13-3n5 次數(shù)分布表的形成n利用例3-1的50個學生的成績形成次數(shù)分布表n轉(zhuǎn)換數(shù)據(jù),生成新變量:Transform-Recode Into Different Variablen統(tǒng)計分析次數(shù)分布:Analyze-Descriptive Statis

15、tic-Frequencies392 SPSS統(tǒng)計描述n例題 P342,例13-3403 SPSS中的ReportsnOLAP Cubes過程:用于按指定的范圍對一個或多個變量做出描述,可以得到一些常用的描述統(tǒng)計量。其特點是可以分層變化不同水平的組合進行變量的描述。nCase Summaries過程:對記錄進行匯總,與OLAP Cubes過程相比,不僅可以計算描述統(tǒng)計量,還可以分組進行匯總,并能夠給出詳細的記錄列表。nReport Summaries in Rows/Columns過程:按行和列輸出結(jié)果,可進行精確定義。413 SPSS中的Reportsn1 OLAP Cubes過程n在線分析處理Online Analytical Processing的縮寫,用快速簡單的方式提供對變量的動態(tài)描述和分析。n對cars.sav中的變量weight按變量origin和cylinder的有效取值范圍計算均數(shù)和標準差。423 SPSS中的Reportsn1 OLAP Cubes過程需要進行分析的變量分組變量:不會同時輸出分組變量各種水平組合下的分析結(jié)果,而是用多層表的形式出現(xiàn),默認只顯示合計情況。同時,分組變量也用于確定進入分析的記錄范圍,兩個變量中均為缺失的記錄可進入分析。以例2-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論