版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
緒論
第一節(jié)記錄學(xué)的含義和作用
一、什么是記錄學(xué)
1.記錄學(xué)的含義
記錄學(xué)是有效搜集、處理、分析和解釋數(shù)據(jù),發(fā)現(xiàn)規(guī)律,以便更好決策日勺一門措施論學(xué)科。
2.分析數(shù)據(jù)的措施有描述記錄、推斷記錄。
⑴描述記錄
①描述記錄是將所搜集的數(shù)據(jù)處理后,用數(shù)值、表格或圖形形式體現(xiàn)的有用信息。
②描述記錄是基礎(chǔ),它為推斷記錄、記錄征詢、記錄決策提供必要
⑵推斷記錄就是根據(jù)樣本數(shù)據(jù)特性去估計(jì)或檢查總體的數(shù)據(jù)特性。
二、記錄學(xué)的作用和重要性
1.記錄學(xué)的作用
人們用數(shù)據(jù)發(fā)現(xiàn)的規(guī)律做出更好的決策。
三、要發(fā)現(xiàn)規(guī)律,對(duì)記錄數(shù)據(jù)一般有規(guī)定:客觀性、合用性、精確性和及時(shí)性。
記錄學(xué)是怎樣處理實(shí)際問題的?
記錄學(xué)處理實(shí)際問題的基本思緒是:
①提出與記錄有關(guān)的實(shí)際問題;
②建立有效II勺指標(biāo)體系;
③搜集數(shù)據(jù);
④選用或發(fā)明有效的記錄措施處理、顯示所搜集數(shù)據(jù)的特性;
⑤根據(jù)所搜集數(shù)據(jù)的特性、結(jié)合定性、定量知識(shí)作出總體特性的合理推斷:
⑥根據(jù)推斷給出更好決策H勺提議;
不處理問題時(shí),反復(fù)第②?⑥步。
第二節(jié)記錄學(xué)的基本概念
?一、總體、單位和樣本
1.總體
記錄總體是根據(jù)一定目確實(shí)定口勺,由客觀存在口勺、具有某種同質(zhì)性口勺許多種別事物構(gòu)成日勺整
體。
⑴同質(zhì)性是確定記錄總體口勺基本原則,它是根據(jù)記錄的研究目的而定的J。研究目的不一樣,
所確定的總體也不一樣,其同質(zhì)性的I意義也隨之變化。
⑵記錄總體還應(yīng)具有大量性,即記錄總體應(yīng)應(yīng)當(dāng)由足夠數(shù)量的同質(zhì)性單位構(gòu)成。
2.總體單位(簡(jiǎn)稱單位)是構(gòu)成總體的各個(gè)個(gè)體。如經(jīng)典案例1中英軍R勺每架戰(zhàn)機(jī);事例
4中時(shí)每個(gè)居民。
3.由總體的部分單位構(gòu)成的集合稱為樣本(又稱子樣)。構(gòu)成樣本的單位稱為樣品,樣本中
樣品的數(shù)目稱為樣本容量。
4.記錄學(xué)處理問題的目的是認(rèn)識(shí)總體的數(shù)據(jù)特性。不過,當(dāng)調(diào)查是破壞性口勺,或者出于成
本、時(shí)間等原因考慮時(shí),不必要或不也許對(duì)構(gòu)成總體的所有單位都進(jìn)行調(diào)查。
二、標(biāo)志、指標(biāo)(參數(shù))和記錄量
志:
⑴總體單位普遍具有日勺屬性或特性稱為標(biāo)志。
⑵標(biāo)志按其體現(xiàn)分為品質(zhì)標(biāo)志和數(shù)最標(biāo)志兩種。
①品質(zhì)標(biāo)志表明單位屬性方面的特性,品質(zhì)標(biāo)志的體現(xiàn)只能用非數(shù)值來描述.
?:?(如:經(jīng)典案例1中英軍戰(zhàn)機(jī)的類型,事例4中每個(gè)居民口勺性別。)
?②數(shù)量標(biāo)志表明單位數(shù)量方面H勺特性,其體現(xiàn)用數(shù)值來描述
(如:經(jīng)典案例1中英軍戰(zhàn)機(jī)的彈孔位置,事例4中每個(gè)居民的收入。)
2.參數(shù)(標(biāo)志)
⑴記錄總體具有H勺數(shù)量特性的概念和數(shù)值稱為記錄指標(biāo),也稱為參數(shù)。
⑵記錄指標(biāo)由兩項(xiàng)基本要素構(gòu)成,即指標(biāo)的概念和指標(biāo)的取值。
(指標(biāo)的概念是對(duì)所研究現(xiàn)象本質(zhì)U勺抽象概括,也是對(duì)總體數(shù)量特性的I質(zhì)的規(guī)定性。)
(例如事例4中居民人口數(shù)100萬人,總收入31.4億元。)
⑶記錄指標(biāo)按表達(dá)形式可以分為數(shù)量指標(biāo)和質(zhì)量指標(biāo).
①但凡反應(yīng)現(xiàn)象總規(guī)模、總水平的記錄指標(biāo)稱為數(shù)量指標(biāo),用絕對(duì)數(shù)來表達(dá)。例如事例4中
居民總數(shù)100萬人、總收入31.4億元等,
②但凡反應(yīng)現(xiàn)象相對(duì)水平和工作質(zhì)量的記錄指標(biāo)稱為質(zhì)量指標(biāo),用相對(duì)數(shù)或平均數(shù)來袤達(dá).
例如企業(yè)職工平均工資5000元、工人出勤率93%等。質(zhì)量指標(biāo)是總量指標(biāo)的派生指標(biāo),以
反應(yīng)現(xiàn)象之間的內(nèi)在聯(lián)絡(luò)和對(duì)比關(guān)系。
⑷單個(gè)指標(biāo)不能反應(yīng)總體的全貌,這便需要設(shè)置指標(biāo)體系。記錄指標(biāo)體系是由一系列互相聯(lián)
絡(luò)的記錄指標(biāo)構(gòu)成的有機(jī)整體,用以反應(yīng)所研究現(xiàn)象各方面互相依存互相制約的關(guān)系。
3.記錄量
⑴記錄量是樣本觀測(cè)量的一種已知函數(shù),用來闡明樣本的特性。是樣本觀測(cè)量的一種已知函
數(shù),用來闡明樣本的特性。
⑵抽取的樣本不一樣,記錄量的觀測(cè)值也就不一樣。如樣本平均數(shù)、樣本方差、樣本比例是
記錄量,抽取樣本后,人們一般用與總體參數(shù)對(duì)應(yīng)的記錄量觀測(cè)值,作為總體參數(shù)的估計(jì).
(如某汽車制造企業(yè)從生產(chǎn)的一批轎車中抽取了16輛轎車,用這些轎車的平均行駛里程值、
合格率值分別作為該批轎車平均行駛里程、合格率日勺估計(jì)。)
三、數(shù)據(jù)
(一)變量與變量值
1.即闡明現(xiàn)象日勺某一事實(shí)或數(shù)量口勺特性稱為變量,將上述標(biāo)志、指標(biāo)和記錄量的名稱進(jìn)行歸
納就是變量。
2.2.變量II勺詳細(xì)體現(xiàn)是變量值,數(shù)據(jù)就是變量及其體現(xiàn),也可稱為反應(yīng)客觀事物的事實(shí)或數(shù)
量根據(jù)。
3.如:收入是一種變量,收入的體現(xiàn)是變量值。
將在特定研究過程中搜集的所有數(shù)據(jù)集合在一起,稱為數(shù)據(jù)集。
根據(jù)變量值確實(shí)定與否,變量分為確定性變量(受確定性原因影響,原因是明確的,可解釋,
可控制的)與隨機(jī)變量(受許多不確定原因影響,如員工的起床時(shí)間)。
(-)數(shù)據(jù)口勺計(jì)量尺度
搜集數(shù)據(jù)時(shí)需要用到如下四種由低到高的計(jì)量尺度:定類尺度、定序尺度、定距尺度和定比
尺度,計(jì)量尺度U勺不一樣決定了不一樣的數(shù)據(jù)分析與處理措施。
1.定類尺度是闡明客觀現(xiàn)象無序類別的計(jì)量。定類尺度的重要數(shù)學(xué)特性是或“W”.如
居民U勺性別是男、女計(jì)量,戰(zhàn)機(jī)的類型是戰(zhàn)斗機(jī)、轟炸機(jī)、偵察機(jī)等計(jì)量,這一場(chǎng)所的所使
用時(shí)數(shù)值只作為無序分類的代碼。
2.定序尺度是闡明客觀現(xiàn)象有序類別的非數(shù)值計(jì)量。定序尺度口勺重要數(shù)學(xué)特性是或
“>”.例如,對(duì)居民的滿意度計(jì)量可以分為非常滿意、滿意、一般、不滿意、非常不滿意五
類。這一場(chǎng)所11勺所使用的數(shù)值只作為有序分類的代碼。
3.定距尺度是闡明客觀現(xiàn)象數(shù)值間距故意義II勺計(jì)量。其用確切的數(shù)值反應(yīng)現(xiàn)象之間在量方
面的差異,定距尺度的重要數(shù)學(xué)特性是.如息量指標(biāo)是定距尺度計(jì)量H勺。
(0不代表不存在)
4.定比尺度是闡明客觀現(xiàn)象兩個(gè)數(shù)值比故意義口勺計(jì)量。定比尺度日勺重要數(shù)學(xué)特性是“X”
a
如質(zhì)量指標(biāo)中日勺相對(duì)數(shù)、平均數(shù)是定比尺度計(jì)量的(0代衣不存在)
5數(shù)據(jù)分類
⑴定類尺度,定序尺度的數(shù)據(jù)統(tǒng)稱為定性數(shù)據(jù)。定性變量是指帶有定性數(shù)據(jù)的變量。
⑵定距尺度,定比尺度的數(shù)據(jù)統(tǒng)稱為為定量數(shù)據(jù)。定量變量是指帶有定量數(shù)據(jù)的變量。
根據(jù)定量變量值持續(xù)出現(xiàn)與否,定量變量分為持續(xù)性變量與離散型變量。
①持續(xù)型變量是指變量在某一區(qū)域內(nèi)的取值是持續(xù)不停的,無法一一列舉。如:軍機(jī)的彈孔位
置,產(chǎn)品日勺壽命等。
②離散型變量是指變量的取值是間斷口勺,可以一一列舉。例如,產(chǎn)品數(shù)等。
(三)數(shù)據(jù)II勺類型
根據(jù)對(duì)客觀現(xiàn)象觀測(cè)的角度不一樣,記錄數(shù)據(jù)可分為:橫截面數(shù)據(jù)?、時(shí)間序列數(shù)據(jù)和面板數(shù)
據(jù)。
1.橫截面數(shù)據(jù)又稱為靜態(tài)數(shù)據(jù)-,它是指在同一時(shí)間對(duì)同一總體內(nèi)不一樣單位進(jìn)行觀測(cè)而獲得
的數(shù)據(jù)。例如,2023年全國(guó)各省、市、自治區(qū)的居民收入總值就屬于橫截面數(shù)據(jù)。
2.時(shí)間序列數(shù)據(jù)又稱為動(dòng)態(tài)數(shù)據(jù),它是指在某一段時(shí)期內(nèi)準(zhǔn)時(shí)間次序?qū)ν豢傮w進(jìn)行觀測(cè)而
獲得的數(shù)據(jù)%例如,“十二五”期間我國(guó)按年份次序的居民收入總值就屬于時(shí)間序列數(shù)據(jù)
3.面板數(shù)據(jù)則是同步在時(shí)間和截面空間上獲得的二維數(shù)
據(jù)。例如20231023年30個(gè)企業(yè)的總產(chǎn)值數(shù)據(jù)。面板數(shù)據(jù)
則由30個(gè)企業(yè)23年的數(shù)據(jù)構(gòu)成,共有300個(gè)觀測(cè)值。從某
一年份看,它是由30個(gè)企業(yè)總產(chǎn)值數(shù)
第二章搜集數(shù)據(jù)
第一節(jié)記錄調(diào)查方案設(shè)計(jì)
調(diào)查方案設(shè)計(jì)是指導(dǎo)整個(gè)調(diào)查過程的大綱性文獻(xiàn),其重要內(nèi)容重要包括如下幾種方面:
一、確定調(diào)查目日勺
1.調(diào)查要到達(dá)的詳細(xì)目的
2.回答“為何調(diào)查?”
3.調(diào)查之前必須明確
二、確定調(diào)查對(duì)象和調(diào)查單位
1.調(diào)查對(duì)象:調(diào)查研究歐J總體或調(diào)查范圍
2.調(diào)查單位:需要對(duì)之進(jìn)行調(diào)查日勺單位??梢允钦{(diào)查對(duì)象的所有單位(全面調(diào)查),
也可以是調(diào)查對(duì)象中H勺?部分單位(非全面調(diào)查)
回答“向誰調(diào)查?
三、選擇合適的調(diào)查方式、調(diào)查措施
1.調(diào)查方式是指調(diào)查的組織方式,重要有:普查、抽樣調(diào)查、經(jīng)典調(diào)查、重點(diǎn)調(diào)查和記
錄報(bào)表制度
調(diào)查措施是指搜集記錄資料的措施,重要有:?jiǎn)柧矸?、訪談法、觀測(cè)法和試驗(yàn)法
四、設(shè)計(jì)調(diào)查項(xiàng)目和調(diào)查表
1.調(diào)查項(xiàng)目:調(diào)查的I詳細(xì)內(nèi)容
2.調(diào)查表:體現(xiàn)調(diào)查項(xiàng)目的表格或問卷。有單一表和一覽表兩種形式。
3回答“調(diào)查什么?”
五、確定調(diào)查時(shí)間
1.記錄調(diào)查時(shí)間包括兩種涵義:調(diào)查時(shí)間和調(diào)查期限
2.調(diào)杳時(shí)間:調(diào)查資料日勺所屬時(shí)間(時(shí)期或時(shí)點(diǎn))。
調(diào)杳期限:進(jìn)行調(diào)查工作的時(shí)間,包括搜集資料和報(bào)送資料的整個(gè)工作所需要的時(shí)間
六、調(diào)查匯報(bào)的撰寫
調(diào)查匯報(bào)的撰寫包括:調(diào)查過程的描述、根據(jù)調(diào)查數(shù)據(jù)所做的決策、對(duì)調(diào)查成果的評(píng)價(jià)
【在調(diào)查方案中,應(yīng)給出:提交調(diào)查匯報(bào)的詳細(xì)時(shí)間,并對(duì)調(diào)查的精度、費(fèi)用等提出詳細(xì)規(guī)
定】
七、制定調(diào)查工作的組織實(shí)行計(jì)劃
第二節(jié)數(shù)據(jù)搜集來源
一、數(shù)據(jù)搜集的來源
1.原始數(shù)據(jù):必須規(guī)定調(diào)研者親自搜集
2.二手?jǐn)?shù)據(jù):調(diào)研者需要識(shí)別和評(píng)估二手?jǐn)?shù)據(jù)的有效性
二、二手?jǐn)?shù)據(jù)的搜集
1.二手?jǐn)?shù)據(jù)的來源
⑴內(nèi)部二手?jǐn)?shù)據(jù)
⑵外部二手?jǐn)?shù)據(jù)
2.二手?jǐn)?shù)據(jù)搜集的|特點(diǎn)
長(zhǎng)處:快捷、成本低、易獲取
四、缺陷:有關(guān)性差、時(shí)效性差、可靠性低
五、二手?jǐn)?shù)據(jù)搜集的注意事項(xiàng)
1.二手?jǐn)?shù)據(jù)H勺評(píng)估重要包括:
2.研究目H勺H勺評(píng)估一一調(diào)研日勺目口勺是什么
3.二手?jǐn)?shù)據(jù)來源評(píng)估一一誰搜集了這些資料
4.研究?jī)?nèi)容評(píng)估一一搜集了某些什么樣的資料
5.調(diào)杳方式、措施評(píng)估一一這些資料怎樣獲得歐I
6.二手?jǐn)?shù)據(jù)有關(guān)性評(píng)估一一這些資料與其他資料H勺一致程度怎樣
7.二手?jǐn)?shù)據(jù)時(shí)效性評(píng)估一一這些資料是何時(shí)搜集日勺
第三節(jié)原始數(shù)據(jù)的搜集
一、數(shù)據(jù)搜集的分類
按數(shù)據(jù)搜集口勺組織方式不一樣,分為記錄報(bào)表和專門調(diào)查
記錄報(bào)表:按照國(guó)家有關(guān)法規(guī)的規(guī)定,自上而下地統(tǒng)一布置、自下而上地逐層填報(bào)的一
種調(diào)查組織方式。
1.專門調(diào)查:為了某一特定目的或?qū)iT問題而專門組織的調(diào)查
按數(shù)據(jù)搜奧對(duì)象包括范圍的大小不一樣,分為全面調(diào)查和非全面調(diào)杳
全面調(diào)查:對(duì)構(gòu)成調(diào)查對(duì)象中的所有黨委進(jìn)行一一不漏的調(diào)查
非全面調(diào)查:是在記錄調(diào)查過程中,僅對(duì)調(diào)查中的一部分單位進(jìn)行調(diào)查。包括:抽樣調(diào)查、
重點(diǎn)調(diào)查、經(jīng)典調(diào)查和非全面記錄報(bào)表
按數(shù)據(jù)搜集日勺登記時(shí)間與否持續(xù),分為常常性調(diào)查和一次性調(diào)查
2.常常性調(diào)查:又稱持續(xù)性調(diào)杳,它是為了觀測(cè)社會(huì)經(jīng)濟(jì)現(xiàn)象在一定期期內(nèi)的數(shù)量變化所
進(jìn)行口勺調(diào)查登記或數(shù)據(jù)搜集
?一次性調(diào)查:又稱不持續(xù)性調(diào)查,它是對(duì)所研究日勺社會(huì)經(jīng)濟(jì)現(xiàn)象間隔一段時(shí)間所進(jìn)行H勺
調(diào)查登記或數(shù)據(jù)搜集
按數(shù)據(jù)搜集實(shí)行主體的不一樣,分為政府記錄調(diào)查和民間記錄調(diào)杳
?:?二、數(shù)據(jù)搜集的調(diào)查方式
1.數(shù)據(jù)搜集的調(diào)查方式,按照組織方式重要有:普查、抽樣調(diào)查、經(jīng)典調(diào)查、重點(diǎn)調(diào)查和
記錄報(bào)表制度
普查:專門組織的一次性全面調(diào)查
普查的特點(diǎn):
(1)?般是一次性調(diào)查,周期性強(qiáng)
⑵全面性調(diào)查,搜集的資料全面、系統(tǒng)、精確
⑶普查11勺點(diǎn)多面廣,工作量大,投入多
普查應(yīng)遵照如下原則:
⑴時(shí)間統(tǒng)一性原則
⑵登記工作的規(guī)范性原則
⑶普查項(xiàng)目統(tǒng)一規(guī)定原則
⑷同類普查同周期性原則
抽樣調(diào)查:從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本數(shù)據(jù)推斷總體
數(shù)量特性的一種非全面調(diào)查。
⑴概率抽樣:根據(jù)隨機(jī)原則從總體中抽選樣本,并根據(jù)樣本信息對(duì)總體的某些特性做出
估計(jì)推斷,對(duì)推斷也許出現(xiàn)的誤差可以從概率意義上加以控制
非概率抽樣:調(diào)查組根據(jù)自己的以便或主觀判斷抽取樣本的措施
⑵抽樣調(diào)查優(yōu)勢(shì):經(jīng)濟(jì)性、時(shí)效性、精確性
①⑶幾種詳細(xì)的抽樣方式:
②簡(jiǎn)樸隨機(jī)抽樣一一是指從總體N個(gè)單位中隨機(jī)抽取n個(gè)單位作為樣本,使每個(gè)也
許的樣本被抽中的I概率相等的一種抽樣方式。
③分層抽樣一一重要特性分層按比例抽樣,重要使用于總體中的個(gè)體有明顯差異。
共同點(diǎn):每個(gè)個(gè)體被抽到的概率都相等N/Mo
④整群抽樣一一是將總體中各單位歸并成若干個(gè)互不交叉、互不反復(fù)的集合,稱之
為群;然后以群為抽樣單位抽取樣本的一種抽樣方式?!緫?yīng)用整群抽樣時(shí),規(guī)定各群有很好
的代表性,即群內(nèi)各單位的差異要大,群間差異要小】
等距抽樣——首先將總體各單位按一定次序排列,更具樣本容量大小確定抽選間隔,然
后隨機(jī)抽取一種進(jìn)入樣本,直到滿足規(guī)定為止的一種抽樣方式
多階段抽樣一一是指將抽樣過程分階段進(jìn)行,每個(gè)階段使用的抽樣措施往往不一樣,即
將多種抽樣措施結(jié)合使用,其在大型流行病學(xué)調(diào)查中常用。
第一階段,將總體分為若干個(gè)一級(jí)抽樣單位,從中抽選若干個(gè)一級(jí)抽樣單位入樣;
第二階段,將入樣的每個(gè)一級(jí)單位提成若干個(gè)二級(jí)抽樣單位,從入樣的每個(gè)一級(jí)單位中各抽
選若干個(gè)二級(jí)抽樣單位入樣……,依此類推,直到獲得最終樣本
3.經(jīng)典調(diào)查:
從調(diào)查對(duì)象的所有單位中選擇少數(shù)經(jīng)典單位進(jìn)行調(diào)查。目”勺是描述和揭示事物的本質(zhì)特性
和規(guī)律。調(diào)查成果不能用于推斷總體
4.重點(diǎn)調(diào)查:
從調(diào)查對(duì)象的所有單位中選擇少數(shù)重點(diǎn)單位進(jìn)行調(diào)查。調(diào)查成果不能用于推斷總體
5.記錄報(bào)表制度:按照國(guó)家有關(guān)法規(guī)的規(guī)定,自上而下地統(tǒng)一布置、自下而上地逐層填報(bào)
的一種調(diào)查組織方式。
記錄報(bào)表內(nèi)容:報(bào)表目錄、報(bào)表表式、填表闡明
記錄報(bào)表的資料來源:原始記錄、記錄臺(tái)賬、企業(yè)內(nèi)部報(bào)表
三、數(shù)據(jù)搜集H勺措施
1.問卷法:郵寄調(diào)查、調(diào)查、電腦輔助調(diào)查、網(wǎng)絡(luò)調(diào)查
2.訪談法
長(zhǎng)處:廣泛地認(rèn)識(shí)客觀現(xiàn)象、深入地研究問題、資料搜集可靠和應(yīng)用面很廣
缺陷:必須依賴具的較高素質(zhì)的訪問員、直接交談會(huì)對(duì)獲取資料的各觀性產(chǎn)生負(fù)面影響、
在不便問詢時(shí)訪談無法實(shí)行、調(diào)杳費(fèi)用大、時(shí)間長(zhǎng),也許會(huì)碰到意料不到H勺困難
集體訪談:將?組被調(diào)查者集中在調(diào)查現(xiàn)場(chǎng),讓他們對(duì)調(diào)查的主題刊登意見以獲得資料
2.【常用"勺有:頭腦風(fēng)暴法、德爾非法(專家意見法)、深度訪談法】
3.個(gè)別訪談:調(diào)查者對(duì)每一名受訪者進(jìn)行一對(duì)一單獨(dú)訪談。
4.觀測(cè)法:
就調(diào)查對(duì)象的行動(dòng)和意識(shí),調(diào)查人員邊觀測(cè)邊記錄以搜集所需信息
調(diào)查人員不是強(qiáng)行介入
可以在被調(diào)查者不察覺的狀況下獲得資料
4.試驗(yàn)法
在設(shè)定的特殊試驗(yàn)場(chǎng)所、特殊狀態(tài)下,對(duì)調(diào)查對(duì)象進(jìn)行試驗(yàn)以獲得所
需資料。有室內(nèi)試驗(yàn)法和市場(chǎng)試驗(yàn)法
第四節(jié)記錄數(shù)據(jù)的質(zhì)量
一、記錄數(shù)據(jù)H勺誤差
記錄調(diào)查誤差分為登記性誤差和代表性誤差
1)登記性誤差:由于調(diào)查者或被調(diào)查者口勺人為原因所導(dǎo)致FI勺誤差。理論上講可以消除
代表性誤差:用樣本數(shù)據(jù)進(jìn)行推斷時(shí)所產(chǎn)生的誤差。一股無法消除,但事先可以進(jìn)行控制和
計(jì)算
第三章整頓和顯示數(shù)據(jù)
第一節(jié)數(shù)據(jù)的整頓與顯示問題的提出
1.根據(jù)處理問題IJ勺目確實(shí)定分組的變量,如經(jīng)典案例4中分組的變量為收入。
2.確定組數(shù)等,如經(jīng)典案例4中,收入由貧到富分為5組,持續(xù)型變量如收入還波及到確定每
組組距、上限和下限。
3.按不重不漏"勺原則對(duì)數(shù)據(jù)進(jìn)行分組,確定各組頻數(shù)、頻率,經(jīng)典案例4還波及到每組的收
入值等。
第二節(jié)4.用表、圖顯示整頓的數(shù)據(jù),如表3?1、圖3?1
第三節(jié)定量數(shù)據(jù)的整頓與顯示
一、定量數(shù)據(jù)的整頓
1.重要采用記錄分組來整頓。數(shù)據(jù)分組后,把每組的個(gè)數(shù)稱為頻數(shù)。每組個(gè)數(shù)所占比
例稱為頻率。
2.記錄分組就是指根據(jù)記錄研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)變量(或幾種
變量)把被研究的總體劃提成為若干個(gè)不一樣性質(zhì)的組,然后再記錄出各組的頻數(shù),就形成
了一張頻數(shù)分布表。
記錄分組措施:單變量值分組和組距分組
1)單變量值分組就是將一種變量值作為一組,適合變量值較少的狀況。
①例如居民家庭按照人II數(shù)進(jìn)行分組,可分為1口人家庭、2口人家庭、3口人家
庭、4口人家庭、5口人以上家庭H勺組別。
②組距式分組是將變量值的一種區(qū)間作為一組,適合于持續(xù)變量和變量值較多的離
散型變量狀況。組距式分組可采用等距分組,也可采用不等距分組。
③等距分組是指每組組距相等。
等距分組的基本環(huán)節(jié)有:
第一步:確定組數(shù):一般狀況下,一批數(shù)據(jù)所分的組數(shù)不應(yīng)少于5組且不多于15組。在實(shí)
際分組時(shí),可以參照經(jīng)驗(yàn)公式來確定組數(shù)K,即/
第二步:確定組距:組距是?組的上限與下限之差
組距=(最大值-最小值)小組數(shù)
第三步:記錄出各組的頻數(shù)并整頓成頻數(shù)分布表。
[記錄各組頻數(shù)時(shí)要注意遵照不重不漏的原則。為處理不重的問題,記錄分組時(shí)習(xí)慣規(guī)定
“上組限不在組內(nèi)”例如100這一數(shù)值不能算在“90~100”這一組,而是算在“100~110”
這一組內(nèi)?!?/p>
閉口組:有上、下限值
開口組:“XX如下”及“XX以上”
組中值一一常用作各組的代表值:下限與上限之間的中點(diǎn)值,即:
組中值:下限值+上限值
-2
/(100如下,缺下限)
④(90以上,缺上限)
⑤不等距分組是指并非所有組距都相等。
二、定量數(shù)據(jù)日勺圖示
定量數(shù)據(jù)常用的記錄圖重要有直方圖、莖葉圖、曲線圖、散點(diǎn)圖等。
三、頻數(shù)分布圖口勺類型
頻數(shù)分布圖則屬于其中一種記錄圖,其重要類型有如下三種。
鐘型分布:“兩頭小,中間大”即中間變量值分布R勺頻數(shù)多,兩端分布頻數(shù)少,
(III)中,其分布特性是以變量日勺平均數(shù)為對(duì)稱軸,左右兩側(cè)對(duì)稱分布
(I)(II)中為非對(duì)稱分布,(I)是右偏分布(II)是左偏分布,
U型分布:“兩頭大,中間小”即中間日勺變量值分布頻數(shù)少,兩端的變量值分布頻數(shù)多,與鐘
型分布剛好相反
J型分布:有兩種類型,一種是正J型,即頻數(shù)伴隨變量的增大而增多;另i種則呈反J型,即
頻數(shù)伴隨變量H勺增大而減少
反J型
第四節(jié)品質(zhì)數(shù)據(jù)的整頓與顯示
一、定類數(shù)據(jù)H勺整頓與圖示
(一)定類數(shù)據(jù)H勺整頓
定類數(shù)據(jù)整頓重要用頻數(shù)分布表進(jìn)行。
(")定類數(shù)據(jù)口勺圖示
定類數(shù)據(jù)B勺圖示重要有條形圖、餅圖等
二、定序數(shù)據(jù)H勺整頓與圖示
(一)定序數(shù)據(jù)H勺整頓
定序數(shù)據(jù)也是采用頻數(shù)分析表進(jìn)行整頓。
還可以計(jì)算合計(jì)頻數(shù)和合計(jì)頻率,合計(jì)措施有兩種:向上合計(jì)和向F合計(jì)。
(")定序數(shù)據(jù)H勺圖示
定序型數(shù)據(jù)的記錄圖重要有合計(jì)頻數(shù)分布圖和環(huán)形圖。(P50-51)
第五節(jié)圖表的合理使用
一、鑒別圖形優(yōu)劣口勺準(zhǔn)則
(一)一張好的圖形應(yīng)臬有MJ特性
…1.反應(yīng)數(shù)據(jù)分布特性和規(guī)律八
...2.便于比較。
...3.有對(duì)圖形的描述和文字闡明。
(")鑒別圖形優(yōu)劣的準(zhǔn)則
.?.1.與否有助于真實(shí)、精確洞察問題的實(shí)質(zhì)。
...2.與否提供完整的信息量,與否使復(fù)雜的)觀點(diǎn)簡(jiǎn)樸化。
二、記錄表的設(shè)計(jì)
(一)記錄表H勺概念和構(gòu)造
1.概念
記錄表是體現(xiàn)記錄資料的一種形式。
2.構(gòu)造
從形式上看,由四部分構(gòu)成:
總標(biāo)題:是表口勺名稱,概括記錄表中要闡明的內(nèi)容;
B.橫行標(biāo)題:是各組H勺名稱,反應(yīng)總體各構(gòu)成部分;
C、縱覽標(biāo)題:是分組標(biāo)志或指標(biāo)H勺名稱,闡明縱行所列各項(xiàng)資料的內(nèi)容;
D、指標(biāo)數(shù)值:也稱數(shù)字資料,是記錄表的詳細(xì)內(nèi)容。
從內(nèi)容上看,由主詞和賓詞兩個(gè)部分構(gòu)成。主詞是記錄表所闡明的總體,總體的I各組或各組
日勺名稱。賓詞是用于闡明主詞的多種指標(biāo)。一般,記錄表的主詞列布表的左方,賓詞列在表
時(shí)右方,如表310所示(P52)
(-)記錄表口勺種類
記錄表按照總體分組狀況不一樣,可分為簡(jiǎn)樸表、分組表和及合表三類。
(三)記錄表H勺編制
1.記錄表線條的繪制。
一般記錄表的上下端以粗線繪制,表內(nèi)縱橫線以細(xì)線繪制。表格口勺左右不封口。
2.合計(jì)欄的J設(shè)置。
記錄表各縱列需要合計(jì)時(shí),可將合計(jì)列放在最終一行,各橫行若需要合計(jì)時(shí),可將合計(jì)列放
在最前一欄或最終一欄。
3.標(biāo)題日勺設(shè)計(jì)。
記錄表的標(biāo)題要簡(jiǎn)要扼要,以簡(jiǎn)潔而精確H勺文字來概括記錄資料的內(nèi)容、資料所屬時(shí)間、
空間等。
4.計(jì)量單位的列法。
指標(biāo)數(shù)值一般要有計(jì)量單位,若只有一種計(jì)量單位時(shí),可在表右上端注明。假如計(jì)量單位
不統(tǒng)一,可專設(shè)計(jì)量單位欄。
5.標(biāo)志值的書寫。
標(biāo)志值應(yīng)當(dāng)填寫整潔,對(duì)準(zhǔn)位數(shù)。當(dāng)數(shù)值太小可忽視不計(jì)時(shí),寫上“0”;當(dāng)缺失某項(xiàng)資料
時(shí),用符號(hào)“…”表達(dá);不應(yīng)有數(shù)字時(shí),用符號(hào)表達(dá)。
6.注解或資料來源的標(biāo)明。
一般而言,記錄表下方應(yīng)當(dāng)注明資料來源,以便查考。
第四章數(shù)據(jù)分布的數(shù)字特性
第一節(jié)數(shù)據(jù)集中趨勢(shì)的測(cè)定
一、集中趨勢(shì)測(cè)定問題的提出和作用
(一)問題U勺提出
對(duì)于總體中的個(gè)體數(shù)據(jù),有時(shí)會(huì)展現(xiàn)出在一定范圍內(nèi)以某個(gè)數(shù)據(jù)為中心上下波動(dòng)的分布
特性,即數(shù)據(jù)有時(shí)具有它分布日勺中心,我們稱之為數(shù)據(jù)分布的集中趨勢(shì)。該怎樣測(cè)定一組數(shù)
據(jù)的集中趨勢(shì)呢?
二)集中趨勢(shì)測(cè)定日勺作用
1.集中趨勢(shì)指標(biāo)的分類
算術(shù)平均數(shù)
集數(shù)值平均數(shù)調(diào)和平均數(shù)
中
趨兒何平均數(shù)
勢(shì)
指眾數(shù)
標(biāo)
位置代表值
中位數(shù)
2.集中趨勢(shì)指標(biāo)H勺作用
(1)可以反應(yīng)一組數(shù)據(jù)分布的中心或一般水平;
(2)可以反應(yīng)同一現(xiàn)象在不一樣步間或空間條件下的發(fā)展趨勢(shì)或差異;
(3)可以用來分析現(xiàn)象之間的依存關(guān)系;
(4)樣本平均數(shù)是記錄推斷的一種重要記錄量。
。二、集中趨勢(shì)H勺測(cè)定
(-)數(shù)值平均數(shù)
?數(shù)值平均數(shù)只合用于定量數(shù)據(jù)(數(shù)值型數(shù)據(jù)),而不合用于定性數(shù)據(jù)。
?1.算術(shù)平均數(shù)
(1)簡(jiǎn)樸算術(shù)平均數(shù)
①簡(jiǎn)樸算術(shù)平均數(shù)是根據(jù)未分組數(shù)據(jù)(原始數(shù)據(jù))計(jì)算的一種平均數(shù),它是招所有
日勺原始數(shù)據(jù)相加再除以數(shù)據(jù)總個(gè)數(shù)得到的。
樣本計(jì)算的簡(jiǎn)樸算術(shù)平均數(shù)的計(jì)算公式是:
_今
——
總體數(shù)據(jù)計(jì)算”勺簡(jiǎn)樸算術(shù)平均數(shù)II勺計(jì)算公式為:
N
ZE
〃=一
N
(2)加權(quán)算術(shù)平均數(shù)
加權(quán)算術(shù)平均數(shù)是根據(jù)分組數(shù)據(jù)計(jì)算日勺一種平均數(shù)。設(shè)樣本被分為k組,各組的頻數(shù)為fi樣
本計(jì)算的加權(quán)算術(shù)平均數(shù)的計(jì)算公式為:
其中,Xi有兩種狀況:在單變量值分組中,Xi代表各組的變量值;在組距式分組中,Xi代表各
組的組中值,/稱作權(quán)重:頻率)。
總體數(shù)據(jù)計(jì)算日勺加權(quán)算術(shù)平均數(shù)歐I計(jì)算公式為:
Z"kf
xz5Zfi
i=li=l
(3)算術(shù)平均數(shù)的重要數(shù)學(xué)性質(zhì)
①各變量值與其算術(shù)平均數(shù)的離差之和等于零;
即:/
②各變審值與其算術(shù)平均數(shù)的I離差平方和最小。
Z(x,-ip=min或2(為一工=min
即:0
2.調(diào)和平均數(shù)
調(diào)和平均數(shù)加權(quán)算術(shù)平均數(shù)的一種變形。
調(diào)和平均數(shù)與加權(quán)算術(shù)平均數(shù)口勺關(guān)系是:
若已知各組變量值及其標(biāo)志總量mi(mi=xifi),而缺乏fi的數(shù)據(jù)時(shí),則加權(quán)算術(shù)平均數(shù)
可通過變形得到fi(fi=mi/xi)后,再以mi為權(quán)數(shù)的J調(diào)和平均數(shù)形式來計(jì)算。
為=登
乙Xj乙X,
3.幾何平均數(shù)
幾何平均數(shù)是n個(gè)變量值連乘積曰勺n次方根
(1)簡(jiǎn)樸幾何平均數(shù)
當(dāng)樣本數(shù)據(jù)中各變量值出現(xiàn)的次數(shù)都相似時(shí),用簡(jiǎn)樸兒何平均數(shù)公式。
禮=自尸4?…?x〃=麻
式中,xi代表各變量值,n為樣本容量,/為連乘符號(hào)
(2)加權(quán)幾何平均數(shù)
當(dāng)樣本數(shù)據(jù)中各變量值出現(xiàn)U勺次數(shù)不全相似時(shí),用加權(quán)幾何平均數(shù)公式。
XG」倜叫游喏?…?呼
式中,XI代表各變量值,n為樣本容量,/為連乘符號(hào)
【假如獲得一組總體數(shù)據(jù),根據(jù)總體數(shù)據(jù)計(jì)算U勺幾何平均數(shù)〃勺公式與樣本數(shù)據(jù)的基本相
似?!?/p>
需要注意的是:
當(dāng)數(shù)據(jù)中出現(xiàn)零或負(fù)值時(shí)不適宜計(jì)算幾何平均數(shù);
幾何平均數(shù)是?種合用于特殊數(shù)據(jù)日勺平均數(shù),當(dāng)變量值之間具有連乘積關(guān)系時(shí),采用幾何平
均數(shù)愈加合理;
現(xiàn)實(shí)生活中,幾何平均數(shù)重要用于計(jì)算現(xiàn)象的平均增長(zhǎng)率和平均發(fā)展速度(詳見本書第九
章)。
(二)位置代表值
1.眾數(shù)
1)眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多的變量值,一般用符號(hào)表達(dá)。
2)眾數(shù)代表日勺是最常見、最普遍H勺狀況。眾數(shù)不僅可以度量定性數(shù)據(jù)口勺集中趨勢(shì),還可以
度量定量數(shù)據(jù)的集中趨勢(shì)。
①眾數(shù)的特點(diǎn):
②眾數(shù)是位置型平均數(shù),它只與位置有關(guān),不受數(shù)據(jù)中極端值日勺影響;
③從分布形態(tài)上看,眾數(shù)是一組數(shù)據(jù)分布最高峰點(diǎn)所對(duì)應(yīng)的變量值;
④眾數(shù)具有不唯一性(可以有一種或多種或沒有)
①組距式分組數(shù)據(jù)中眾數(shù)H勺求解較為復(fù)雜。在組距式分組數(shù)據(jù)中,求解眾數(shù)的環(huán)節(jié):
②先要確定眾數(shù)所在組;
③假如是等距分組數(shù)據(jù),那么次數(shù)最多的那一組就為眾數(shù)組;假如是不等距分組數(shù)
據(jù),那么組密度(組頻率/組距)最大H勺組就為眾數(shù)組。
之后再按照下列公式求解眾數(shù)的近似值。計(jì)算公式如下:
下限公式:/
或上限公式:/
L-眾數(shù)所在組的卜.限
U-眾數(shù)所在組的上限
fm~眾數(shù)所在組的次數(shù)
-眾數(shù)所在組前一組的次數(shù)
九.1一眾數(shù)所在組后一組的次數(shù)
〃一眾數(shù)所在組的組距
2.中位數(shù)
1)中位數(shù)是一組數(shù)據(jù)從小到大排序后位于中間位置上的變量值,一般用符號(hào)表達(dá)。
2)由于中位數(shù)和位置有關(guān),因此中位數(shù)只能度量定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)口勺集中趨勢(shì);
①求解中位數(shù)的環(huán)節(jié):
②首先,對(duì)數(shù)據(jù)進(jìn)行徘序;
3)另一方面,確定中位數(shù)的H立置,即中間位置;
4)最終,計(jì)算中間位置上的變量值。
①中位數(shù)的位置計(jì)算公式為:
數(shù)據(jù)個(gè)數(shù)n為奇數(shù),
②中位數(shù)為:/
③數(shù)據(jù)個(gè)數(shù)n為偶數(shù)
中位數(shù)為:/
④分組數(shù)據(jù)中位數(shù)的求解
對(duì)于分組數(shù)據(jù)而言,不需要再此外排序,直接按照分組日勺次序即可。
分組數(shù)據(jù)中位數(shù)日勺位置計(jì)算公式:
岫她跖¥(》,焰緲黝I(lǐng))
求出中位數(shù)位置后,按照卜列公式求解中位數(shù)的近似值。
下限公式:
ZjS
Mt%上+—^-------xrf(4.13)
-ftv
或上同公式:
)。所I
MnU——-----------xd(4.14)
t4(看例題P68)
5)中位數(shù)特點(diǎn)及應(yīng)用
6)中位數(shù)是位置型度量值,其特點(diǎn)是不受極端值的影響,因此具有穩(wěn)定性;
7)在實(shí)際運(yùn)用中,當(dāng)數(shù)據(jù)R勺偏斜程度較大時(shí),用中位數(shù)作為該組數(shù)據(jù)?般水平的代表值比
較合適。
8)分位數(shù)
①實(shí)際上,測(cè)度數(shù)據(jù)在特定位置上日勺水平,還可以計(jì)算四分位數(shù)、十分位數(shù)和百分位數(shù)
等,我們統(tǒng)稱它們?yōu)榉治粩?shù)。
四分位數(shù)的計(jì)算措施:
四分位數(shù):定義:一組數(shù)據(jù)由小到大排序后位于25%位置和75%位置處的變量值。
A.【位于在25%位置處的變量值(即下四分位數(shù),用符號(hào)QL表達(dá))和處在75%位置處U勺
變量值(即上四分位數(shù),用符號(hào)QU表達(dá)),上、下四分位數(shù)之間恰好包括了50%的數(shù)
據(jù)?!?/p>
B.求解四分位數(shù)的環(huán)節(jié)
a)先排序;
b)然后確定上、下四分位數(shù)的位置:
最終,求對(duì)應(yīng)位置上的變量值。(看例題P69)
Q位位13.(力蜴據(jù)幔)
44
9)箱線圖
將中位數(shù)、四分位數(shù)和其他指標(biāo)結(jié)合起來,可以更詳細(xì)的反應(yīng)數(shù)據(jù)的分布特性。箱線圖是由
一組數(shù)據(jù)的最小值(Xmin)、最大值(Xmax)、下四分位數(shù)(QL)、上四分位數(shù)(QU)
和中位數(shù)(Me)這五個(gè)特性值構(gòu)成。通過箱線圖,可以觀測(cè)數(shù)據(jù)H勺中心位置、離散程度及
對(duì)稱性等特性,同步還可以進(jìn)行多組數(shù)據(jù)分布的比較。
(三)算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者的比較與應(yīng)用
(1)算術(shù)平均數(shù)屬于數(shù)值型平均數(shù),它是根據(jù)所有數(shù)據(jù)計(jì)算日勺集中趨勢(shì)測(cè)度值,因此可以綜
合反應(yīng)所有數(shù)據(jù)口勺信息:眾數(shù)和中位數(shù)屬于位置型代表值,它們是根據(jù)數(shù)據(jù)分布的特定位置
確定出的集中趨勢(shì)測(cè)度值,因此不能概括所有數(shù)據(jù)日勺信息
(2)算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在且具有唯一性,但不一定所有數(shù)據(jù)都存
在眾數(shù),且眾數(shù)也不具有唯一-性。一般狀況下,在數(shù)據(jù)量充足大并且具有明顯集中趨勢(shì)時(shí),計(jì)
算眾數(shù)才故意義:
(3)算術(shù)平均數(shù)只合用于定量數(shù)據(jù),中位數(shù)合用于定序數(shù)據(jù)和定量數(shù)據(jù),眾數(shù)則合用于所有
數(shù)據(jù),即定性數(shù)據(jù)和定量數(shù)據(jù)均可;
(4)算術(shù)平均數(shù)受極端值的J影響,因此,當(dāng)數(shù)據(jù)偏斜程度較大時(shí)(數(shù)據(jù)中存在極端值),不
適宜用算術(shù)平均數(shù)來代表數(shù)據(jù)日勺一般水平。眾數(shù)和中位數(shù)不受極端值的影響,因此,當(dāng)數(shù)據(jù)
偏斜程度較大時(shí),可以考慮用眾數(shù)或中位數(shù)來代表數(shù)據(jù)日勺一般水平;
(5)算術(shù)平均數(shù)可以估L或推斷總體特性值。而眾數(shù)和中位數(shù)不適宜用作此類推斷
(6)算術(shù)平均數(shù)和眾數(shù)、中位數(shù)的數(shù)量關(guān)系重要取決于數(shù)據(jù)分布的偏斜程度(非對(duì)稱程
度)
對(duì)于展現(xiàn)單峰分布的數(shù)據(jù),假如數(shù)據(jù)口勺分布是對(duì)稱的I,則眾數(shù)M0、中位數(shù)Me和算術(shù)平均數(shù)
X三者相等,即MO=Me=X
假如數(shù)據(jù)展現(xiàn)左偏(負(fù)偏)分布,闡明數(shù)據(jù)中存在極小值
從而略使中位數(shù)偏小,而眾數(shù)則完全不受極小值大小和位置的影響,因此一般狀況下,三者的
關(guān)系體現(xiàn)為X<Me<MO
假如數(shù)據(jù)展現(xiàn)右偏(正偏)分布,則一般有:MOVMeVX
第二節(jié)(7)皮爾遜經(jīng)驗(yàn)公式數(shù)據(jù)展現(xiàn)偏斜但偏斜程度不大時(shí),算術(shù)
平均數(shù)、眾數(shù)和中位數(shù)之間存在一定的比例關(guān)系,即/
第三節(jié)數(shù)據(jù)離散程度的測(cè)定
一、離散程度測(cè)定問題的提出和作用
(一)離散程度測(cè)定問題的提出
由于差異性是數(shù)據(jù)口勺本質(zhì)屬性,因此各個(gè)數(shù)據(jù)與其分布中心之間總是存在著不一樣程度
的偏離。我們把數(shù)據(jù)偏離其中心值口勺程度叫做離散程度,離散程度可以闡明數(shù)據(jù)之間差異程
度的大小,那么怎樣測(cè)定一組數(shù)據(jù)H勺離散程度呢?
(二)離散程度測(cè)定的作用
離散程度的大小重要通過變異指標(biāo)來測(cè)定。變異指標(biāo)日勺重要作用有:
1.可以衡量平均指標(biāo)的代表程度。變異指標(biāo)值越大,則數(shù)據(jù)H勺離散程度越大、數(shù)據(jù)越分
散,繼而平均指標(biāo)H勺代表性就越弱;反之,變異指標(biāo)值越小,則數(shù)據(jù)口勺離散程度越小、數(shù)
據(jù)越集中,繼而平均指標(biāo)的代表性就越強(qiáng);
2.可以反應(yīng)數(shù)據(jù)的穩(wěn)定性卻均衡性。變異指標(biāo)值越大,則數(shù)據(jù)的離散程度越大,數(shù)據(jù)的穩(wěn)定
性和均衡性就越差;反之,則數(shù)據(jù)日勺離散程度越小,數(shù)據(jù)內(nèi)穩(wěn)定性和均衡性就越好。
二、離散程度H勺測(cè)定
(一)異眾比率
異眾比率是指非眾數(shù)組的頻數(shù)占總頻數(shù)的I比重,一般用Vr表達(dá),計(jì)算公式為:
fn
i.式中:/是眾數(shù)組的頻數(shù);/是變量值的總頻數(shù)
1)異眾比率H勺特點(diǎn):
可用來衡量眾數(shù)H勺代表性強(qiáng)弱,即,異眾比率越大,則眾數(shù)歐I代表性越弱;反之,眾數(shù)的代表
性就越強(qiáng);
異眾比率重要用于測(cè)度定性數(shù)據(jù)日勺離散程度,也可以用于定量數(shù)據(jù)離散程度口勺測(cè)度。
(二)極差、四分位差和平均差
1.極差
1)極差(Range)乂稱全龍,是一組數(shù)據(jù)中最大值與最小值之差,一般用R表達(dá)。計(jì)算公式
為:/
2)對(duì)于原始數(shù)據(jù)和單變量值分組數(shù)據(jù):/為?組數(shù)據(jù)日勺最大值;/為?組數(shù)據(jù)日勺最小值。
對(duì)于組距式分組數(shù)據(jù),極差就用變量值最大組的上限減去變量值最小組日勺卜.限近似得到。
極差的特點(diǎn):極差是變異指標(biāo)中最簡(jiǎn)樸的測(cè)度值,其長(zhǎng)處是計(jì)算簡(jiǎn)便、易于掌握。但因極差
只運(yùn)用了?組數(shù)據(jù)兩端的信息,輕易受到極端值的I影響。因此,極差不能全面、穩(wěn)定地反應(yīng)
數(shù)據(jù)的離散程度。
2.四分位差
1)四分位差是指上四分位數(shù)(QU)與下四分位數(shù)(QL)之差,因此也叫內(nèi)距或四分間距,
一般用表達(dá)。計(jì)算公式為:/
①四分位差特點(diǎn):
②四分位差只能闡明中間50%數(shù)據(jù)的離散程度,它仍然不能充足反應(yīng)所有數(shù)據(jù)的離散
狀況。四分位差越大,闡明中間50%數(shù)據(jù)的離散程度越大;四分位差越小,闡明中間
50%數(shù)據(jù)的離散程度越?。?/p>
在一定程度上,四分位差也可以反應(yīng)中位數(shù)的代表性好壞;
四分位差是一種次序記錄量,因此四分位差合用于測(cè)度定序數(shù)據(jù)和定量數(shù)據(jù)"勺禽散程度。
3.平均差
1)平均差(meandeviation)是各變量值與其算術(shù)平均數(shù)離差絕對(duì)值的平均數(shù)。因此,也稱平
均絕對(duì)離差,一般用M.D表達(dá)。
2)平均差的計(jì)算有兩種狀況
①簡(jiǎn)樸平均法
假如數(shù)據(jù)是未分組數(shù)據(jù)(原始數(shù)據(jù)),則用簡(jiǎn)樸算術(shù)平均法來計(jì)算平均差:
M.D=上------(〃為變量值個(gè)數(shù))
②加權(quán)平均法
假如數(shù)據(jù)是分組數(shù)據(jù),采用加權(quán)算術(shù)平均法來計(jì)算平均差:
二k,-司y;
M.D=q~i--------(左為組數(shù))
①平均差的特點(diǎn):
?:?平均差意義明確,計(jì)算成果易于理解,并且運(yùn)用了所有數(shù)據(jù)H勺信息,反應(yīng)了每個(gè)變量值與
平均數(shù)的平均差異程度。因此能全面地反應(yīng)一組數(shù)據(jù)的離散狀況。平均差越大,則數(shù)據(jù)
時(shí)離散程度越大;平均差越小,則數(shù)據(jù)的離散程度越?。?/p>
*為了防止正負(fù)離差互相抵消日勺現(xiàn)象發(fā)生,平均差在計(jì)算時(shí)給離差加上了絕對(duì)值。但由于
絕對(duì)值的)出現(xiàn)給計(jì)算帶來了很大口勺不便,因此在實(shí)際應(yīng)用中受到很大H勺限制。
*(三)方差和原則差
1)方差是各變量值與其算術(shù)平均數(shù)離差平方的J算術(shù)平均數(shù)。原則差就是方差的平方
根。
①方差、原則差特點(diǎn):
2)方差、原則差運(yùn)用了所有數(shù)據(jù)的信息,能很好地反應(yīng)數(shù)據(jù)日勺離散程度;
3)方差、原則差是通過平方的措施消去離差的正負(fù)號(hào),這更便于數(shù)學(xué)上日勺處理。為此,
方差、原則差是記錄中最重要的變異指標(biāo),同步也是實(shí)際中應(yīng)用最廣泛歐I離散程度
測(cè)度值。
4)方差、原則差計(jì)算公式
總體數(shù)據(jù)
①未分組數(shù)據(jù)(原始數(shù)據(jù))的總體方差和標(biāo)準(zhǔn)差的計(jì)算公式分別為:
(4.20)
②分組數(shù)據(jù)的總體方差和標(biāo)準(zhǔn)差的汁算公式分別為:
?(X,-“)2£區(qū)(X,-〃)2/
b?=q---------------,b=q-----------------(K為組數(shù))(4.21)
SzVSr/
Z-lIr=l
樣本數(shù)據(jù)
①未分組數(shù)據(jù)(原始數(shù)據(jù))的樣本方差和樣本原則差的計(jì)算公式分別為:
£(%一斤)2忙區(qū)一方
S2=----------------S=--------------
77-11W-1
②分組數(shù)據(jù)H勺樣本方差和樣本原則差的計(jì)算公式分別為:
之(k-/之(X一斤)2/
_/=i/=1_________________
一kiz-i
Ez-i
/=1I(k為組數(shù))
。(四)原則化值(原則分?jǐn)?shù))
原則化值就是用各變量值與其平均數(shù)的離差再除以其原則差。
原則化值U勺計(jì)算公式為:
X,-X
zi=---------
S
1)原則化值日勺特點(diǎn):
2)原則化值具有均值為0,原則差為1的特性。
3)經(jīng)驗(yàn)法則【3。質(zhì)量管理法則的原理】
?使用條件:在正態(tài)分布或近似正態(tài)分布(對(duì)稱的鐘型分布)的條件下
?大概有68%的數(shù)據(jù)位于均值土1個(gè)原則差范圍內(nèi);
?大概有95%的數(shù)據(jù)位于均值±2個(gè)原則差范圍內(nèi):
?大概有99%的數(shù)據(jù)位于均值±3個(gè)原則差范圍內(nèi)
4)切比雪夫定理
運(yùn)用切比雪夫定理來判斷有多少的I數(shù)據(jù)落入以均值為中心的k(原則化值)個(gè)原則差
范圍內(nèi)。
?使用條件:任意分布形態(tài)的數(shù)據(jù):
?根據(jù)切比雪夫定理的I內(nèi)容,至少有(/)的數(shù)據(jù)落入均值左右k個(gè)原則差范圍內(nèi),其
中k為不小于1的任意數(shù),當(dāng)然也可認(rèn)為小數(shù)。
?k=2闡明至少有75%歐J數(shù)據(jù)落入均值±2個(gè)原則差范圍內(nèi);
?k=3闡明至少有89%的數(shù)據(jù)落入均值±3個(gè)原則差范圍內(nèi);
?k=4闡明至少有94%的數(shù)據(jù)落入均值±4個(gè)原則差范圍內(nèi)。
(五)離散系數(shù)
?離散系數(shù)也稱變異系數(shù)(coefficientofvariation),它是極差、四分位差、平均差或原
則差等變異指標(biāo)與其算術(shù)平均數(shù)對(duì)比的成果。
?常用的離散系數(shù)有極差系數(shù)、平均差系數(shù)和原則差系數(shù),但應(yīng)用最廣泛的是原則差系
數(shù)。
原則差系數(shù)的計(jì)算公式:
(1)對(duì)于總體數(shù)據(jù),其標(biāo)準(zhǔn)差系數(shù)計(jì)算公式為:
va=-(4.25)
4
其中:匕為總體標(biāo)準(zhǔn)差系數(shù),。為總體標(biāo)準(zhǔn)差,〃為總體算術(shù)平均數(shù)。
(2)對(duì)于樣本數(shù)據(jù),其標(biāo)準(zhǔn)差系數(shù)計(jì)算公式為:
S
v==(4.26)
X
其中:匕為樣本標(biāo)準(zhǔn)差系數(shù),S為樣本標(biāo)準(zhǔn)差,又為樣本算術(shù)平均數(shù)。
?離散系數(shù)H勺作用
離散系數(shù)是測(cè)度數(shù)據(jù)嗡散程度的相對(duì)記錄量,可用于比較不一樣變量值水平或不一樣計(jì)
量單位的不一樣組別數(shù)據(jù)的離散程度。離散系數(shù)大日勺,則該組數(shù)據(jù)的離散程度就大;離散系
數(shù)小I包則該組數(shù)據(jù)的離散程度就小。
總結(jié):反應(yīng)數(shù)據(jù)離散程度的各測(cè)定值的應(yīng)用場(chǎng)所
1)對(duì)于分類數(shù)據(jù),重要用異眾比率來測(cè)度其離散程度;
2)對(duì)于次序數(shù)據(jù),重要用四分位差來測(cè)度其離散程度;
3)對(duì)于數(shù)值型數(shù)據(jù),重要用方差或原則差來測(cè)度其離散程度.
4)當(dāng)需要對(duì)不?樣組別數(shù)據(jù)的離散程度進(jìn)行比較時(shí),則使用離散系數(shù)。
第三節(jié)數(shù)據(jù)分布形態(tài)的測(cè)定
一、分布形態(tài)測(cè)定問題的提出和作用
(一)分布形態(tài)測(cè)定問題的提出
集中趨勢(shì)和離散程度是數(shù)據(jù)分布特性H勺兩個(gè)重要方面,但要想全面理解數(shù)據(jù)的分布特點(diǎn),
我們還需要懂得數(shù)據(jù)的分布形狀,那么怎樣測(cè)定一組數(shù)據(jù)日勺分布形狀呢?
(二)分布形態(tài)測(cè)定時(shí)作用
通過度布形態(tài)日勺測(cè)定,我們可以理解數(shù)據(jù)分布形狀的對(duì)稱性以及分布曲線的扁平陡峭程
度。將這兩點(diǎn)結(jié)合,我們還可以判斷數(shù)據(jù)與否靠近于正態(tài)分布。
二、矩
1.數(shù)據(jù)分布形態(tài)的測(cè)度重要是通過偏度系數(shù)和峰度系數(shù)來實(shí)現(xiàn)的。矩又是計(jì)算偏度系數(shù)
和峰度系數(shù)曰勺基礎(chǔ)
2.矩可分為總體矩和樣本矩
樣本距
一般來說,將一組樣本Xl/-,Xn與其算術(shù)平均數(shù)X離差的k次方的平均數(shù)稱為樣本的Jk階中
心矩,即/
其中,儲(chǔ)為各組變量值,為各組變量值的權(quán)數(shù)。可以看出,一階原點(diǎn)矩即樣本算術(shù)平
均數(shù)。
算術(shù)平均數(shù):一階原點(diǎn)矩
方差:二階中心矩
階數(shù)k=3和k=4時(shí),矩則可以反應(yīng)數(shù)據(jù)的分布形態(tài)特性。矩可以當(dāng)作是一系列反應(yīng)數(shù)據(jù)分布
特性指標(biāo)時(shí)統(tǒng)稱。
三、偏度
偏度(skewness)是指數(shù)據(jù)分布的不對(duì)稱程度或偏斜程度。偏度也就是對(duì)數(shù)據(jù)非對(duì)稱程度
和方向的測(cè)度。用來測(cè)定偏度的記錄量是偏度系數(shù),記作SK。
對(duì)于分組數(shù)據(jù),偏度系數(shù)SK的計(jì)算公式為:
SK=2
S'
其中,出為樣本的3階中心理,S,為樣本標(biāo)準(zhǔn)差的三次方。
①偏態(tài)系數(shù)性質(zhì):
②假如分布是對(duì)稱的,則SK=O;
?假如SKWO,闡明分布是非對(duì)稱的,
當(dāng)SK>0時(shí),表明分布是右偏分布(正偏分布);
當(dāng)SK<0時(shí),表明分布是左偏分布(負(fù)偏分布)。SK的數(shù)值越大,表明數(shù)據(jù)的偏斜程度越
大。
四、峰度
1.峰度(kurtosis)是指數(shù)據(jù)分布曲線的陡峭或扁平的程度。
對(duì)峰度的度量一般以正態(tài)分布曲線為原則進(jìn)行比較,假如比正態(tài)分布曲線愈加尖峭,稱
為尖峰分布;假如比正態(tài)分布曲線愈加扁平,稱為扁平分布。
測(cè)度峰度日勺記錄量是峰度系數(shù),記作Ko
對(duì)于分組數(shù)據(jù),峰度系數(shù)K的計(jì)算公式為:
K=2?3
S4片中.4為樣本的4階中心矩.S"為樣本標(biāo)準(zhǔn)參的四次方,
?峰態(tài)系數(shù)性質(zhì):
?當(dāng)K=0時(shí),闡明分布為正態(tài)分布;
當(dāng)K>0時(shí),闡明曲線是尖峰(陡峭)分布,即數(shù)據(jù)比正態(tài)分布更集中,K的數(shù)值越大,則曲線
越陡峭;
當(dāng)K<0時(shí),闡明曲線是扁平分布,即數(shù)據(jù)比正態(tài)分布更分散,K的數(shù)值越小,則曲線越平緩。
第五章抽樣分布
第一節(jié)抽樣分布基本概念
一、樣本容量和樣本個(gè)數(shù)
1.總體是研究口勺所有個(gè)體構(gòu)成的集合,常用表達(dá)
二、從中隨機(jī)抽取部分個(gè)體構(gòu)成一種樣本,構(gòu)成樣本H勺個(gè)體的數(shù)目,常用n表達(dá),稱為樣
本容量,也稱樣本量。
三、參數(shù)和記錄量
1.參數(shù)是用來描述總體數(shù)量特性H勺,如總體均值U、總體比例n、總體方差。2等
2.記錄量是用來描述樣本數(shù)量特性日勺,是由樣本構(gòu)造的函數(shù),如樣本均值X、樣本比例P、
樣本方差S2等
3.由于總體是唯一的、固定不變H勺,故參數(shù)往往是一種未知時(shí)常數(shù);而樣本不唯一,且一
旦抽取出來,就成為已知,故記錄量是隨機(jī)變量,其取值伴隨樣本日勺變化而變化。
4.抽樣的目的就是要根據(jù)樣本記錄量去估計(jì)或推斷總體參數(shù)。
四、抽樣分布
1.記錄量是隨機(jī)變量。抽樣分布就是記錄量的概率分布
2.樣本均值的概率分布、樣本比例的概率分布、樣本方差的概率分布等都稱為抽樣分
布。
五、現(xiàn)實(shí)世界中,我們面對(duì)日勺總體往往很大,進(jìn)而樣本數(shù)目將很可觀,不也許將所有的樣
本都抽取出來。因此抽樣分布實(shí)質(zhì)上是一種理論分布。它也許是精確的某已知分布,也
也許是以某已知分布為極限U勺極限分布。
六、抽樣分布理論在準(zhǔn)斷記錄中具有重要的作用,它是后續(xù)參數(shù)估計(jì)和假設(shè)檢查的
理論根據(jù)和基礎(chǔ)。
七、抽樣分布的數(shù)字特性
(-)樣本均值的數(shù)字特性
設(shè)總體的平均數(shù)為U,方差為。2,采用反復(fù)抽樣的方式,從中抽取獨(dú)立同分布
的樣本:XI,…,Xno根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本均值X數(shù)學(xué)期望(平均
數(shù))、方差與總體的平均數(shù)、方差之間的J關(guān)系
E(又)=〃丫=〃b鱉
X101520253035404550
Pj_2_2£^£211
例題:252525252525252525
樣本均值的J平均數(shù)
121750
〃=10x—+15x—+--+50X—=—=30
'25252525
總體均值
/7=1X(10+20+30+40+50)=30
樣本均值U勺方差
《啕中-[麗閆卿確刑
總體方差
An=2
由式(5.1)可知:牙的平均數(shù)為4,
方差為0%。隨著〃的增大,其方差越來越
小,從而牙的取值越來越向著4堂攏,故用
1》去估計(jì)〃理論依據(jù)成立。]
2.以上結(jié)論均建立在反復(fù)抽樣情形下,
若是在不反復(fù)抽樣情形下,方差需要用系數(shù)進(jìn)行修正,從而樣本均值的數(shù)字特性為:
(-)樣本比例的數(shù)字特性
比例:總體(或樣本〕中具有某種屬性的個(gè)體數(shù)與所有個(gè)體數(shù)之比,總體比例記為冗。
根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本比例P日勺數(shù)學(xué)期望、方差與總體的平均數(shù)、方
差之間口勺關(guān)系:
E(p)=%=兀b:=不(1一乃)
n
用P估計(jì)”理論根據(jù)成立
以上結(jié)論均建立在反復(fù)抽樣情形卜,若是在不反發(fā)抽樣情形卜,當(dāng)樣本容量很大時(shí),方差
需要用系數(shù)進(jìn)行修正,從而樣本比例的數(shù)字特性為:
E(p)=-L個(gè)子
(三)樣本方差的數(shù)字特性
設(shè)總體X方差為。2,采用反復(fù)抽樣
的方式,從中抽取獨(dú)立同分布H勺樣本:X1…,Xn根據(jù)數(shù)學(xué)期望和方差的性質(zhì),可推出樣本
方差的數(shù)學(xué)期望、方差與總體H勺方差之間的關(guān)系為:
/I—1
以上結(jié)論均建立在反復(fù)抽樣情形下,若是在不反復(fù)抽樣情形下,方差需要用系數(shù)進(jìn)行修
正,從而樣本方差的數(shù)字特性為
r?■.,
2a41N-n?
E(S2)=cr2cr2,=
〃工'二L:
(四)原則誤(重點(diǎn))
?記錄量抽樣分布的原則差,稱為記錄量的原則誤,也稱原則誤差
?原則誤可用于闡明抽樣誤差的大小。抽樣誤差是指由抽樣的隨機(jī)性引起的樣本成果
與總體的真實(shí)值之間的差異,它描述的是所有樣本也許的成果與總體真值之間的平均性
差異。若總體原則差未知,可用樣本原則差替代,此時(shí)I向原則誤稱為估計(jì)原則誤。
?樣本均值的原則誤為。x
?樣本比例口勺原則誤為。P
?樣本方差H勺原則誤為。s:
第二節(jié)幾種常見的抽樣分布
一、樣本均值的抽樣分布
1.樣本均值的抽樣分布,就是采用反復(fù)抽樣的I方式,選用容量為的所有樣本,由樣本均值
所有也許的取值形成的概率分布。
2.分兩種狀況來討論樣本均值的抽樣分布類型。
1)總體服從正態(tài)分布
a)正態(tài)分布的再生定理;若總體變量X?N(口,。2),從這個(gè)總體中抽取容量為n的樣本,
則樣本均值X?N(U,o2/n)
b)什么是正態(tài)分布
1
/(.V)=―)Le統(tǒng)一8VKV400
若X的概率密度函數(shù)為:727rb
其中,U和。都是參數(shù),且。>0,則稱X服從參數(shù)為U和。的正態(tài)分布,記作
X?N”,02)。
正態(tài)分布的概率密度曲線是一條對(duì)稱的鐘型曲線。U決定了圖形的中位置,。決定了圖形
中曲線的陡峭程度。
2)當(dāng)參數(shù)U=0,。=1時(shí),這樣的正態(tài)分布為原則正態(tài)分布,記為N(0,1),其概率密度函
數(shù)為:/
3)總體服從非正態(tài)分布
獨(dú)立同分布中心極限定理表明:無論總體服從何種分布,只要其平均數(shù)和方差
存在,那么從中抽取的獨(dú)立同分布樣本XI,…Xn,,其均值在當(dāng)n很大時(shí),就會(huì)近似
服從正態(tài)分布X?N(U,02)o
大樣本:n230
總體("b?)
JE態(tài)分布j態(tài)分徐
人樣本小樣本
總結(jié):燒傘箕謝D"非正態(tài)分布
?二、樣本比例的抽樣分布
1.樣本比例是一種特殊的樣本均值。從而,根據(jù)樣本均值的抽樣分布理論可得樣本比例
的抽樣分布
2.大樣本:同步滿足npWS和n(1-p)N5
當(dāng)樣本容量很大時(shí),樣本比例P的抽樣分布為:
-4)、
P~/V
n
在不反復(fù)抽樣情形下,當(dāng)樣本容量很大時(shí),樣本比例的抽祥分布為:
萬(1-4)N-n
P~萬,
nN-1?
?需要修正:對(duì)于有限總體,要用修正系數(shù)修正
不需要修正:無限總體/此時(shí)N很大而抽樣比時(shí),修正系數(shù)趨于1,方差可以按反復(fù)抽樣情
形時(shí)(即不用修正)的公式計(jì)算
?:?三、樣本方差的抽樣分布(不考)
樣本方差S2的抽樣分布,就是采用反復(fù)抽樣的方式,選用容量為n的所有樣本,由樣本方差
S2的所有也許的取值形成的概率分布。
設(shè)總體服從均值為U,方差S2的正態(tài)分布,XI…,Xn為來自該總體的樣本,則樣本方差S2K
抽樣分布為:
稱(〃一1卜服從自由度為n-1的X?分布(卡方分布)。
卡方分布的數(shù)字特性,可得:
ES)=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年木材回收合同
- 2026年醫(yī)療服務(wù)績(jī)效考核合同
- 2026年土地規(guī)劃設(shè)計(jì)合同
- 2025年大數(shù)據(jù)分析與處理服務(wù)項(xiàng)目可行性研究報(bào)告
- 2025年文化遺產(chǎn)保護(hù)與修復(fù)項(xiàng)目可行性研究報(bào)告
- 2025年數(shù)字內(nèi)容制作平臺(tái)可行性研究報(bào)告
- 置換協(xié)議補(bǔ)充合同
- 中巴合作協(xié)議書
- 2025年快速消費(fèi)品電商平臺(tái)開發(fā)項(xiàng)目可行性研究報(bào)告
- 高考全國(guó)卷政治考試題庫(kù)含答案
- 2025年煙花爆竹經(jīng)營(yíng)單位安全管理人員考試試題及答案
- 2025天津大學(xué)管理崗位集中招聘15人參考筆試試題及答案解析
- 2025廣東廣州黃埔區(qū)第二次招聘社區(qū)專職工作人員50人考試筆試備考題庫(kù)及答案解析
- 2025年云南省人民檢察院聘用制書記員招聘(22人)考試筆試參考題庫(kù)及答案解析
- 2026屆上海市青浦區(qū)高三一模數(shù)學(xué)試卷和答案
- 2026年重慶安全技術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)附答案
- 環(huán)衛(wèi)設(shè)施設(shè)備采購(gòu)項(xiàng)目投標(biāo)方案投標(biāo)文件(技術(shù)方案)
- 旋挖鉆機(jī)地基承載力驗(yàn)算2017.7
- DB44-T 2197-2019配電房運(yùn)維服務(wù)規(guī)范-(高清現(xiàn)行)
- 小學(xué)音樂 花城版 五年級(jí)上冊(cè) 鴻雁 課件
- 《現(xiàn)代漢語(yǔ)詞匯》PPT課件(完整版)
評(píng)論
0/150
提交評(píng)論