第三章 統(tǒng)計數(shù)據(jù)整理與顯示_第1頁
第三章 統(tǒng)計數(shù)據(jù)整理與顯示_第2頁
第三章 統(tǒng)計數(shù)據(jù)整理與顯示_第3頁
第三章 統(tǒng)計數(shù)據(jù)整理與顯示_第4頁
第三章 統(tǒng)計數(shù)據(jù)整理與顯示_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章統(tǒng)計數(shù)據(jù)整理與顯示學習目標理解數(shù)據(jù)整理的意義及一般步驟深刻理解統(tǒng)計分組在數(shù)據(jù)整理中所起的重要作用掌握次數(shù)分布表的編制方法了解統(tǒng)計表的設計要求了解統(tǒng)計圖的種類及適用場合

第一節(jié)統(tǒng)計數(shù)據(jù)整理

的意義及步驟

一、統(tǒng)計數(shù)據(jù)整理的意義

統(tǒng)計數(shù)據(jù)整理即統(tǒng)計整理,就是根據(jù)統(tǒng)計研究的任務,對搜集得到的原始數(shù)據(jù)進行審核、分組、匯總,使之條理化,系統(tǒng)化,變成能反映各組及總體特征的綜合數(shù)據(jù)的工作過程。對已整理過的資料(包括歷史資料)進行再加工也屬于統(tǒng)計整理。統(tǒng)計整理的意義表現(xiàn)在以下三個方面:統(tǒng)計整理是我們對客觀事物從感性認識上升到理性認識的連接點。通過調查取得的資料只是我們對事物的一種感性認識,只是事物的表象。統(tǒng)計整理是進行統(tǒng)計分析的前提。數(shù)據(jù)整理在整個統(tǒng)計研究中占有重要地位。二、統(tǒng)計數(shù)據(jù)整理的步驟

統(tǒng)計數(shù)據(jù)整理是將搜集到的原始數(shù)據(jù)條理化、系統(tǒng)化,使之符合統(tǒng)計分析與推斷的要求。通過整理可以大大簡化數(shù)據(jù),更有效地顯示和提供所包含的統(tǒng)計信息。根據(jù)統(tǒng)計研究的目的和內容,統(tǒng)計整理一般分為以下幾個步驟:1.擬定整理方案2.數(shù)據(jù)預處理3.統(tǒng)計分組或分類4.統(tǒng)計匯總5.編制統(tǒng)計表、繪制統(tǒng)計圖1.擬定整理方案整理方案是數(shù)據(jù)整理工作的指導性文件,體現(xiàn)了整理工作的具體規(guī)劃和要求,主要內容是確定數(shù)據(jù)預處理方法、分組或分類匯總的方式方法、人員及工作進程安排等。在實際工作中,整理方案就是一系列匯總表式的總稱,包括一套綜合匯總表、填表說明、統(tǒng)一的分類標準或目錄等。整理方案的正確性和合理性是保證數(shù)據(jù)整理工作有計劃并順利進行的基礎,方案設計應力求科學、周密。

2.數(shù)據(jù)預處理數(shù)據(jù)預處理是在數(shù)據(jù)分組或分類之前所做的必要處理,包括數(shù)據(jù)的審核和篩選。數(shù)據(jù)的審核數(shù)據(jù)的篩選3.統(tǒng)計分組或分類

統(tǒng)計分組或分類是數(shù)據(jù)整理的關鍵環(huán)節(jié),也是一切統(tǒng)計研究的基礎,在統(tǒng)計研究中占有重要地位。有關統(tǒng)計分組或分類的詳細內容在下一節(jié)再做詳細論述。4.統(tǒng)計匯總

在統(tǒng)計分組基礎上,將所有數(shù)據(jù)分別歸納到各組中去,計算各組單位數(shù)和總體單位數(shù),計算出各組指標和總體指標的數(shù)值,使反映總體單位的資料轉化為反映總體綜合數(shù)量特征的過程稱為統(tǒng)計匯總或數(shù)據(jù)匯總。

數(shù)據(jù)匯總技術主要有手工匯總和計算機匯總兩種。手工匯總是借助算盤和小型計算器等手工操作方式進行的匯總。

5.編制統(tǒng)計表、繪制統(tǒng)計圖數(shù)據(jù)分組和匯總后,將匯總得到的各項資料編制成各種統(tǒng)計表,再將表中的數(shù)據(jù)繪制成不同形狀的統(tǒng)計圖。統(tǒng)計表和統(tǒng)計圖是數(shù)據(jù)整理結果的基本表現(xiàn)形式,可以更加直觀、簡明地反映客觀現(xiàn)象數(shù)量方面的具體表現(xiàn)和有關聯(lián)系,便于進一步的數(shù)據(jù)分析。第二節(jié)統(tǒng)計分組或分類

一、統(tǒng)計分組的概念

根據(jù)統(tǒng)計研究目的和現(xiàn)象的內在特點,將現(xiàn)象總體按照某一(或某些)標志劃分為性質不同的組成部分,稱為統(tǒng)計分組或分類。通過分組,將現(xiàn)象總體區(qū)分為性質不同的幾個部分,使性質不同的單位分開,性質相同的單位合在一個組內,這樣有助于從數(shù)量方面揭示總體內部各部分的關系,更深入地研究總體的特征和規(guī)律性。

二、統(tǒng)計分組的作用

統(tǒng)計分組的作用主要表現(xiàn)在以下幾個方面:1、劃分社會經濟類型。統(tǒng)計分組是確定社會經濟現(xiàn)象各種類型的基礎,例如將國民經濟按三個產業(yè)劃分,將工業(yè)企業(yè)按所有制的不同劃分、按輕重工業(yè)劃分,居民按城鎮(zhèn)、農村劃分,從而說明不同的經濟類型的特點。一般來說,社會經濟類型的分組多采用品質標志來劃分。

2.研究總體內部的結構通過統(tǒng)計分組可以反映總體內部各部分之間的差別和相互關系,表明總體的內部結構同時在各組的基礎上計算各組所占總體的比重,從總體的構成上認識總體各部分的作用,并對總體作出正確的評價。3、分析現(xiàn)象之間的依存關系社會經濟現(xiàn)象之間存在著相互制約、相互聯(lián)系的關系,通過統(tǒng)計分組可以根據(jù)現(xiàn)象間的影響因素和結果因素的對應更好地揭示現(xiàn)象之間的這種依存關系。

三、統(tǒng)計分組的方法

1.正確選擇分組標志分組標志的選擇是統(tǒng)計分組的關鍵。分組標志,即將同質總體區(qū)分為不同組的標準或依據(jù)。分組標志一旦選定,就必然突出了總體在該標志下的性質差別,其他的差別看不見了。分組標志選擇不當,不但無法顯示現(xiàn)象的根本特征,甚至會混淆事物的性質,歪曲社會經濟的真實情況。

2.按品質標志或按數(shù)量標志分組

統(tǒng)計分組根據(jù)分組標志的性質不同可分為按品質標志分組和按數(shù)量標志分組。按品質標志分組即定性數(shù)據(jù)的分組;按數(shù)量標志分組即定量數(shù)據(jù)的分組。

按品質標志分組

按品質標志分組就是用反映事物的屬性、性質的標志分組,它可以將總體單位劃分為若干性質不同的類型。例按職工性別、民族、文化程度的分類。品質標志分組一般較簡單,分組標志一旦確定,組數(shù)、組名、組與組之間的界限也就隨之確定。有些復雜的品質標志分組可根據(jù)統(tǒng)一規(guī)定的劃分標準和分類目錄進行。

按數(shù)量標志分組

按數(shù)量標志分組的目的并不是單純確定各組在數(shù)量上的差別,而是要通過數(shù)量上的差別來區(qū)分各組的性質,反映總體本質的特征。因此,在按數(shù)量標志進行分組時,應當根據(jù)研究目的,首先確定總體在已選定的數(shù)量標志的特征下有多少種性質不同的組成部分,然后再研究確定各組成部分的數(shù)量界限,使分組的數(shù)量界限能夠區(qū)分現(xiàn)象性質上的差別。數(shù)量標志分組方法從以下幾個方面來說明:

單項式分組和組距式分組等距分組和不等距分組組限重疊和組限不重疊

1)單項式分組和組距式分組

對于離散型變量,如果變量值的變動幅度小,變化又很均勻,就可以一個變量值對應一組,稱單項式分組。如居民家庭按兒童數(shù)或人口數(shù)分組、紡織工人按看管機器臺數(shù)分組等均可采用單項式分組。離散型變量如果變量值的變動幅度很大,變量值的個數(shù)很多,這時若采用單項式分組,很可能出現(xiàn)組數(shù)過多,各組又沒有幾個單位的情況,不能很好地反映總體各單位在各組的分布狀況,從而失去分組的意義。比如,按職工人數(shù)對工業(yè)企業(yè)進行分組,由于各企業(yè)職工人數(shù)差別很大,采用單項式分組就很不現(xiàn)實,這就需要采用組距式分組。對于連續(xù)型變量,由于其變量值是連續(xù)不斷的,不能一一列舉,故不能采用單項式分組,只能采用組距式分組。把全部變量值依次劃分為幾個區(qū)間,各個變量值則按其大小確定所歸并的區(qū)間,區(qū)間的距離稱為組距,這樣的分組稱為組距式分組。在組距式分組中,被分成的各個組不是一個具體的數(shù)值,而是一個數(shù)值區(qū)間。用于表示各組數(shù)量界限的變量值稱為組限,其中組內的最小值為該組的下限,最大值為該組的上線。進行組距式分組,組距和組數(shù)的確定是很重要的。確定組距和組數(shù)時,應以能夠顯示數(shù)據(jù)分布特征和規(guī)律為目的,還應考慮到組內的同質性。如果組距過大,組數(shù)過少,分組雖然簡單,但可能將性質不同的單位分在同一組內,數(shù)據(jù)分布特征的真實性將受到影響。如果組距過小,組數(shù)過多,則數(shù)據(jù)的分布又過于分散,不便于了解數(shù)據(jù)分布的集中趨勢??傊?,分組時應根據(jù)統(tǒng)計研究目的和數(shù)據(jù)本身的特點,確定適當?shù)慕M距與組數(shù)。2)等距分組和不等距分組組距式分組有等距分組和不等距分組之分。各組的組距都相等的分組,稱為等距分組。各組組距不都相等的分組,稱為不等距分組,也叫異距分組。如果變量值變動比較均勻,則可以采用等距分組;如果變量值變動很不均勻,變動幅度較大,則需要采用不等距分組。比如,對人口總體按年齡分組,可根據(jù)人口成長的生理特點分成0—6歲(嬰幼兒組)、7—17歲(少兒組)、18—59歲(中青年組)、60歲以上(老年組)等四組。具體分組時采用那一種組距,要根據(jù)總體性質和研究目的而定。一般情況下盡量采用等距分組,以便于比較分析數(shù)據(jù)的頻數(shù)分布特征。3)組限重疊和組限不重疊的分組劃分組距式分組的分組界限是統(tǒng)計分組的又一關鍵問題。采用組距式分組時,各組組限的劃分應遵循“不重不漏”的原則。“不重”,是指一項數(shù)據(jù)只能分在其中的某一組,不能在其他組中重復出現(xiàn);“不漏”,是指組別必須窮盡,即所分的全部組別要包含所有數(shù)據(jù),不能遺漏任何一項。為解決“不重”問題,對于離散型變量,可以采用相鄰組限間斷(不重疊)的辦法。比如,企業(yè)按工人人數(shù)分組可表示為:199人以下、200—499人、500—999人、1000—1999人、2000人以上等。而對于連續(xù)型變量,則必須采用相鄰組限重疊的方法,通常根據(jù)“上組限不在本組內”的規(guī)定解決不重的問題,即在分組時,采用某一組的上限同時也是下一組的下限這樣的重疊組限,剛好等于某一組上限的變量值不計算在本組內,而計算在下一組內。。比如,學生按考試成績分組,分為:60分以下、60—70分、70—80分、80—90分、90分以上五組,70分這個變量值既是60—70分這一組的上限也是70—80分這一組的下限,在分組時,70分不計算在60—70分這一組內,而是把它歸到70—80分這一組。為便于計算分析,對于離散型變量也可以采用相鄰兩組組限重疊的方法,一般遵循“上組限不在本組內”的規(guī)定解決“不重”問題在組距式分組中,如果數(shù)值中有極大值或極小值存在,為避免出現(xiàn)空白組或個別極端值被漏掉,第一組和最后一組可以采用“xx以下”及“xx以上”這樣的開口組。組距式分組掩蓋了組內數(shù)據(jù)分布的狀況,為反映各組數(shù)據(jù)的一般水平,通常用組中值作為該組數(shù)據(jù)的一個代表值。每組上下限之間的中點數(shù)值稱為組中值,即組中值=(上限+下限)/2.開口組的組中值一般是參考相鄰組的組距計算,公式為:缺下限的開口組的組中值=上限-相鄰組組距/2缺上限的開口組的組中值=下限+相鄰組組距/2使用組中值代表數(shù)據(jù)的一般水平時,通常假定各組數(shù)據(jù)在本組內呈均勻分布,若不滿足假定條件,用組中值作為一組數(shù)據(jù)的代表值就會有一定的誤差。綜上所述,離散型變量根據(jù)實際情況既可采用單項式分組,也可采用組距式分組,組限既可重疊,也可不重疊;連續(xù)型變量只能采用組距式分組,并且組限必須重疊。3.簡單分組和復合分組

根據(jù)數(shù)據(jù)分析的需要,可以對調查數(shù)據(jù)進行簡單分組或復合分組。所謂簡單分組,是指對總體只按一個標志進行的分組。比如,人口總體只按性別分組,學生總體只按考試成績分組等。所謂復合分組,是指對研究總體按兩個或兩個以上標志進行的多層次分組,比如,職工總體先按技術級別分組,在此基礎上再按性別分組,形成如下復合分組:職工初級中級高級女性男性女性女性男性男性4統(tǒng)計分組體系1).平行分組體系

平行分組體系就是對同一總體同時選擇兩個或兩個以上的標志分別進行簡單分組,然后并列在一起就形成了平行分組體系。2).復合分組體系

復合分組體系就是將總體按兩個或兩個以上的標志結合起來進行層疊分組,形成復合分組體系。第三節(jié)次數(shù)分布

一、次數(shù)分布的概念次數(shù)分布是指將總體中的所有單位按某個標志分組后,所形成的總體單位數(shù)在各組之間的分布。分布在各組的總體單位數(shù)叫做次數(shù)或頻數(shù)。各組次數(shù)與總次數(shù)之比叫做比重、比率或頻率。次數(shù)分布是統(tǒng)計分組的必然結果。是反映統(tǒng)計總體中所有單位在各組間的分布狀態(tài)和分布特征的一個數(shù)列,因此也可以稱為次數(shù)分布數(shù)列、頻數(shù)分布數(shù)列,簡稱分布數(shù)列,或分配數(shù)列。例如,人口按性別分組后形成的人口數(shù)在各組分布情況的數(shù)列;學生按年齡分組后形成的學生人數(shù)在各組分布情況的數(shù)列等,都是次數(shù)分布數(shù)列。次數(shù)分布數(shù)列主要由各組名稱(或各組變量值)與各組單位數(shù)(次數(shù)或頻數(shù))兩部分構成。有時也可把比重(頻率)列入分布數(shù)列中。(比重也叫頻率,是各組頻數(shù)與總頻數(shù)之比,它的數(shù)值永遠大于0而小于100%)分布數(shù)列的形式很簡單,但它是統(tǒng)計整理的重要表現(xiàn)形式,在統(tǒng)計研究中具有重要的意義。分布數(shù)列直觀地表明了總體單位的分布特征和結構狀況,在此基礎上還可進一步研究其構成、平均水平及其變動規(guī)律,它是進行統(tǒng)計分析的一種重要手段。根據(jù)分組標志的性質不同,分布數(shù)列可分為品質分布數(shù)列和變量分布數(shù)列。按品質標志分組形成的分布數(shù)列叫品質分布數(shù)列,簡稱品質數(shù)列;按數(shù)量標志分組形成的數(shù)列叫變量分布數(shù)列,簡稱變量數(shù)列。

二、變量數(shù)列的種類

變量數(shù)量有單項式變量數(shù)列和組距式變量數(shù)列兩種。數(shù)值型變量按單項式進行分組后,計算各組的單位數(shù),形成的數(shù)列叫單項式數(shù)列。數(shù)值型變量按組距式分組后,計算各組的單位數(shù),形成的數(shù)列稱為組距式數(shù)列。因為組距有等距和不等距之分,因此分布數(shù)列也有等距數(shù)列和異距數(shù)列之分。三、變量數(shù)列的編制變量數(shù)列的編制一般采用如下幾個步驟:1.將原始資料按其數(shù)值大小重新排列2.確定全距3.確定組距和組數(shù)4.確定組限5.編制變量數(shù)列

四、次數(shù)分布的主要類型

各種不同性質的現(xiàn)象有著各自特殊的次數(shù)分布。我們在編制分布數(shù)列時就要考慮該現(xiàn)象本身的特點,盡量與現(xiàn)象的分布特征一致。概括起來,社會經濟現(xiàn)象主要有鐘型、U型和J型三種分布類型。1.鐘型分布(正態(tài)分布)鐘型分布的特征是“兩頭小,中間大”,即靠近中間的變量值分布的次數(shù)多,靠近兩邊的變量值分布的次數(shù)少,其曲線圖宛如一口鐘,如下圖所示。(a)正態(tài)分布(b)偏態(tài)分布正偏(右偏)負偏(左偏)如圖(a)所示,其分布特征是以標志變量中心為對稱軸,左右兩側對稱,兩側變量值分布的次數(shù)隨著與中間變量值距離的增大而漸次減少。在統(tǒng)計學中,稱這種分布為對稱分布。而圖(b)為非對稱分布,它們各有不同方向的偏態(tài),即左偏態(tài)分布和右偏態(tài)分布??陀^實際中,許多社會現(xiàn)象統(tǒng)計總體的分布都趨于對稱分布中的正態(tài)分布。正態(tài)分布是描述統(tǒng)計中的一種主要分布,它在社會經濟統(tǒng)計分析中具有重要的意義。2.U型分布U型分布的形狀與鐘型分布相反,靠近中間的變量值分布次數(shù)少,靠近兩端的變量值分布次數(shù)多,形成“兩頭大,中間小”的U型分布。如人口死亡率分布,人口總體中,幼兒和老人死亡率高,而中青年死亡率低。3.J型分布J型分布有兩種類型,一種是次數(shù)隨著變量的增大而增多,如投資按利潤率大小分布。另一種呈反U型分布,即次數(shù)隨著變量增大而減少,如隨著產品產量的增加,產品單位成本下降。如下圖(d)(c)J形分布正J形反J形(d)U形分布第四節(jié)統(tǒng)計資料的顯示:

統(tǒng)計表和統(tǒng)計圖一、統(tǒng)計表的定義和結構統(tǒng)計調查所得來的原始資料,經過整理,得到說明社會現(xiàn)象及其發(fā)展過程的數(shù)據(jù),將這些數(shù)據(jù)按一定的順序排列在表格上,就形成了統(tǒng)計表。廣義的統(tǒng)計表包括統(tǒng)計工作各個階段中所用的一切表格。狹義的統(tǒng)計表專指分析表和容納各種統(tǒng)計資料的表格,也就是通常所說的統(tǒng)計表,它清楚地、有條理地顯示統(tǒng)計資料,直觀地反映統(tǒng)計分布特征,是統(tǒng)計分析的一種重要工具。統(tǒng)計表的結構,可以從表式和內容兩個方面來認識。1.從表式上看,統(tǒng)計表是由縱橫交叉的線條組成的一種表格,表格包括總標題、橫行標題、縱欄標題和指標數(shù)值四個部分??倶祟}是統(tǒng)計表的名稱,它扼要地說明表的基本內容,并指明時間和范圍。它置于統(tǒng)計表格的正上方。橫行標題是橫行的名稱,一般放在表格的左方;縱欄標題是縱行的名稱,一般放在表格的上方。橫行標題和縱行標題共同說明填入表格中的統(tǒng)計數(shù)字所指的內容。指標數(shù)值是列在橫行和縱欄的交叉處,即表格中的數(shù)字就是指標數(shù)值,用來說明總體及其組成部分的數(shù)量特征,它是填寫在統(tǒng)計表格的核心部分2.從內容上來看,統(tǒng)計表是由主詞欄和賓詞欄兩個部分組成。主詞欄是統(tǒng)計表所要說明的總體及其組成部分,一般都列在表的左半部分;賓詞欄是統(tǒng)計表用來說明總體數(shù)量特征的各個統(tǒng)計指標及其數(shù)值,一般都列在統(tǒng)計表的右半部分。此外,統(tǒng)計表還有補充資料、注解、資料來源、填表單位、填表人等附加內容。二、統(tǒng)計表的設計

統(tǒng)計表的設計要求是:科學、實用、簡練、美觀。具體來說,設計統(tǒng)計表時要注意以下幾點:第一,統(tǒng)計表的表頭。第二,統(tǒng)計表的結構。第三,統(tǒng)計表的表式。第四,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論