版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第一章緒論PowerPoint統(tǒng)計學(xué)基本內(nèi)容1、統(tǒng)計與統(tǒng)計學(xué)2、統(tǒng)計學(xué)的分類3、統(tǒng)計學(xué)與其他學(xué)科的關(guān)系4、統(tǒng)計學(xué)中的基本概念5、統(tǒng)計學(xué)的基本研究方法6、統(tǒng)計應(yīng)用軟件介紹學(xué)習(xí)目標(biāo)1、理解統(tǒng)計與統(tǒng)計學(xué)的含義2、了解統(tǒng)計學(xué)分科及應(yīng)用領(lǐng)域3、掌握統(tǒng)計學(xué)中的基本概念4、理解統(tǒng)計學(xué)的基本研究方法5、了解常用的統(tǒng)計軟件第一節(jié)統(tǒng)計學(xué)概述1、統(tǒng)計學(xué)定義2、統(tǒng)計學(xué)的分類3、統(tǒng)計學(xué)的應(yīng)用領(lǐng)域及與其他學(xué)科的關(guān)系幾個例子國家統(tǒng)計局調(diào)查發(fā)布的年度、季度、月份經(jīng)濟數(shù)據(jù)2019年我國GDP的總量是達(dá)到了99.1萬億元。按平均匯率折算,人均達(dá)到了10276美元。2019年全國居民人均可支配收入突破30000元。正常條件下新生嬰兒的男女性別比為107:100投擲一枚均勻的硬幣,出現(xiàn)正面和反面的頻率各為1/2職工工資與職工的文化程度、技術(shù)等級、職務(wù)等之間存在相關(guān)關(guān)系收入狀況與消費水平之間存在顯著的因果關(guān)系一、統(tǒng)計的三種含義統(tǒng)計做作為一種社會實踐活動由來已久。今天,“統(tǒng)計”一詞義被人們賦予了多種含義,具體包括:統(tǒng)計工作:統(tǒng)計實踐活動過程。統(tǒng)計資料:統(tǒng)計工作的成果。統(tǒng)計學(xué):指導(dǎo)統(tǒng)計工作的理論和方法。什么是統(tǒng)計學(xué)?怎樣定義它呢?例如,國家統(tǒng)計局調(diào)查發(fā)布2019年我國GDP的總量是達(dá)到了99.1萬億元。按平均匯率折算,人均達(dá)到了10276美元。Statisticsstatistics:thescienceofcollecting,analyzing,presenting,andinterpreting
data.
(不列顛百科全書)什么是統(tǒng)計學(xué)?
(statistics)統(tǒng)計學(xué)是收集、分析、表述(展示)和解釋數(shù)據(jù)的科學(xué)(不列顛百科全書)統(tǒng)計是一門收集、分析、解釋和提供數(shù)據(jù)的科學(xué)(韋伯斯特國際辭典第3版)統(tǒng)計指的是一組方法,用來設(shè)計實驗、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎(chǔ)上組織、概括、演示、分析、解釋和得出結(jié)論(MarioF.Triola,《初級統(tǒng)計學(xué)》)
二、什么是統(tǒng)計學(xué)?搜集、整理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。其目的是探索數(shù)據(jù)內(nèi)在數(shù)量規(guī)律性,以達(dá)到對客觀事物的認(rèn)識?;诮y(tǒng)計設(shè)計:數(shù)據(jù)搜集:取得數(shù)據(jù)數(shù)據(jù)整理:處理數(shù)據(jù)數(shù)據(jù)分析:研究數(shù)據(jù)解釋數(shù)據(jù):說明結(jié)果得到結(jié)論:新的認(rèn)識歷史上著名的統(tǒng)計學(xué)家(1)JacobBernoulli(伯努利)(1654-1705)EdmondHalley(哈雷)(1656-1742)DeMoivre(棣莫弗)(1667-1754)ThomasBayes(貝葉斯)(1702-1761)LeonhardEuler(歐拉)(1707-1783)PierreSimonLaplace(拉普拉斯)(1749-1827)AdrienMarieLegendre(勒讓德)(1752-1833)ThomasRobertMalthus(馬爾薩斯)(1766-1834)ThomasRobertMalthus(馬爾薩斯)PierreSimonLaplace(拉普拉斯)LeonhardEuler(歐拉)歷史上著名的統(tǒng)計學(xué)家(2)FriedrichGauss(高斯)(1777-1855)JohannGregorMendel(孟德爾)(1822-1884)KarlPearson(皮爾遜)(1857-1936)RonaldAylmerFisher(費希爾)(1890-1962),JerzyNeyman(奈曼)(1894-1981)EgonSharpePearson(皮爾遜)(1895-1980)WilliamFeller(費勒)(1906-1970).FriedrichGauss(高斯)JohannGregorMendel(孟德爾)三、統(tǒng)計學(xué)的分類
(1、描述統(tǒng)計學(xué)與推斷統(tǒng)計學(xué))從統(tǒng)計方法的構(gòu)成看,統(tǒng)計學(xué)可分為描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)。用圖形表示如下:統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗描述統(tǒng)計
(descriptivestatistics)研究數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等統(tǒng)計方法內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4萬元x=30s2=105s=10.252019某品牌啤酒四季銷售額20304525推斷統(tǒng)計
(inferentialstatistics)研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康膶傮w特征作出推斷樣本總體描述統(tǒng)計與推斷統(tǒng)計的關(guān)系反映現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)三、統(tǒng)計學(xué)的分類
(2、理論統(tǒng)計學(xué)和應(yīng)用統(tǒng)計學(xué))從統(tǒng)計方法的研究和應(yīng)用角度來看,統(tǒng)計學(xué)可分為理論統(tǒng)計學(xué)和應(yīng)用統(tǒng)計學(xué):理論統(tǒng)計學(xué)(TheoreticalStatistics):是指統(tǒng)計學(xué)的數(shù)學(xué)原理,主要研究統(tǒng)計學(xué)的一般理論和統(tǒng)計方法的數(shù)學(xué)原理。應(yīng)用統(tǒng)計學(xué)(AppliedStatistics):是研究如何應(yīng)用統(tǒng)計方法去解決實際問題的。四、統(tǒng)計學(xué)應(yīng)用領(lǐng)域統(tǒng)計學(xué)經(jīng)濟學(xué)管理學(xué)醫(yī)學(xué)工程學(xué)社會學(xué)…統(tǒng)計學(xué)和這些具體科學(xué)有何關(guān)系?統(tǒng)計的應(yīng)用領(lǐng)域
(一些例子)actuarialwork
(精算)
agriculture
(農(nóng)業(yè))animalscience
(動物學(xué))
anthropology
(人類學(xué))archaeology(考古學(xué))
auditing(審計學(xué))crystallography(晶體學(xué))
demography(人口統(tǒng)計學(xué))dentistry(牙醫(yī)學(xué))
ecology
(生態(tài)學(xué))econometrics(經(jīng)濟計量學(xué))
education(教育學(xué))engineering(工程)
epidemiology(流行病學(xué))finance(金融)gambling(賭博)
genetics(遺傳學(xué))geography(地理學(xué))marketing(市場營銷學(xué))
medicaldiagnosis
(醫(yī)學(xué)診斷)meteorology(氣象學(xué))
militaryscience
(軍事科學(xué))統(tǒng)計學(xué)與其他科學(xué)的關(guān)系統(tǒng)計學(xué)可以用到幾乎所有的科學(xué)領(lǐng)域,卻不能解決各學(xué)科領(lǐng)域的所有問題。對統(tǒng)計分析結(jié)果的解釋需要各學(xué)科領(lǐng)域的專業(yè)人員和專業(yè)知識。比如,醫(yī)學(xué)研究中會用到統(tǒng)計學(xué),但是對醫(yī)學(xué)問題的解釋,主要依賴醫(yī)學(xué)理論和醫(yī)學(xué)專業(yè)人員來解釋。統(tǒng)計學(xué)只能起到輔助和工具作用。統(tǒng)計學(xué)與數(shù)學(xué)的關(guān)系聯(lián)系:統(tǒng)計學(xué)運用到大量的數(shù)學(xué)知識;數(shù)學(xué)為統(tǒng)計理論和統(tǒng)計方法的發(fā)展提供了數(shù)學(xué)基礎(chǔ)。區(qū)別:
首先,數(shù)學(xué)研究的是抽象的數(shù)量規(guī)律,統(tǒng)計學(xué)則研究具體的實際現(xiàn)象的數(shù)量規(guī)律。即數(shù)學(xué)研究的是沒有量綱或單位的抽象的數(shù)據(jù);統(tǒng)計學(xué)研究的是有具體事物或計量單位的數(shù)據(jù)。其次,統(tǒng)計學(xué)與數(shù)學(xué)研究中所使用的邏輯方法不同:數(shù)學(xué)研究中所使用的主要是演繹;統(tǒng)計學(xué)則是演繹與歸納相結(jié)合,占主導(dǎo)地位的是歸納。第二節(jié)統(tǒng)計學(xué)中的基本概念1、總體、總體單位(個體)、樣本、樣本容量2、參數(shù)、統(tǒng)計量3、變量、數(shù)據(jù)4、標(biāo)志、指標(biāo)、指標(biāo)體系一、總體與樣本(一)總體(population)在一定的研究目的下,由所要研究的全部個體構(gòu)成的整體,稱為統(tǒng)計總體,簡稱總體。構(gòu)成總體的每一個體稱為總體單位(case)。2019年西安高校在校學(xué)生的上網(wǎng)狀況是什么樣的?2019年某企業(yè)生產(chǎn)的十萬個燈泡的使用壽命如何?統(tǒng)計總體的性質(zhì):同質(zhì)性、大量性、差異性。統(tǒng)計總體可分為有限總體和無限總體
一個統(tǒng)計總體中所包括的總體單位數(shù)可以是無限的稱為無限總體;也可以是有限的,則稱為有限總體。一、總體與樣本(二)樣本(sample)總體中抽取的一部分元素(個體)的集合,稱為樣本。樣本中個體的數(shù)目,稱為樣本容量(samplesize),或樣本單位數(shù)。從總體中抽取一部分元素作為樣本,目的在于用樣本提供的有關(guān)信息去推斷總體的特征。例如,從某地區(qū)隨機抽取100名消費者,被抽中的100名消費者就構(gòu)成了一個樣本。然后再根據(jù)這100名消費對某種家電產(chǎn)品的滿意程度去推斷該地區(qū)全部消費者對該種家電產(chǎn)品的滿意程度。二、參數(shù)與統(tǒng)計量(一)參數(shù)(parameter)用來描述總體特征的測度值,稱為參數(shù)。參數(shù)是研究想要了解的總體的某種特征值??傮w參數(shù)用希臘字母表示,通常有:總體均值(μ)、總體標(biāo)準(zhǔn)差(σ)、總體比例(π)等。由于總體數(shù)據(jù)通常是不知道的,所以參數(shù)是一個未知的常數(shù)。正因為如此,我們才進行抽樣,根據(jù)樣本計算出某些值去估計總體參數(shù)。二、參數(shù)與統(tǒng)計量(二)統(tǒng)計量(statistic)統(tǒng)計量是關(guān)于樣本的函數(shù),是隨機量。根據(jù)樣本數(shù)據(jù)計算的用于推斷總體參數(shù)的測度量。計算樣本統(tǒng)計量的目的在于推斷總體參數(shù),所以相應(yīng)的樣本統(tǒng)計量有:樣本統(tǒng)計量有樣本均值(
x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等。樣本統(tǒng)計量通常用英文字母來表示。參數(shù)與統(tǒng)計量的表達(dá)符號平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)
統(tǒng)計量
xsp
總體
樣本三、變量與數(shù)據(jù)變量基本分類分類變量順序變量數(shù)值變量其他分類隨機變量非隨機變量經(jīng)驗變量理論變量分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值數(shù)據(jù)變量取值即數(shù)據(jù)變量:表示現(xiàn)象某種特征的名稱、概念(一)變量定義1、說明現(xiàn)象某種特征的名稱、概念。如員工性別、受教育程度、工業(yè)企業(yè)數(shù)量、產(chǎn)品銷售額等變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù),如性別值為:男或女2、指標(biāo)和標(biāo)志都是變量指標(biāo)是說明現(xiàn)象總體特征的變量,如某班數(shù)學(xué)平均成績標(biāo)志是說明現(xiàn)象個體特征的變量,如某班張三數(shù)學(xué)成績3、變量可以分為:品質(zhì)變量(分類、順序)和數(shù)值型變量品質(zhì)變量:說明事物的屬性特征。品質(zhì)標(biāo)志屬于品質(zhì)變量。分類變量:性別,國別,民族,籍貫,行業(yè)順序變量:產(chǎn)品質(zhì)量等級,服務(wù)滿意度,受教育程度數(shù)值型變量:說明事物數(shù)量特征。數(shù)量標(biāo)志和數(shù)量指標(biāo)都屬于數(shù)值型變量。離散變量:取有限個值,如企業(yè)數(shù)量,產(chǎn)品銷量,班級人數(shù)連續(xù)變量:可以取無窮多個值,如溫度,年齡,零件尺寸誤差(二)變量種類
(按計量尺度)1、根據(jù)變量的具體表現(xiàn)以及變量值之間的關(guān)系,可將變量分為以下三類:(1)定類變量:變量值表現(xiàn)為“類別”,且各類別是一種平行關(guān)系的變量。如性別、國別、行業(yè)、經(jīng)濟類型等。(2)定序變量:變量值表現(xiàn)為“類別”且各類別有一定順序的變量。如產(chǎn)品等級、受教育程度、用戶滿意度等。(3)數(shù)值變量:變量值為“數(shù)值”的變量。數(shù)值型變量又根據(jù)變量的取值是否連續(xù)分為離散型變量和連續(xù)性變量。連續(xù)變量的數(shù)值是連續(xù)不斷的,相鄰兩值之間可作無限分割,即有小數(shù)出現(xiàn)。如溫度、年齡等。離散型變量的數(shù)值是以整數(shù)位斷開,即不取小數(shù)值。如汽車產(chǎn)量。(二)變量種類
(按變量范圍大?。?、變量按反映現(xiàn)象范圍大小的不同,可分為標(biāo)志變量和指標(biāo)變量。(1)標(biāo)志變量:說明總體中每一個體特征的變量,簡稱為標(biāo)志。每個事物都有它自身的特征從而可以區(qū)別另一事物。例如,如每個職工都有性別、年齡、籍貫、文化程度、政治面貌、工齡、身高、體重等,這些都是標(biāo)志變量。(2)指標(biāo)變量:說明總體數(shù)量特征的變量,簡稱為指標(biāo)。比如,企業(yè)的平均工資說明的是所有職工的工資情況,所以是指標(biāo)變量。再比如,某企業(yè)女性員工數(shù)量占該企業(yè)員工總數(shù)量的百分比,反映的是企業(yè)員工性別總體結(jié)構(gòu)狀況,所以也是指標(biāo)變量。(二)變量種類
(按取值方式及建構(gòu)方式)3、變量按取值特征。(1)隨機變量。(2)非隨機變量。4、變量按構(gòu)建方式。(1)經(jīng)驗變量(empiricalvariables)經(jīng)驗變量所描述的是我們周圍可以觀察到的事物(2)理論變量(theoreticalvariables)理論變量則是由統(tǒng)計學(xué)家用數(shù)學(xué)方法所構(gòu)造出來的一些變量,比如,z統(tǒng)計量、t統(tǒng)計量、卡方x2統(tǒng)計量、F統(tǒng)計量等(三)數(shù)據(jù)變量的具體表現(xiàn)稱為變量值。數(shù)據(jù)就是變量的具體表現(xiàn),即變量值。例如,人的受教育程度是一個可變量,也就是變量。每一個人的受教育程度的具體表現(xiàn)就是變量值,也就是數(shù)據(jù)。如甲的受教育程度為“高中”,乙為“大學(xué)”等。數(shù)據(jù)類型定性數(shù)據(jù)和定量數(shù)據(jù)觀測數(shù)據(jù)和實驗數(shù)據(jù)原始數(shù)據(jù)和次級數(shù)據(jù)靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)連續(xù)數(shù)據(jù)和離散數(shù)據(jù)四、指標(biāo)與指標(biāo)體系指標(biāo)是說明總體綜合數(shù)量特征的變量,簡稱指標(biāo)。一個科學(xué)、完整的指標(biāo)都是由指標(biāo)名稱、所屬時間、所屬空間、指標(biāo)數(shù)值、計量單位等構(gòu)成。例如:2019年我國GDP的總量是達(dá)到了99.1萬億元,接近100萬億元人民幣。按平均匯率折算,人均達(dá)到了10276美元。2019年全國居民人均可支配收入突破30000元。2019年全國糧食總產(chǎn)量6.6億噸,是世界第一大產(chǎn)糧國,也是中國歷史上最高的糧食產(chǎn)量。2019年末高速鐵路營業(yè)總里程達(dá)3.5萬公里,占全球高鐵里程超過2/3;高速公路里程超過14萬公里,居世界第一;電力裝機容量接近2032千瓦,居世界第一;互聯(lián)網(wǎng)上網(wǎng)人數(shù)8.6億人。(一)指標(biāo)種類1、指標(biāo)按其所反映的總體內(nèi)容不同,可分為質(zhì)量指標(biāo)和數(shù)量指標(biāo):數(shù)量指標(biāo):是反映總體規(guī)模大小、數(shù)量多少的統(tǒng)計指標(biāo),表現(xiàn)為絕對數(shù)。如社會勞動力資源總數(shù)、受災(zāi)人口總數(shù)、國民生產(chǎn)總值等。質(zhì)量指標(biāo):是反映總體相對水平、平均水平等的指標(biāo),表現(xiàn)為相對數(shù)和平均數(shù)。如電話機普及率、人口平均壽命、人均GDP等2、指標(biāo)按其表現(xiàn)形式不同,分為:總量指標(biāo)、相對指標(biāo)、平均指標(biāo)、變異指標(biāo)(二)指標(biāo)特點數(shù)量性:統(tǒng)計指標(biāo)描述的是可以度量的客觀現(xiàn)象的量,都是用數(shù)值表現(xiàn)的,不存在不能用數(shù)值表現(xiàn)的統(tǒng)計指標(biāo)。綜合性:統(tǒng)計指標(biāo)說明的對象是總體而不是個體,它是許多個體現(xiàn)象的數(shù)量綜合的結(jié)果。一個人的工資不叫統(tǒng)計指標(biāo)。反映許多人的工資總額和平均工資才叫做統(tǒng)計指標(biāo)。具體性:統(tǒng)計指標(biāo)并非抽象的概念和數(shù)值,它具有客觀的經(jīng)濟社會內(nèi)容,是一定的具體的經(jīng)濟社會現(xiàn)象的量的反映。(三)指標(biāo)體系指標(biāo)體系是指由若干個反映社會經(jīng)濟現(xiàn)象總體數(shù)量特征的相對獨立又相互聯(lián)系的統(tǒng)計指標(biāo)所組成的有機整體。說明總體全貌,只使用一個指標(biāo)往往是不夠的,因為它只能反映總體某一方面的數(shù)量特征。此時,需要同時使用多個相關(guān)指標(biāo),而這些多個相關(guān)的又相互獨立的指標(biāo)所構(gòu)成的統(tǒng)一整體,即為指標(biāo)體系。總體、總體單位、指標(biāo)、標(biāo)志及變量之間的關(guān)系總體總體單位指標(biāo)變量標(biāo)志變量變量組成匯總或計算說明說明A班張三的數(shù)學(xué)成績?yōu)?0分A班李四的數(shù)學(xué)成績?yōu)?5分…………A班全部學(xué)生數(shù)學(xué)平均成績?yōu)?7分術(shù)語比較:描述統(tǒng)計與推斷統(tǒng)計全體個體部分總體總體單位樣本推斷統(tǒng)計參數(shù)統(tǒng)計量描述統(tǒng)計變量指標(biāo)標(biāo)志第三節(jié)統(tǒng)計學(xué)的基本研究方法1、統(tǒng)計研究一般過程2、統(tǒng)計學(xué)的基本研究方法研究開始確定研究課題探索性調(diào)查理論假設(shè)與概念操作化測量工具設(shè)計調(diào)查的實施審核、錄入與錄入誤差的消除統(tǒng)計分析與理論假設(shè)的檢驗研究結(jié)束一個完整的科學(xué)研究過程統(tǒng)計研究的一般過程提出問題回答問題收集數(shù)據(jù)(取得數(shù)據(jù))整理數(shù)據(jù)(處理數(shù)據(jù))解釋數(shù)據(jù)(結(jié)果說明)分析數(shù)據(jù)(研究數(shù)據(jù))實際問題在此過程中,有哪些可用的統(tǒng)計研究方法呢?一、實驗設(shè)計法
(收集數(shù)據(jù)方法)1、設(shè)計實驗的合理程序,使得收集得到的數(shù)據(jù)符合統(tǒng)計分析方法的要求,以便得出有效客觀的結(jié)論。2、主要適用于自然科學(xué)研究和工程技術(shù)領(lǐng)域的統(tǒng)計數(shù)據(jù)搜集。3、遵循的三個原則:重復(fù)性原則、隨機化原則、分組化原則。二、大量觀察法
(收集數(shù)據(jù)方法)1、就總體中全部或足夠多的單位進行調(diào)查觀察并加以綜合研究。2、組織形式:普查、抽樣調(diào)查、統(tǒng)計報表、典型調(diào)查、重點調(diào)查等。三、統(tǒng)計描述法
(分析數(shù)據(jù)方法)1、對數(shù)據(jù)進行加工計算綜合指標(biāo),并加以分析將之表示出來。2、具體方法:分組法、綜合指標(biāo)法、指數(shù)方法四、統(tǒng)計推斷法
(分析數(shù)據(jù)方法)1、以一定的要求,由樣本數(shù)據(jù)來判斷總體數(shù)量特征。2、具體方法:參數(shù)估計法、假設(shè)檢驗法、、統(tǒng)計模型方法。大數(shù)據(jù)時代的統(tǒng)計學(xué)一、大數(shù)據(jù)的特點大數(shù)據(jù)具有海量和多源異構(gòu)等復(fù)雜特征。二、發(fā)展趨勢
融合發(fā)展:其他學(xué)科的發(fā)展,衍生出更多的發(fā)展方向,但絕不會替代統(tǒng)計學(xué)。同時,實踐的發(fā)展會對抽樣推斷等統(tǒng)計分析方法提出新的挑戰(zhàn)。第四節(jié)統(tǒng)計應(yīng)用軟件介紹常用統(tǒng)計軟件典型的統(tǒng)計軟件ExcelSPSS、STATA、SASEviewsRPython……Execl
SPSS
STATA
Eviews
/R
Python
本章小結(jié)1、統(tǒng)計與統(tǒng)計學(xué)2、統(tǒng)計學(xué)的分科及其應(yīng)用領(lǐng)域3、統(tǒng)計中的幾個基本概念4、統(tǒng)計學(xué)的基本研究方法5、常用的統(tǒng)計軟件EndofChapter1第二章統(tǒng)計數(shù)據(jù)的搜集PowerPoint統(tǒng)計學(xué)基本內(nèi)容1、數(shù)據(jù)計量尺度與數(shù)據(jù)類型2、數(shù)據(jù)來源和數(shù)據(jù)搜集方式、方法3、調(diào)查方案的設(shè)計4、問卷的設(shè)計5、數(shù)據(jù)誤差及質(zhì)量要求學(xué)習(xí)目標(biāo)1、理解數(shù)據(jù)計量尺度與數(shù)據(jù)類型2、熟練掌握數(shù)據(jù)的調(diào)查方式、方法3、掌握調(diào)查方案的結(jié)構(gòu)和設(shè)計4、了解調(diào)查問卷結(jié)構(gòu)和設(shè)計5、了解數(shù)據(jù)誤差及質(zhì)量要求第一節(jié)數(shù)據(jù)的計量尺度與數(shù)據(jù)類型1、數(shù)據(jù)計量尺度2、數(shù)據(jù)的類型一、數(shù)據(jù)的計量尺度(一)數(shù)據(jù)的定義(二)數(shù)據(jù)的計量尺度(一)數(shù)據(jù)的定義數(shù)據(jù)就是對現(xiàn)象特征進行計量的結(jié)果,也即變量值。
不是指單個的數(shù)字,而是由多個數(shù)據(jù)構(gòu)成的數(shù)據(jù)集。不僅僅是指數(shù)字,它可以是數(shù)字的,也可以是文字的。(二)數(shù)據(jù)的計量尺度1.定類尺度Nominal
-對事物的‘屬性特征’進行測定;-計量結(jié)果表現(xiàn)為‘類別’。例,性別、民族、居住地、所學(xué)外語等采用定類尺度計量。2.定序尺度Ordinal-對事物的‘屬性特征’進行測定;-計量結(jié)果表現(xiàn)為‘類別’,但類別之間又順序。例,成績、文化程度、滿意度、產(chǎn)品等級等。采用定序尺度計量3.定距尺度Interval
-對事物的‘?dāng)?shù)量特征’進行測量;計量結(jié)果表現(xiàn)為‘?dāng)?shù)值’-沒有絕對零點,具有0水平例,溫度、學(xué)生成績等的測量0可表示實際測度值,有意義4.定比尺度Ratio-對事物的‘?dāng)?shù)量特征’進行測量;計量結(jié)果表現(xiàn)為‘?dāng)?shù)值’有絕對零點,沒有0水平例,身高、產(chǎn)量、收入、住房面積、人口密度、人均GDP等的測量。0表示沒有,不存在定比數(shù)據(jù)一般取正值。二、數(shù)據(jù)的類型定類數(shù)據(jù)(Nominaldata)
只能歸于某一類別的非數(shù)字型數(shù)據(jù)定類尺度計量的結(jié)果,表現(xiàn)為類別,用文字來表述例如,人口按性別分為男、女兩類
定序數(shù)據(jù)(Ordinaldata)
只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)定序尺度計量的結(jié)果,表現(xiàn)為類別,但有一定的順序,用文字來表述例如,產(chǎn)品按質(zhì)量分為一等品、二等品、三等品、次品等數(shù)值型數(shù)據(jù)(Numericaldata)
定距或定比尺度計量的結(jié)果,表現(xiàn)為具體的數(shù)值例如:身高為175cm、168cm、183cm不同類型數(shù)據(jù)的數(shù)學(xué)特性定類定序定距定比類別區(qū)分=,≠√√√√次序區(qū)分>,<√√√距離區(qū)分+,-√√比例區(qū)分×,÷√第二節(jié)數(shù)據(jù)搜集的方式、方法1、數(shù)據(jù)來源2、獲取數(shù)據(jù)方法一、數(shù)據(jù)來源從最初來源看,統(tǒng)計數(shù)據(jù)都來源于直接的調(diào)查或?qū)嶒?。但從使用者的角度看,統(tǒng)計數(shù)據(jù)主要來源于兩種渠道:1、直接來源:直接的調(diào)查和和科學(xué)實驗。直接來源所得數(shù)據(jù)稱為直接數(shù)據(jù)(一手?jǐn)?shù)據(jù))2、間接來源:別人調(diào)查或?qū)嶒?。間接來源所得數(shù)據(jù)稱為間接數(shù)據(jù)(二手?jǐn)?shù)據(jù))(一)直接數(shù)據(jù)來源1、統(tǒng)計調(diào)查——社會經(jīng)濟數(shù)據(jù)的主要渠道①普查②統(tǒng)計報表③抽樣調(diào)查概率抽樣非概率抽樣2、科學(xué)實驗——自然科學(xué)數(shù)據(jù)的主要渠道全面調(diào)查非全面調(diào)查1、普查(1)概念:為特定目的專門組織的一次性全面調(diào)查(2)特點:
●通常是一次性或周期性的
●一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間
●數(shù)據(jù)的規(guī)范化程度較高
●不宜于經(jīng)常進行,特別適合于
掌握有關(guān)國情、國力的基本統(tǒng)
計資料??傮w每逢末尾數(shù)字為“0”的年份進行人口普查,每逢“3”的年份進行第三產(chǎn)業(yè)普查,每逢“5”的年份進行工業(yè)普查,每逢“7”的年份進行農(nóng)業(yè)普查,每逢“1”或“6”的年份進行統(tǒng)計基本單位普查。2、統(tǒng)計報表(1)按照國家有關(guān)法規(guī)的規(guī)定、自上而下地統(tǒng)一布置、自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)(2)是國家和地方政府部門的主要統(tǒng)計數(shù)據(jù)來源(3)具有統(tǒng)一性、全面性、定期性的特點(4)有各種各樣的類型(5)統(tǒng)計報的資料來源于基層單位的原始記錄3、抽樣調(diào)查(1)是實際中應(yīng)用最為廣泛的一種調(diào)查方式。(2)根據(jù)研究目的對數(shù)據(jù)的要求,從總體中抽取一部分單位作為樣本進行數(shù)據(jù)搜集的調(diào)查方式。包括概率抽樣和非概率抽樣。(3)具有經(jīng)濟性、時效性強、適應(yīng)面廣、準(zhǔn)確性高等特點??傮w
樣本
概率抽樣與非概率抽樣概率抽樣簡單隨機抽樣分層抽樣整群抽樣系統(tǒng)抽樣多階段抽樣非概率抽樣方便抽樣滾雪球抽樣判斷抽樣配額抽樣自愿樣本(1)概率抽樣也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當(dāng)用樣本對總體目標(biāo)量進行估計時,要考慮到每個樣本單位被抽中的概率簡單隨機抽樣從總體N個單位中隨機地抽取n個單位作為樣本,每個單位入抽樣本的概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標(biāo)量進行估計比較方便局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其它輔助信息以提高估計的效率分層抽樣將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標(biāo)量進行估計整群抽樣將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差系統(tǒng)抽樣將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難多階段抽樣先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調(diào)查二階抽樣中群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的階段數(shù)增多,就稱為多階段抽樣有整群抽樣優(yōu)點,保證樣本相對集中,節(jié)約調(diào)查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,是經(jīng)常被采用的方法
(2)非概率抽樣相對于概率抽樣而言抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式方便抽樣調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場所進行攔截調(diào)查廠家在出售產(chǎn)品柜臺前對路過顧客進行的調(diào)查優(yōu)點:容易實施,調(diào)查的成本低缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體滾雪球抽樣先選擇一組調(diào)查單位,對其實施調(diào)查之后,再請他們提供另外一些屬于研究總體的調(diào)查對象,調(diào)查人員根據(jù)所提供的線索,進行此后的調(diào)查。這個過程持續(xù)下去,就會形成滾雪球效應(yīng)適合于對稀少群體和特定群體研究優(yōu)點:容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低判斷抽樣研究人員根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本有重點抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒有依據(jù)隨機的原則,調(diào)查結(jié)果不能用于推斷總體重點調(diào)查
(判斷抽樣)(1)從調(diào)查對象中選擇少數(shù)重點單位進行調(diào)查,以了解總體基本情況的一種非全面調(diào)查。(2)重點單位是指在所研究的數(shù)量特征上占有較大比重的單位。(3)可用較少的人力、物力、財力和時間獲得總體的基本情況。典型調(diào)查
(判斷抽樣)(1)從調(diào)查對象的全部單位中選擇一個或少數(shù)有代表性的單位進行全面深入調(diào)查的一種非全面調(diào)查。(2)目的是通過典型單位來揭示事物的本質(zhì)和規(guī)律。(3)所選擇的典型單位應(yīng)具有所研究問題的本質(zhì)屬性或特征。例如要研究通信企業(yè)的經(jīng)濟效益問題,可以在同行業(yè)中選擇一個或幾個經(jīng)濟效益突出的單位作為典型,做深入細(xì)致的調(diào)查,從中找出經(jīng)濟效益好的原因和經(jīng)驗。配額抽樣先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似抽取具體樣本單位時,不是依據(jù)隨機原則,屬于非概率抽樣自愿樣本被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問卷活動,向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機性無關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體(3)概率抽樣與非概率抽樣的比較概率抽樣依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體參數(shù)非概率抽樣不是依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的分布是不確定的無法使用樣本的結(jié)果推斷總體參數(shù)4、科學(xué)實驗1. 在設(shè)定的特殊實驗場所、特殊狀態(tài)下,對調(diào)查對象進行實驗以獲得所需資料。2. 有室內(nèi)實驗法和室外實驗法(準(zhǔn)實驗)實驗組和對照組將研究對象分為兩組:實驗組和對照組實驗組和隨機組的產(chǎn)生應(yīng)遵循隨機原則,而且應(yīng)該匹配匹配指對實驗單位的背景材料進行分析比較,將情況類似的每對單位分別隨機地分配到實驗組和對照組實驗中的若干問題人的意愿研究的對象是人的時候,在劃分實驗組和對照組時的隨機原則將面臨挑戰(zhàn)心理問題人們對被研究非常敏感,這使得他們更加注意自我,從而走到事物的另一個極端
道德問題當(dāng)某種實驗涉及道德問題時,人們會處于進退兩難的尷尬境地
實驗中的統(tǒng)計實驗設(shè)計本身就是一個統(tǒng)計問題確定進行實驗所需要的單位的個數(shù),以保證實驗可以達(dá)到統(tǒng)計顯著的結(jié)果將統(tǒng)計的思想融入到實驗設(shè)計中,使實驗設(shè)計符合統(tǒng)計分析的標(biāo)準(zhǔn)對實驗數(shù)據(jù)進行分析時,統(tǒng)計可以提供最恰當(dāng)?shù)姆治龇椒ǎǘ╅g接數(shù)據(jù)來源間接數(shù)據(jù)來源:1、政府機構(gòu)。統(tǒng)計部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計年鑒2、非政府機構(gòu)。各類經(jīng)濟信息中心、信息咨詢機構(gòu)、專業(yè)調(diào)查機構(gòu)、圖書館等提供的數(shù)據(jù)3、媒體。各類廣播、電視、出版物。專業(yè)期刊、報紙、書籍所提供的資料4、會議。各種會議,如博覽會、展銷會、交易會及專業(yè)性、學(xué)術(shù)性研討會上交流的有關(guān)資料5、網(wǎng)絡(luò)。從互聯(lián)網(wǎng)查閱到的相關(guān)資料特點:收集容易,采集成本低,應(yīng)用廣泛實際中,收集二手資料在研究中應(yīng)優(yōu)先考慮。應(yīng)用評估:?數(shù)據(jù)是誰收集的??為什么目的而收集的??數(shù)據(jù)是怎樣收集的??什么時候收集的?(二)間接數(shù)據(jù)來源常見間接數(shù)據(jù)網(wǎng)絡(luò)來源(1)
(中國)中國國家統(tǒng)計局中國人民銀行:/國家外匯管理總局:/中華人民共和國商務(wù)部:/中華人民共和國證券監(jiān)督管理委員會:中華人民共和國銀行監(jiān)督管理委員會:中華人民共和國保險監(jiān)督管理委員會:國研網(wǎng):中國資訊行數(shù)據(jù)庫:/中國經(jīng)濟信息網(wǎng):人大經(jīng)濟論壇:萬得信息技術(shù)股份有限公司:……聯(lián)合國:/世界貿(mào)易組織:世界衛(wèi)生組織:/世界知識產(chǎn)權(quán)組織:/國際貨幣基金組織(IMF):經(jīng)濟合作與發(fā)展組織(OECD):世界銀行:/亞洲基礎(chǔ)設(shè)施投資銀行(亞投行):/東南亞聯(lián)盟:/歐洲聯(lián)盟:https://www.europa.eu/美國聯(lián)邦儲備委員會:/……常見間接數(shù)據(jù)網(wǎng)絡(luò)來源(2)
(國際)二、獲取數(shù)據(jù)的方法獲取數(shù)據(jù)的基本方法詢問法訪問調(diào)查觀察法電話調(diào)查郵寄調(diào)查電腦輔助座談會個別深訪報告法互聯(lián)網(wǎng)問卷調(diào)查(一)詢問法?詢問法是通過向被調(diào)查者征求意見以獲得信息或資料的一種調(diào)查方法。
?主要適合于調(diào)查主觀問題,如主觀態(tài)度、感受、意愿、評價等。
?根據(jù)調(diào)查者與被調(diào)查者的接觸方式不同有多種具體形式。(1)訪問調(diào)查●
調(diào)查者與被調(diào)查者通過面對面地交談而獲得資料● 有標(biāo)準(zhǔn)式訪問和非標(biāo)準(zhǔn)式訪問標(biāo)準(zhǔn)式訪問通常按事先設(shè)計好的問卷進行非標(biāo)準(zhǔn)式訪問事先一般不制作問卷對不起,打擾了?。?)郵寄調(diào)查?也稱郵寄問卷調(diào)查?是一種標(biāo)準(zhǔn)化調(diào)查?調(diào)查者與被調(diào)查者沒有直接的語言交流,信息的傳遞依賴于問卷?通過郵局或媒體傳播機構(gòu)將問卷或調(diào)查問卷送至某調(diào)查者手中,由被調(diào)查者填寫,然后將問卷寄回指定收集點?具有費用低、范圍廣、回收率低、時間長等特點(3)電話調(diào)查調(diào)查者利用電話與被調(diào)查者進行語言交流以獲得信息時效快、成本低問題的數(shù)量不宜過多您好!我是××調(diào)查公司的調(diào)查員…(4)計算機輔助調(diào)查?又稱電腦輔助電話調(diào)查?電腦與電話相結(jié)合完成調(diào)查的全過程?一般需借助專門的軟件進行?硬件設(shè)備要求較高 問卷(5)座談會也稱集體訪談將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他們對調(diào)查的主題發(fā)表意見以獲得資料參加座談會的人數(shù)不宜過多,一般為6~10人側(cè)重于定性研究(6)個別深度訪談一次只有一名受訪者參加、針對特殊問題的調(diào)查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側(cè)重于定性研究(7)互聯(lián)網(wǎng)問卷調(diào)查是通過互聯(lián)網(wǎng)發(fā)放問卷獲取市場調(diào)查信息的調(diào)查方式?;ヂ?lián)網(wǎng)調(diào)查的特點:快速、節(jié)省費用,可以采用網(wǎng)上固定樣本。調(diào)查對象只能是網(wǎng)民,樣本的代表性較差,樣本質(zhì)量很難控制。(二)報告法報告單位是以各種原始記錄和核算資料為依據(jù),向有關(guān)單位提供調(diào)查資料的方法。又稱其為憑證法。我國現(xiàn)行統(tǒng)計報表制度就是采用這種方法搜集資料的。有些專門調(diào)查,如工業(yè)普查資料的搜集,也是采用了報告方法。具有:統(tǒng)一性和時效性、周期性、相對可靠性、靈活性差等特點(三)觀察法調(diào)查人員利用感覺器官或設(shè)置一定的儀器對調(diào)查單位邊觀察邊記錄,以收集所需信息。主要適合對被調(diào)查者的行為和表現(xiàn)進行觀察。特點:數(shù)據(jù)準(zhǔn)確,但需要花費人力和時間。第三節(jié)調(diào)查方案的設(shè)計調(diào)查方案設(shè)計的內(nèi)容調(diào)查方案的內(nèi)容調(diào)查目的調(diào)查對象調(diào)查單位調(diào)查項目調(diào)查安排組織實施(一)調(diào)查目的調(diào)查要達(dá)到的具體目標(biāo)回答“為什么調(diào)查?”調(diào)查之前必須明確(二)調(diào)查對象和調(diào)查單位調(diào)查對象:調(diào)查研究的總體調(diào)查單位:需要對之進行調(diào)查的單位。調(diào)查資料的承擔(dān)者?;卮稹跋蛘l調(diào)查?”(三)調(diào)查項目調(diào)查的具體內(nèi)容通常表現(xiàn)為表格或問卷回答“調(diào)查什么?”Q1…………Q2…………Q3…………Q4…………(四)調(diào)查安排與組織實施1. 明確調(diào)查所采用的方式、方法2. 確定調(diào)查資料的所屬時間和調(diào)查工作的期限3.調(diào)查的組織與實施細(xì)則第四節(jié)調(diào)查問卷的設(shè)計一、什么是問卷?1.調(diào)查者根據(jù)調(diào)查目的和要求所設(shè)計的,由一系列問題、備選答案、說明以及碼表組成的一種搜集資料的調(diào)查表格。2.不同的調(diào)查問卷在具體結(jié)構(gòu)、題型、措詞、版式等設(shè)計上會有所不同,但在結(jié)構(gòu)上一般都由開頭(前言)、主體和結(jié)尾(結(jié)語)組成。二、問卷的基本結(jié)構(gòu)問卷的基本結(jié)構(gòu)開頭部分主體部分結(jié)尾部分(一)開頭部分
(問候語)××女士/小姐/先生您好!我是××市場調(diào)查公司訪問員,我們正在進行一項有關(guān)公眾醫(yī)療保險意識方面的調(diào)查,目的是想了解人們對醫(yī)療保險的看法和意見,以便更好地促進醫(yī)療保險事業(yè)的發(fā)展。您的回答無所謂對錯,只要真實地反映了您的情況和看法,就達(dá)到了這次調(diào)查的目的。希望您能積極參與,我們對您的回答完全是保密的。調(diào)查要耽擱您一些時間,請您諒解。謝謝您的支持與合作?。ㄒ唬╅_頭部分
(填寫說明)填寫要求:請您在所選擇答案的題號上畫圈對只許選擇一個答案的問題只能畫一個圈;對可選多個答案的問題,請在你認(rèn)為合適的答案上畫圈需填寫數(shù)字的題目在留出的橫線上填寫對于表格中選擇答案的題目,在所選的欄目內(nèi)畫勾對注明要求您自己填寫的內(nèi)容,請在規(guī)定的地方填上您的意見(二)主體部分是調(diào)查問卷的核心內(nèi)容包括所要調(diào)查的全部問題,主要由問題和答案所組成Q1.您在購買汽車時主要考慮哪些因素?Q2.您認(rèn)為這款汽車的加速性能怎么樣?(二)主體部分
(篩選被調(diào)查者)S1.請問您或您的家庭有沒有在下列行業(yè)工作的呢?1.廣告、公關(guān)機構(gòu)…………………2.市場研究、咨詢、調(diào)查機構(gòu)……3.電視,廣播,報紙等媒介機構(gòu)…終止訪問4.轎車制造…………5.轎車批發(fā)、零售…………………6.以上皆無…………繼續(xù)訪問S2.請問您的年齡是:1.20歲以下………終止訪問2.20歲~30歲3.30歲~40歲4.40歲~50歲5.50歲以上………終止訪問(二)主體部分
(主要調(diào)查內(nèi)容)調(diào)查問卷的核心部分,研究者想要知道的主要調(diào)查內(nèi)容。通常由封閉問題和選項答案構(gòu)成,也有開放問題,由被調(diào)查者回答。您認(rèn)為哪種類型的廣告宣傳效果最好?(選一項)1.電視廣告2.廣播廣告3.雜志廣告4.報紙廣告5.網(wǎng)絡(luò)廣告您對電子支付有什么具體看法?(三)結(jié)尾部分
(背景資料)通常放在問卷的最后,主要是有關(guān)被調(diào)查者的一些背景資料,如調(diào)查時間、地點、被調(diào)查者姓名和聯(lián)系方式。還有表達(dá)感謝的內(nèi)容。該部分內(nèi)容可使研究者根據(jù)背景資料對被調(diào)查者進行分類比較分析三、問卷調(diào)查一般程序設(shè)計問卷確定問卷的發(fā)放數(shù)量發(fā)放問卷收回和審核問卷編碼錄入(一)設(shè)計問卷1、調(diào)查方案設(shè)計2、設(shè)計問卷初稿3、小范圍試調(diào)查、修改和完善問卷4、完成調(diào)查問卷(二)確定問卷發(fā)放數(shù)量需要研究的問卷數(shù)量問卷發(fā)放數(shù)量=---------------------------------
問卷的回收率×有效率例如,需要研究100份有效問卷,回收率50%,有效率80%,則:問卷發(fā)放數(shù)量=100/(50%×80%)=250(份)(三)發(fā)放問卷的方式目前市場研究中發(fā)放問卷的主要方式有:(1)利用大眾傳播媒介(2)郵寄(3)派人發(fā)送(4)網(wǎng)絡(luò)發(fā)放。如發(fā)電郵,發(fā)網(wǎng)絡(luò)鏈接等(四)回收和審核問卷淘汰無效問卷,保留有效問卷。無效問卷是指太多調(diào)查項目空白未填寫,或雖然填寫但明顯胡亂填寫。(五)編碼錄入對問卷、問題及答案選項進行編制碼表性別:男=1,女=0企業(yè)類型:大企業(yè)=1,中企業(yè)=2,小企業(yè)=3按照編碼表,將全部有效問卷錄入軟件系統(tǒng),為下一步的數(shù)據(jù)整理和數(shù)據(jù)分析做好準(zhǔn)備。四、問題設(shè)計按提問時是否列出答案,可將問卷中的問題分為:開放式的問題封閉性的問題(一)開放問題對問題的回答未提供任何具體的答案,由被調(diào)查者根據(jù)自己的想法自由做出回答特點:比較靈活;可以使被調(diào)查者充分表達(dá)自己的意見和想法;但資料不便于整理。適合于搜集更深層次的信息,特別適合于那些尚未弄清各種可能答案或潛在答案類型較多的問題。開放問題
(舉例)
您認(rèn)為我國目前的網(wǎng)絡(luò)廣告宣傳中,存在的主要問題是什么?
您對新能源車有何更具體的看法?
(二)封閉問題對問題事先設(shè)計出了各種可能的答案,由被調(diào)查者從中選擇問題的答案是標(biāo)準(zhǔn)化的,有利于被調(diào)查者對問題的理解和回答,也有利于調(diào)查后的資料整理問題的答案是選擇回答型,所以設(shè)計出的答案一定要窮盡和互斥(三)問題設(shè)計注意事項提問的內(nèi)容盡可能短用詞要確切、通俗可按6W準(zhǔn)則加以推敲。6W即Who(誰),Where(何處),When(何時),Why(為什么),What(什么事),How(如何)一項提問只包含一項內(nèi)容避免誘導(dǎo)性提問避免否定形式的提問避免敏感性問題用詞用語要確切,通俗易懂您最近一段時間使用什么品牌的化妝品?您最近一個月使用什么品牌的化妝品?
一個提問只包含一項內(nèi)容您覺得這種新款轎車的加速性能和制動性能怎么樣?
您覺得這種新款轎車的加速性能怎么樣?
您覺得這種新款轎車的制動性能怎么樣?
避免誘導(dǎo)性提問人們認(rèn)為長虹牌彩電質(zhì)量不錯,你覺得怎么樣?您覺得長虹牌彩電的質(zhì)量怎么樣?
避免否定式提問您覺得這種產(chǎn)品的新包裝不美觀嗎?您覺得這種產(chǎn)品的新包裝美觀嗎?
(四)問題順序設(shè)計問題的安排應(yīng)具有邏輯性問題的順序應(yīng)先易后難,先客觀后主觀,先封閉后開放能引起被調(diào)查者興趣的問題放在前面版面格式的設(shè)計結(jié)構(gòu)——安排要合理,問卷的主體部分要突出、醒目排版——不要編排過密,各問題之間要留出一定的空間印刷——外觀及內(nèi)容的印刷要美觀五、回答項目(答案)設(shè)計回答的類型與方法開放性問題(自由回答型)封閉性問題(選擇回答型)兩項選擇法多項選擇法順序選擇法評定尺度法雙向列聯(lián)法限制選擇型多項選擇型單項選擇型(1)兩項選擇法答案只有兩項,要求被調(diào)查者選擇其中之一來回答優(yōu)點:回答比較容易;調(diào)查后的數(shù)據(jù)處理也很方便缺點:得到的信息量較少;當(dāng)被調(diào)查者對兩項答案均不滿意時,很難作出回答
您有手機嗎?1.有2.沒有
(2)多項選擇法在設(shè)計問卷時,對一個問題給出三個或三個以上的答案,讓被調(diào)查者從中選擇進行回答根據(jù)要求選擇的答案多少不同,有以下類型單項選擇型、多項選擇型、限制選擇型。單選-多項選擇法
您覺得哪種類型的廣告宣傳效果最好?
(選一項)1.電視廣告2.廣播廣告3.雜志廣告4.報紙廣告
5.路牌廣告多選-多項選擇法
請問您在購買小轎車時,主要考慮哪些因素?(選出您認(rèn)為合適的答案)1.價格6.維修費用2.款式7.乘坐舒適3.品牌8.行使平穩(wěn)4.耗油量9.加速性能5.售后服務(wù)10.制動性能限選-多項選擇法
請問您在購買小轎車時,主要考慮哪些因素?(限選五項)1.價格6.維修費用2.款式7.乘坐舒適3.品牌8.行使平穩(wěn)4.耗油量9.加速性能5.售后服務(wù)10.制動性能(3)順序選擇法要求被調(diào)查者在回答時,對所選的答案按要求的順序或重要程度加以排列。其中,對所選的的答案數(shù)量可以進行一定的限制,也可以不進行限制
您在購買這種牌子的電視機時,主要是考慮哪些因素?1.產(chǎn)品的品牌2.價格合理3.售后服務(wù)4.外形美觀5.維修方便(按重要程度進行排序)(4)評定尺度法
(等級,量表)問題答案,由表示不同等級的形容詞組成,并按照一定的程度排序,由被調(diào)查者依次選擇
您對這種新款轎車是否感到滿意?1.非常滿意;2.比較滿意;3.一般4.不太滿意;5.不滿意。
(5)雙向列聯(lián)表法請在您贊同項目的空格內(nèi)劃“√”項目紅旗寶馬奔馳1.
耗油量低2.
外觀大方3.
乘坐舒適4.
整車價格合理5.
駕駛?cè)菀?.
制動性好7.
維修方便8.
零配件齊全9.
故障率低10.
售后服務(wù)周到第五節(jié)數(shù)據(jù)的誤差與質(zhì)量要求一、數(shù)據(jù)的誤差(一)抽樣誤差由于抽樣的隨機性所帶來的誤差所有樣本可能的結(jié)果與總體真值之間的平均性差異影響抽樣誤差的大小的因素抽樣單位的數(shù)目總體被研究標(biāo)志的變異程度抽樣方法的選擇抽樣組織方式不同(二)非抽樣誤差相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差二、誤差的控制抽樣誤差可計算和控制非抽樣誤差的控制設(shè)計科學(xué)的調(diào)查方案調(diào)查員的挑選、培訓(xùn)、管理督導(dǎo)員的調(diào)查專業(yè)水平調(diào)查過程控制現(xiàn)場調(diào)查人員進行獎懲的制度對調(diào)查結(jié)果進行核查、檢驗、評估三、數(shù)據(jù)的質(zhì)量要求1.精度:最低的抽樣誤差或隨機誤差2.準(zhǔn)確性:最小的非抽樣誤差或偏差3.關(guān)聯(lián)性:滿足用戶決策、管理和研究的需要4.及時性:在最短的時間里取得并公布數(shù)據(jù)5.一致性:保持時間序列的可比性6.最低成本:以最經(jīng)濟的方式取得數(shù)據(jù)本章小結(jié)統(tǒng)計數(shù)據(jù)是采用某種尺度對事物進行計量的結(jié)果,采用不同的計量尺度會得到不同類型的統(tǒng)計數(shù)據(jù)。統(tǒng)計調(diào)查是獲取統(tǒng)計數(shù)據(jù)的主要方式,不同的調(diào)查方式與方法有各自的特點和適用范圍??茖W(xué)完整的統(tǒng)計調(diào)查方案是統(tǒng)計調(diào)查工作順利完成的基本保證。減少抽樣誤差和非抽樣誤差,提高數(shù)據(jù)質(zhì)量。EndofChapter2第三章統(tǒng)計數(shù)據(jù)的整理PowerPoint統(tǒng)計學(xué)基本內(nèi)容1、數(shù)據(jù)的預(yù)處理2、品質(zhì)數(shù)據(jù)(定類、定序)的整理3、數(shù)值數(shù)據(jù)的整理4、頻數(shù)分布及類型5、用Excel整理數(shù)據(jù)學(xué)習(xí)目標(biāo)了解數(shù)據(jù)預(yù)處理的內(nèi)容和方法掌握定類和定序數(shù)據(jù)的整理方法掌握數(shù)值數(shù)據(jù)的整理方法頻數(shù)分布及表格圖形顯示合理使用統(tǒng)計表和統(tǒng)計圖第一節(jié)數(shù)據(jù)的預(yù)處理一、數(shù)據(jù)審核直接數(shù)據(jù):完整性審核檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標(biāo)是否填寫齊全準(zhǔn)確性審核檢查調(diào)查內(nèi)容是否符合實際,數(shù)據(jù)是否有錯誤檢查方法有邏輯檢查和計算檢查間接數(shù)據(jù):適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)是否有必要做進一步的加工整理二、數(shù)據(jù)篩選當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來三、數(shù)據(jù)排序按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于發(fā)現(xiàn)數(shù)據(jù)中的特殊數(shù)值,以便對數(shù)據(jù)檢查糾錯排序可尋找一組數(shù)據(jù)的最大或最小數(shù),并為分組提供依據(jù)排序可借助于計算機完成四、數(shù)據(jù)的缺失與填補缺失值:數(shù)據(jù)采集過程中,發(fā)生的錯誤、空值、超范圍或不合要求的值,統(tǒng)稱為缺失值。缺失值的處理方法:刪除法填補法(均值法、回歸法、最大似然法、迭代收斂法等)總論:數(shù)據(jù)的整理?不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的。對(品質(zhì)數(shù)據(jù))主要是作(分類)整理品質(zhì)數(shù)據(jù)包括:定類數(shù)據(jù)、定序數(shù)據(jù)對(數(shù)值型數(shù)據(jù))則主要是作(分組)整理?適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)由低到高依次是:定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)、定比數(shù)據(jù)第二節(jié)定類數(shù)據(jù)的整理一、定類數(shù)據(jù)整理過程1. 列出各類別2.計算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE
二、可計算的統(tǒng)計量頻數(shù)(frequency):落在各類別中的數(shù)據(jù)個數(shù)比例(proportion):某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比(percentage):將對比的基數(shù)作為100而計算的比值比率(ratio):不同類別數(shù)值的比值例題分析
(原始資料)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)例題分析
(整理結(jié)果)
50名顧客購買不同品牌飲料的頻數(shù)分布飲料的品牌頻數(shù)頻率(%)可口可樂1530.0旭日升冰茶1122.0百事可樂918.0匯源果汁612.0露露918.0合計50100.0三、定類數(shù)據(jù)的圖示單變量數(shù)據(jù):
條形圖餅狀圖
雙變量數(shù)據(jù):雙條形圖(一)條形圖(1)用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形(2)有單式條形圖、復(fù)式條形圖等形式(3)主要用于反映分類數(shù)據(jù)的頻數(shù)分布(4)繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖條形圖
(例題分析)雙條形圖頻數(shù)住處
01
23
456校內(nèi)男女
校外男女(二)餅圖(1)也稱圓形圖,是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形。(2)主要用于表示總體或樣本中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用。(3)繪制圓形圖時,總體中各部分所占的百分比用圓內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的。餅圖
(例題分析)第三節(jié)定序數(shù)據(jù)的整理一、定序數(shù)據(jù)整理過程1、按順序列出各類別;2、計算各類別的頻數(shù)、頻率、累計頻數(shù)、累計頻率;3、編制頻數(shù)分布表4、用圖形顯示數(shù)據(jù)增加累積頻數(shù)與累計頻率可繪制的圖形有:條形圖、圓形圖、環(huán)形圖、累積頻數(shù)分布圖二、新增的統(tǒng)計量累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加例題分析(1)【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————例題分析(2)乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————三、定序數(shù)據(jù)的圖示定序數(shù)據(jù)除可繪制條形圖、餅圖之外,還可繪制以下圖形:累積頻數(shù)分布圖環(huán)形圖1、累積頻數(shù)分布圖2、環(huán)形圖環(huán)形圖中間有一個“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究環(huán)形圖
(例題分析)8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
甲乙兩城市家庭對住房狀況的評價第四節(jié)數(shù)值數(shù)據(jù)的整理一、數(shù)值數(shù)據(jù)分組數(shù)據(jù)分組是根據(jù)統(tǒng)計研究的需要,將數(shù)據(jù)按照某種特征或標(biāo)準(zhǔn)分成若干性質(zhì)不同的組別。它是數(shù)值型數(shù)據(jù)的主要整理方法。數(shù)值數(shù)據(jù)的類型不同,分組的方法也不同。分組方法有:
■單變量值分組
■組距式分組
●等組距分組
●異組距分組(一)單變量值分組以一個變量值作為一組的分組適合于變量值較少的離散變量分組步驟:■對數(shù)據(jù)進行排序,以了解變量值的個數(shù);■以每個變量值分別列組,并計算各組的頻數(shù)、頻率、累計頻數(shù)、累計頻率;■根據(jù)分組結(jié)果整理成頻數(shù)分布表;■用圖形顯示分組結(jié)果(條形圖)。單變量值分組示例
(原始數(shù)據(jù))某班30名同學(xué)競賽獲獎數(shù)量。數(shù)據(jù)預(yù)處理結(jié)果:000000000000000011111111111122單變量值分組舉例
(分組結(jié)果)某班30名同學(xué)獲獎數(shù)量的頻數(shù)分布獲獎數(shù)量(個)頻數(shù)百分比(%)01653.311240.0226.7合計30100變量變量值(二)組距式分組(1)將變量值的一個區(qū)間作為一組(2)適合于連續(xù)變量和變量值較多的離散型變量(3)遵循“不重不漏”的原則(4)可采用等距分組,也可采用不等距分組1、組距式分組的幾個概念(1)下限(lowlimit):一個組的最小值(2)上限(upperlimit):一個組的最大值(3)組距(classwidth):上限與下限之差(4)組中值(classmidpoint):下限與上限之間的中點值下限值+上限值2組中值=2、組距式分組的步驟第一步,對數(shù)據(jù)進行排序,并計算全距:全距=最大值-最小值第二步,確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges提出的經(jīng)驗公式來確定組數(shù)K:第三步,確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即:組距=(最大值-最小值)÷組數(shù)第四步,確定組限;第五步,統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表。3、組距式分組的組限1、組限的表示方式:根據(jù)分組變量的不同,組限的表示方式有兩種:一種是間斷組限;一種是重疊組限。在采用重疊組限分組時,為了解決“不重不漏”的問題,習(xí)慣上規(guī)定“上組限不再內(nèi)”,即當(dāng)某一變量值恰好等于組限值時,該變量值應(yīng)規(guī)在相鄰組的下一組。2、組限的確定一般要根據(jù)資料的分布而定,若資料分布均勻,可依據(jù)事先確定好的組數(shù)和組距,從最小值開始按組距大小依次斷開來確定各組的上下限。若資料存在著有規(guī)律的密集現(xiàn)象,則應(yīng)以這些密集點作為中點確定上下限,并注意把最大值和最小值均包括進去。3、不確定組限:一般用“xxx以上”或“xxx以下”的形式表示。統(tǒng)計分析時,需要計算假定的組限。
假定下限=本組上限-鄰組組距
假定上限=本組下限+鄰組組距4、等距分組與不等距分組
(在頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布,不受組距大小的影響可直接根據(jù)絕對頻數(shù),來觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布,受組距大小不同的影響各組絕對頻數(shù)的多少,不能反映頻數(shù)分布的實際狀況,需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實際狀況例題分析
(原始數(shù)據(jù))【例】某電腦公司2002年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進行分組整理。等距式分組表
(上下組限重疊)等距式分組表
(上下組限間斷)等距式分組表
(開口組)二、數(shù)值數(shù)據(jù)頻數(shù)分布的圖示分組資料單項式分組:主要使用條形圖和圓形圖、累計次數(shù)分布圖組距式分組:主要使用直方圖、多邊形圖、累計次數(shù)分布圖未分組資料使用莖葉圖(一)直方圖1、用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布2、在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖3、直方圖下的總面積等于1繪制直方圖210140150直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖190200180160170頻數(shù)(天)25201510530220230240直方圖與條形圖的區(qū)別直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列直方圖則主要用于展示數(shù)值型數(shù)據(jù),條形圖主要用于展示分類數(shù)據(jù)和順序數(shù)據(jù)(二)折線圖折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的繪制折線圖折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530(三)莖葉圖用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字對于n(20
n
300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過
L=[10×lgn]
6.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)—莖葉圖
(例題分析)未分組數(shù)據(jù)—擴展的莖葉圖
(例題分析)第五節(jié)頻數(shù)分布及其顯示一、頻數(shù)分布的概念與種類1、概念:在分類或分組的基礎(chǔ)上,將總體的所有單位按組或類歸類整理,形成總體單位在各組的分布,又稱分配數(shù)列。2、種類:
?品質(zhì)數(shù)列
?變量數(shù)列:
?
單項式數(shù)列
?組距式數(shù)列:鐘形分布、U形分布、J形分布、水平分布等。幾種常見頻數(shù)分布對稱分布右偏分布左偏分布正J型分布反J型分布U型分布二、頻數(shù)分布的顯示頻數(shù)分布的顯示方式:表格法圖形法1、表格法XXX的頻數(shù)分布組別頻數(shù)頻率(%)向上累積向下累積頻數(shù)頻率(%)頻數(shù)頻率(%)
第一組第二組
:
合計————定類數(shù)據(jù)定序和數(shù)值型數(shù)據(jù)數(shù)據(jù)2、圖形法不同類型頻數(shù)分布的圖形:定類數(shù)據(jù):條形圖和餅圖定序數(shù)據(jù):條形圖、餅圖、環(huán)形圖、累積頻數(shù)分布圖數(shù)值型數(shù)據(jù):
未分組數(shù)據(jù):莖葉圖
分組數(shù)據(jù):單項式數(shù)據(jù):條形圖和餅圖、累積頻數(shù)分布圖組距式數(shù)據(jù):直方圖、折線圖、累積頻數(shù)分布圖三、頻數(shù)分布的實際應(yīng)用1、帕累托圖(Pareto),又稱排列圖,全稱為主次因素排列圖。條形圖+向上累積百分比折線圖。2、洛倫茲曲線(Lorentz),描述收入和財富分配均衡程度??v軸收入向上累積百分比,橫軸人口向上累計百分比。3、基尼系數(shù)(Gini),描述收入分配平均或不均程度。1、帕累托圖
(探尋主因或關(guān)鍵因素)通常把原因或因素按累積百分比分成三類:對應(yīng)于0%~80%的之間原因為A類,即主要原因或因素;對應(yīng)于80%~90%之間的原因為B類,即次要原因或因素;對應(yīng)于90%~100%之間的原因為C類,即一般原因或因素。2、洛倫茲曲線
(觀察收入分配均衡程度)收入累積百分比%人口累積百分比%洛倫茲曲線AB3、基尼系數(shù)
(分析收入分配平均程度)如果A=0,則基尼系數(shù)=0,表示收入絕對平均;如果B=0,則基尼系數(shù)=1,表示收入絕對不平均?;嵯禂?shù)在0~1之間取值,一般認(rèn)為基尼系數(shù)若小于0.2,表示分配平均但缺乏效率;基尼系數(shù)在0.2~0.4之間是比較適當(dāng)?shù)模耙粋€社會及有效率有沒有造成極大的分配不公;基尼系數(shù)0.4時,被認(rèn)為是收入分配不平均的警戒線;基尼
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年人工智能算法創(chuàng)新與實踐專業(yè)題目解析
- 2026年化學(xué)基礎(chǔ)知識與實驗技能題集
- 2026年軟件測試工程師測試技術(shù)與質(zhì)量保障考試題集
- 2026年國際政治熱點事件考試題目及答案
- 2026年計算機專業(yè)IT能力進階系列編程邏輯與算法練習(xí)題及答案詳解
- 疫情期間病假記錄制度
- 2026年影視制作公司專業(yè)知識模擬試卷
- 環(huán)境監(jiān)測報告制度
- 2026福建新高考:語文重點知識點總結(jié)
- 2025年焦作情商測試試題及答案
- 標(biāo)準(zhǔn)波導(dǎo)和法蘭尺寸
- 繪本:我喜歡書
- 2023健康住宅建設(shè)技術(shù)規(guī)程
- 漢聲數(shù)學(xué)繪本《數(shù)是怎么來的》
- 統(tǒng)編版中外歷史綱要下冊 (全球聯(lián)系的初步建立與世界格局的演變) 課件
- GB/T 26471-2023塔式起重機安裝、拆卸與爬升規(guī)則
- GB/T 26126-2018商品煤質(zhì)量煤粉工業(yè)鍋爐用煤
- GB/T 14048.2-2020低壓開關(guān)設(shè)備和控制設(shè)備第2部分:斷路器
- GA 801-2014機動車查驗工作規(guī)程
- 消防應(yīng)急照明與疏散指示系統(tǒng)調(diào)試記錄
- 中藥藥理學(xué)(全套課件)
評論
0/150
提交評論