統(tǒng)計(jì)學(xué)(第四版)_第1頁(yè)
統(tǒng)計(jì)學(xué)(第四版)_第2頁(yè)
統(tǒng)計(jì)學(xué)(第四版)_第3頁(yè)
統(tǒng)計(jì)學(xué)(第四版)_第4頁(yè)
統(tǒng)計(jì)學(xué)(第四版)_第5頁(yè)
已閱讀5頁(yè),還剩432頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)第四版目錄\h第1章導(dǎo)論\h1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域\h1.2統(tǒng)計(jì)數(shù)據(jù)的類型\h1.3統(tǒng)計(jì)中的幾個(gè)基本概念\h思考與練習(xí)\h第2章數(shù)據(jù)的搜集\h2.1數(shù)據(jù)的來(lái)源\h2.2調(diào)查數(shù)據(jù)\h2.3實(shí)驗(yàn)數(shù)據(jù)\h2.4數(shù)據(jù)的誤差\h思考與練習(xí)\h第3章數(shù)據(jù)的圖表展示\h3.1數(shù)據(jù)的預(yù)處理\h3.2品質(zhì)數(shù)據(jù)的整理與展示\h3.3數(shù)值型數(shù)據(jù)的整理與展示\h3.4合理使用圖表\h思考與練習(xí)\h第4章數(shù)據(jù)的概括性度量\h4.1集中趨勢(shì)的度量\h4.2離散程度的度量\h4.3偏態(tài)與峰態(tài)的度量\h思考與練習(xí)\h第5章概率與概率分布\h5.1隨機(jī)事件及其概率\h5.2概率的性質(zhì)與運(yùn)算法則\h5.3離散型隨機(jī)變量及其分布\h5.4連續(xù)型隨機(jī)變量的概率分布\h思考與練習(xí)\h第6章統(tǒng)計(jì)量及其抽樣分布\h6.1統(tǒng)計(jì)量\h6.2關(guān)于分布的幾個(gè)概念\h6.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布\h6.4樣本均值的分布與中心極限定理\h6.5樣本比例的抽樣分布\h6.6兩個(gè)樣本平均值之差的分布\h6.7關(guān)于樣本方差的分布\h思考與練習(xí)\h第7章參數(shù)估計(jì)\h7.1參數(shù)估計(jì)的基本原理\h7.2一個(gè)總體參數(shù)的區(qū)間估計(jì)\h7.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)\h7.4樣本量的確定\h思考與練習(xí)\h第8章假設(shè)檢驗(yàn)\h8.1假設(shè)檢驗(yàn)的基本問(wèn)題\h8.2一個(gè)總體參數(shù)的檢驗(yàn)\h8.3兩個(gè)總體參數(shù)的檢驗(yàn)\h8.4檢驗(yàn)問(wèn)題的進(jìn)一步說(shuō)明\h思考與練習(xí)\h第9章列聯(lián)分析\h9.1分類數(shù)據(jù)與列聯(lián)表\h9.2\hX\h2\h檢驗(yàn)\h9.3列聯(lián)表中的相關(guān)測(cè)量\h9.4列聯(lián)分析中應(yīng)注意的問(wèn)題\h思考與練習(xí)\h第10章方差分析\h10.1方差分析引論\h10.2單因素方差分析\h10.3雙因素方差分析\h思考與練習(xí)\h第11章一元線性回歸\h11.1變量間關(guān)系的度量\h11.2一元線性回歸\h11.3利用回歸方程進(jìn)行預(yù)測(cè)\h11.4殘差分析\h思考與練習(xí)\h第12章多元線性回歸\h12.1多元線性回歸模型\h12.2回歸方程的擬合優(yōu)度\h12.3顯著性檢驗(yàn)\h12.4多重共線性\h12.5利用回歸方程進(jìn)行預(yù)測(cè)\h12.6變量選擇與逐步回歸\h思考與練習(xí)\h第13章時(shí)間序列分析和預(yù)測(cè)\h13.1時(shí)間序列及其分解\h13.2時(shí)間序列的描述性分析\h13.3時(shí)間序列預(yù)測(cè)的程序\h13.4平穩(wěn)序列的預(yù)測(cè)\h13.5趨勢(shì)型序列的預(yù)測(cè)\h13.6復(fù)合型序列的分解預(yù)測(cè)\h思考與練習(xí)\h第14章指數(shù)\h14.1基本問(wèn)題\h14.2總指數(shù)編制方法\h14.3指數(shù)體系\h14.4幾種典型的指數(shù)\h14.5綜合評(píng)價(jià)指數(shù)\h思考與練習(xí)\h附錄一術(shù)語(yǔ)表\h附錄二用Excel生成概率分布表第1章導(dǎo)論統(tǒng)計(jì)應(yīng)用理解統(tǒng)計(jì)對(duì)每個(gè)人都是必要的統(tǒng)計(jì)在許多領(lǐng)域都有應(yīng)用。在日常生活中,我們也經(jīng)常會(huì)接觸到各種統(tǒng)計(jì)數(shù)據(jù),比如,媒體報(bào)道中使用的一些統(tǒng)計(jì)數(shù)據(jù)、圖表等。下面就是統(tǒng)計(jì)研究得到的一些結(jié)論:吸煙對(duì)健康是有害的;不結(jié)婚的男性會(huì)早逝10年;身材高的父親,其子女的身材也較高;第二個(gè)出生的子女沒(méi)有第一個(gè)聰明,第三個(gè)出生的子女沒(méi)有第二個(gè)聰明,依此類推;兩天服一片阿司匹林會(huì)減少心臟病第二次發(fā)作的幾率;如果每天攝取500毫升維生素C,生命可延長(zhǎng)6年;統(tǒng)計(jì)調(diào)查表明,怕老婆的丈夫得心臟病的幾率較大;學(xué)生們?cè)诼?tīng)了莫扎特鋼琴曲10分鐘后的推理測(cè)試會(huì)比他們聽(tīng)10分鐘娛樂(lè)磁帶或其他曲目做得更好。這些結(jié)論是正確的嗎?你相信這些結(jié)論嗎?要正確閱讀并理解這些數(shù)據(jù),就需要具備一些統(tǒng)計(jì)學(xué)知識(shí)。理解并掌握一些統(tǒng)計(jì)學(xué)知識(shí)對(duì)普通大眾是有必要的。每天我們都會(huì)關(guān)心生活中的一些事情,其中就包含統(tǒng)計(jì)知識(shí)。比如,在外出旅游時(shí),需要關(guān)心一段時(shí)間內(nèi)的詳細(xì)天氣預(yù)報(bào);在投資股票時(shí),需要了解股票市場(chǎng)價(jià)格的信息,了解某只特定股票的有關(guān)財(cái)務(wù)信息;在觀看世界杯足球賽時(shí),了解各支球隊(duì)的技術(shù)統(tǒng)計(jì),等等。理解和掌握一些統(tǒng)計(jì)知識(shí),對(duì)政治家或制定政策的人來(lái)說(shuō)更為重要,在他們做決策時(shí),如果不懂統(tǒng)計(jì)可能會(huì)鬧出笑話來(lái)。比如,一個(gè)統(tǒng)計(jì)辦公室的主管是一個(gè)行政事務(wù)官,一次與一些統(tǒng)計(jì)學(xué)者開(kāi)會(huì),統(tǒng)計(jì)學(xué)者抱怨從其他部門(mén)收到的一些估計(jì)值沒(méi)有給出標(biāo)準(zhǔn)誤差(估計(jì)時(shí)的誤差大小,表示估計(jì)的精度),這個(gè)主管馬上問(wèn)道:“對(duì)誤差也有標(biāo)準(zhǔn)嗎?”一個(gè)統(tǒng)計(jì)顧問(wèn)提交給茶葉委員會(huì)的報(bào)告中,含有標(biāo)題為“飲茶人數(shù)的估計(jì)值(含標(biāo)準(zhǔn)誤差)”的附表。不久,一封信被送到這個(gè)統(tǒng)計(jì)學(xué)者手中,問(wèn)什么是人們喝紅茶時(shí)的“標(biāo)準(zhǔn)誤差”。健康部門(mén)的一位官員看到一個(gè)統(tǒng)計(jì)學(xué)者提供的報(bào)告,報(bào)告中提到去年由于某種疾病,平均1000中死亡人數(shù)為3.2人,這位官員對(duì)這個(gè)數(shù)字產(chǎn)生了興趣。他問(wèn)他的私人秘書(shū),3.2個(gè)人是如何死法?他的秘書(shū)說(shuō):“先生,當(dāng)一個(gè)統(tǒng)計(jì)學(xué)家說(shuō)死了3.2個(gè)人時(shí),意味著三個(gè)人已經(jīng)死了,兩個(gè)人正要死?!北菊聦⒔榻B統(tǒng)計(jì)學(xué)的一些基本問(wèn)題,包括統(tǒng)計(jì)學(xué)的含義、統(tǒng)計(jì)數(shù)據(jù)及其分類、統(tǒng)計(jì)中常用的一些基本概念等。1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域1.1.1什么是統(tǒng)計(jì)學(xué)統(tǒng)計(jì)是處理數(shù)據(jù)的一門(mén)科學(xué)。人們給統(tǒng)計(jì)學(xué)下的定義很多,比如,“統(tǒng)計(jì)學(xué)是收集、分析、表述和解釋數(shù)據(jù)的科學(xué)”;“統(tǒng)計(jì)是一組方法,用來(lái)設(shè)計(jì)實(shí)驗(yàn)、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎(chǔ)上組織、概括、演示、分析、解釋和得出結(jié)論”。綜合地說(shuō),統(tǒng)計(jì)學(xué)(statistics)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。統(tǒng)計(jì)學(xué)是關(guān)于數(shù)據(jù)的科學(xué),它所提供的是一套有關(guān)數(shù)據(jù)收集、處理、分析、解釋并從數(shù)據(jù)中得出結(jié)論的方法,統(tǒng)計(jì)研究的是來(lái)自各領(lǐng)域的數(shù)據(jù)。數(shù)據(jù)收集也就是取得統(tǒng)計(jì)數(shù)據(jù);數(shù)據(jù)處理是將數(shù)據(jù)用圖表等形式展示出來(lái);數(shù)據(jù)分析則是選擇適當(dāng)?shù)慕y(tǒng)計(jì)方法研究數(shù)據(jù),并從數(shù)據(jù)中提取有用信息進(jìn)而得出結(jié)論。數(shù)據(jù)分析所用的方法可分為描述統(tǒng)計(jì)方法和推斷統(tǒng)計(jì)方法。描述統(tǒng)計(jì)(descriptivestatistics)研究的是數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等統(tǒng)計(jì)方法。推斷統(tǒng)計(jì)(inferentialstatistics)是研究如何利用樣本數(shù)據(jù)來(lái)推斷總體特征的統(tǒng)計(jì)方法。比如,要了解一個(gè)地區(qū)的人口特征,不可能對(duì)每個(gè)人的特征一一進(jìn)行測(cè)量;對(duì)產(chǎn)品的質(zhì)量進(jìn)行檢驗(yàn),往往是破壞性的,也不可能對(duì)每個(gè)產(chǎn)品進(jìn)行測(cè)量。這就需要抽取部分個(gè)體即樣本進(jìn)行測(cè)量,然后根據(jù)獲得的樣本數(shù)據(jù)對(duì)所研究的總體特征進(jìn)行推斷,這就是推斷統(tǒng)計(jì)要解決的問(wèn)題。1.1.2統(tǒng)計(jì)的應(yīng)用領(lǐng)域統(tǒng)計(jì)方法是適用于所有學(xué)科領(lǐng)域的通用數(shù)據(jù)分析方法,只要有數(shù)據(jù)的地方就會(huì)用到統(tǒng)計(jì)方法。隨著人們對(duì)定量研究的日益重視,統(tǒng)計(jì)方法已被應(yīng)用到自然科學(xué)和社會(huì)科學(xué)的眾多領(lǐng)域,統(tǒng)計(jì)學(xué)也已發(fā)展成為由若干分支學(xué)科組成的學(xué)科體系。可以說(shuō),幾乎所有的研究領(lǐng)域都要用到統(tǒng)計(jì)方法,比如政府部門(mén)、學(xué)術(shù)研究領(lǐng)域、日常生活中、公司或企業(yè)的生產(chǎn)經(jīng)營(yíng)管理中都要用到統(tǒng)計(jì)。下面將給出統(tǒng)計(jì)在工商管理中的一些應(yīng)用。1.企業(yè)發(fā)展戰(zhàn)略發(fā)展戰(zhàn)略是一個(gè)企業(yè)的長(zhǎng)遠(yuǎn)發(fā)展方向。制定發(fā)展戰(zhàn)略一方面需要及時(shí)了解和把握整個(gè)宏觀經(jīng)濟(jì)的狀況及發(fā)展變化趨勢(shì),了解市場(chǎng)的變化;另一方面,還要對(duì)企業(yè)進(jìn)行合理的市場(chǎng)定位,把握企業(yè)自身的優(yōu)勢(shì)和劣勢(shì)。所有這些都離不開(kāi)統(tǒng)計(jì),需要統(tǒng)計(jì)提供可靠的數(shù)據(jù),利用統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行科學(xué)的分析和預(yù)測(cè),等等。2.產(chǎn)品質(zhì)量管理質(zhì)量是企業(yè)的生命,是企業(yè)持續(xù)發(fā)展的基礎(chǔ)。質(zhì)量管理中離不開(kāi)統(tǒng)計(jì)的應(yīng)用。在一些知名的跨國(guó)公司,6σ準(zhǔn)則已成為一種重要的管理理念。質(zhì)量控制已成為統(tǒng)計(jì)學(xué)在生產(chǎn)領(lǐng)域的一項(xiàng)重要應(yīng)用。各種統(tǒng)計(jì)質(zhì)量控制圖被廣泛應(yīng)用于監(jiān)測(cè)生產(chǎn)過(guò)程。3.市場(chǎng)研究企業(yè)要在激烈的市場(chǎng)競(jìng)爭(zhēng)中取得優(yōu)勢(shì),首先必須了解市場(chǎng),要了解市場(chǎng),則需要作廣泛的市場(chǎng)調(diào)查,取得所需的信息,并對(duì)這些信息進(jìn)行科學(xué)的分析,以便作為生產(chǎn)和營(yíng)銷的依據(jù),這些都需要統(tǒng)計(jì)的支持。4.財(cái)務(wù)分析上市公司的財(cái)務(wù)數(shù)據(jù)是股民投資選擇的重要參考依據(jù)。一些投資咨詢公司主要是根據(jù)上市公司提供的財(cái)務(wù)和統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,為股民提供投資參考。企業(yè)自身的投資,也離不開(kāi)對(duì)財(cái)務(wù)數(shù)據(jù)的分析,其中要用到大量的統(tǒng)計(jì)方法。5.經(jīng)濟(jì)預(yù)測(cè)企業(yè)要對(duì)未來(lái)的市場(chǎng)狀況進(jìn)行預(yù)測(cè),經(jīng)濟(jì)學(xué)家也常常對(duì)宏觀經(jīng)濟(jì)或某一方面進(jìn)行預(yù)測(cè)。在進(jìn)行預(yù)測(cè)時(shí)要使用各種統(tǒng)計(jì)信息和統(tǒng)計(jì)方法。比如,企業(yè)要對(duì)產(chǎn)品的市場(chǎng)潛力作出預(yù)測(cè),以便及時(shí)調(diào)整生產(chǎn)計(jì)劃,這就需要利用市場(chǎng)調(diào)查取得數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。經(jīng)濟(jì)學(xué)家在預(yù)測(cè)通貨膨脹時(shí),要利用有關(guān)生產(chǎn)價(jià)格指數(shù)、失業(yè)率、生產(chǎn)能力利用等統(tǒng)計(jì)數(shù)據(jù),然后通過(guò)統(tǒng)計(jì)模型進(jìn)行預(yù)測(cè)。6.人力資源管理利用統(tǒng)計(jì)方法對(duì)企業(yè)員工的年齡、性別、受教育程度、工資等進(jìn)行分析,并作為企業(yè)制定工資計(jì)劃、獎(jiǎng)懲制度的依據(jù)。當(dāng)然,統(tǒng)計(jì)并不是僅僅為了管理才有用,它是為自然科學(xué)、社會(huì)科學(xué)的多個(gè)領(lǐng)域而發(fā)展起來(lái)的,為多個(gè)學(xué)科提供了一種通用的數(shù)據(jù)分析方法。從某種意義上說(shuō),統(tǒng)計(jì)僅僅是一種數(shù)據(jù)分析的方法,與數(shù)學(xué)一樣統(tǒng)計(jì)是一種工具,它是一種數(shù)據(jù)分析的工具。表1—1列出了統(tǒng)計(jì)的一些應(yīng)用領(lǐng)域,目的是讓我們通過(guò)簡(jiǎn)單瀏覽形成這樣一個(gè)概念:統(tǒng)計(jì)學(xué)非常有用!表1—1統(tǒng)計(jì)的應(yīng)用領(lǐng)域利用統(tǒng)計(jì)方法可以簡(jiǎn)化繁雜的數(shù)據(jù),比如,用圖表展示數(shù)據(jù),建立數(shù)據(jù)模型。有人認(rèn)為統(tǒng)計(jì)的全部目的就是讓人看懂?dāng)?shù)據(jù),其實(shí)這僅僅是統(tǒng)計(jì)的一個(gè)方面,統(tǒng)計(jì)更重要的功能是對(duì)數(shù)據(jù)進(jìn)行分析,它提供了一套分析數(shù)據(jù)的方法和工具。不同的人對(duì)數(shù)據(jù)分析的理解也會(huì)大不一樣,曲解數(shù)據(jù)分析是一種常見(jiàn)的現(xiàn)象。在有些人的心目中,數(shù)據(jù)分析就是尋找支持:他們的心目中可能有了某種“結(jié)論”性的東西,或者說(shuō)他們希望看到一種符合他們需要的某種結(jié)論,而后去找些統(tǒng)計(jì)數(shù)據(jù)來(lái)支持他們的結(jié)論。這恰恰歪曲了數(shù)據(jù)分析的本質(zhì):數(shù)據(jù)分析的真正目的是從數(shù)據(jù)中找出規(guī)律,從數(shù)據(jù)中尋找啟發(fā),而不是尋找支持。真正的數(shù)據(jù)分析事先是沒(méi)有結(jié)論的,通過(guò)對(duì)數(shù)據(jù)的分析才能得出結(jié)論。統(tǒng)計(jì)不是萬(wàn)能的,它不能解決你所面臨的所有問(wèn)題。統(tǒng)計(jì)可以幫助分析數(shù)據(jù),并從分析中得出某種結(jié)論,但對(duì)統(tǒng)計(jì)結(jié)論的進(jìn)一步解釋,則需要你的專業(yè)知識(shí)。比如,吸煙會(huì)使患肺癌的幾率增大,這是一個(gè)統(tǒng)計(jì)結(jié)論,但要解釋吸煙為什么能引起肺癌,這就不是統(tǒng)計(jì)學(xué)家所能做到的,需要有更多的醫(yī)學(xué)知識(shí)才行。1.2統(tǒng)計(jì)數(shù)據(jù)的類型統(tǒng)計(jì)數(shù)據(jù)是對(duì)現(xiàn)象進(jìn)行測(cè)量的結(jié)果。比如,對(duì)經(jīng)濟(jì)活動(dòng)總量的測(cè)量可以得到國(guó)內(nèi)生產(chǎn)總值(GDP)數(shù)據(jù);對(duì)股票價(jià)格變動(dòng)水平的測(cè)量可以得到股票價(jià)格指數(shù)的數(shù)據(jù);對(duì)人口性別的測(cè)量可以得到男或女這樣的數(shù)據(jù)。下面從不同角度說(shuō)明統(tǒng)計(jì)數(shù)據(jù)的分類。1.2.1分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)按照所采用的計(jì)量尺度不同\h(1),可以將統(tǒng)計(jì)數(shù)據(jù)分為分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。分類數(shù)據(jù)(categoricaldata)是只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對(duì)事物進(jìn)行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,是用文字來(lái)表述的。例如,人口按照性別分為男、女兩類;企業(yè)按行業(yè)屬性分為醫(yī)藥企業(yè)、家電企業(yè)、紡織品企業(yè)等,這些均屬于分類數(shù)據(jù)。為便于統(tǒng)計(jì)處理,對(duì)于分類數(shù)據(jù)可以用數(shù)字代碼來(lái)表示各個(gè)類別,比如,用1表示“男性”,0表示“女性”;用1表示“醫(yī)藥企業(yè)”,2表示“家電企業(yè)”,3表示“紡織品企業(yè)”,等等。順序數(shù)據(jù)(rankdata)是只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。順序數(shù)據(jù)雖然也是類別,但這些類別是有序的。比如將產(chǎn)品分為一等品、二等品、三等品、次品等;考試成績(jī)可以分為優(yōu)、良、中、及格、不及格等;一個(gè)人的受教育程度可以分為小學(xué)、初中、高中、大學(xué)及以上;一個(gè)人對(duì)某一事物的態(tài)度可以分為非常同意、同意、保持中立、不同意、非常不同意,等等。同樣,對(duì)順序數(shù)據(jù)也可以用數(shù)字代碼來(lái)表示。比如,1——非常同意,2——同意,3——保持中立,4——不同意,5——非常不同意。數(shù)值型數(shù)據(jù)(metricdata)是按數(shù)字尺度測(cè)量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值?,F(xiàn)實(shí)中所處理的大多數(shù)都是數(shù)值型數(shù)據(jù)。分類數(shù)據(jù)和順序數(shù)據(jù)說(shuō)明的是事物的品質(zhì)特征,通常是用文字來(lái)表述的,其結(jié)果均表現(xiàn)為類別,因而也可統(tǒng)稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)(qualitativedata);數(shù)值型數(shù)據(jù)說(shuō)明的是現(xiàn)象的數(shù)量特征,通常是用數(shù)值來(lái)表現(xiàn)的,因此也可稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)(quantitativedata)。1.2.2觀測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)按照統(tǒng)計(jì)數(shù)據(jù)的收集方法,可以將其分為觀測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)。觀測(cè)數(shù)據(jù)(observationaldata)是通過(guò)調(diào)查或觀測(cè)而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒(méi)有對(duì)事物人為控制的條件下得到的,有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)幾乎都是觀測(cè)數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)(experimentaldata)則是在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)。比如,對(duì)一種新藥療效的實(shí)驗(yàn)數(shù)據(jù),對(duì)一種新的農(nóng)作物品種的實(shí)驗(yàn)數(shù)據(jù)。自然科學(xué)領(lǐng)域的大多數(shù)數(shù)據(jù)都為實(shí)驗(yàn)數(shù)據(jù)。1.2.3截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)按照被描述的現(xiàn)象與時(shí)間的關(guān)系,可以將統(tǒng)計(jì)數(shù)據(jù)分為截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)。截面數(shù)據(jù)(cross-sectionaldata)是在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù),這類數(shù)據(jù)通常是在不同的空間上獲得的,用于描述現(xiàn)象在某一時(shí)刻的變化情況。比如,2005年我國(guó)各地區(qū)的國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)就是截面數(shù)據(jù)。時(shí)間序列數(shù)據(jù)(timeseriesdata)是在不同時(shí)間上收集到的數(shù)據(jù),這類數(shù)據(jù)是按時(shí)間順序收集到的,用于所描述現(xiàn)象隨時(shí)間變化的情況。比如2000—2005年我國(guó)的國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)就是時(shí)間序列數(shù)據(jù)。圖1—1給出了統(tǒng)計(jì)數(shù)據(jù)分類的框圖。圖1—1統(tǒng)計(jì)數(shù)據(jù)的分類區(qū)分?jǐn)?shù)據(jù)的類型是十分重要的,因?yàn)閷?duì)不同類型的數(shù)據(jù),需要采用不同的統(tǒng)計(jì)方法來(lái)處理和分析。比如,對(duì)分類數(shù)據(jù)我們通常計(jì)算出各組的頻數(shù)或頻率,計(jì)算其眾數(shù)和異眾比率,進(jìn)行列聯(lián)表分析和X2檢驗(yàn)等;對(duì)順序數(shù)據(jù),可以計(jì)算其中位數(shù)和四分位差,計(jì)算等級(jí)相關(guān)系數(shù)等;對(duì)數(shù)值型數(shù)據(jù)可以用更多的統(tǒng)計(jì)方法進(jìn)行分析,如計(jì)算各種統(tǒng)計(jì)量、進(jìn)行參數(shù)估計(jì)和檢驗(yàn)等。1.3統(tǒng)計(jì)中的幾個(gè)基本概念統(tǒng)計(jì)學(xué)中的概念很多,其中有幾個(gè)概念是經(jīng)常要用到的,有必要單獨(dú)加以介紹。這些概念包括總體和樣本、參數(shù)和統(tǒng)計(jì)量、變量等。1.3.1總體和樣本1.總體總體(population)是包含所研究的全部個(gè)體(數(shù)據(jù))的集合,它通常由所研究的一些個(gè)體組成,如由多個(gè)企業(yè)構(gòu)成的集合,多個(gè)居民戶構(gòu)成的集合,多個(gè)人構(gòu)成的集合,等等。組成總體的每一個(gè)元素稱為個(gè)體,在由多個(gè)企業(yè)構(gòu)成的總體中,每一個(gè)企業(yè)就是一個(gè)個(gè)體;由多個(gè)居民戶構(gòu)成的總體中,每一個(gè)居民戶就是一個(gè)個(gè)體;由多個(gè)人構(gòu)成的總體中,每一個(gè)人就是一個(gè)個(gè)體。總體范圍的確定有時(shí)比較容易。比如,要檢驗(yàn)一批燈泡的使用壽命,這一批燈泡構(gòu)成的集合就是總體,每一個(gè)燈泡就是一個(gè)個(gè)體,總體的范圍很清楚。但有些場(chǎng)合總體范圍的確定則比較困難,比如,對(duì)于新推出的一種飲料,要想知道消費(fèi)者是否喜歡,首先必須弄清哪些人是消費(fèi)的對(duì)象,也就是要確定構(gòu)成該飲料的消費(fèi)者這一總體,但事實(shí)上,我們很難確定哪些消費(fèi)者消費(fèi)該飲料,總體范圍的確定十分復(fù)雜。當(dāng)總體的范圍難以確定時(shí),可根據(jù)研究的目的來(lái)定義總體??傮w根據(jù)其所包含的單位數(shù)目是否可數(shù)可以分為有限總體和無(wú)限總體。有限總體是指總體的范圍能夠明確確定,而且元素的數(shù)目是有限可數(shù)的。比如,由若干個(gè)企業(yè)構(gòu)成的總體就是有限總體,一批待檢驗(yàn)的燈泡也是有限總體。無(wú)限總體是指總體所包括的元素是無(wú)限的,不可數(shù)的。例如,在科學(xué)實(shí)驗(yàn)中,每一個(gè)實(shí)驗(yàn)數(shù)據(jù)可以看做一個(gè)總體的一個(gè)元素,而實(shí)驗(yàn)則可以無(wú)限地進(jìn)行下去,因此由實(shí)驗(yàn)數(shù)據(jù)構(gòu)成的總體就是一個(gè)無(wú)限總體。總體分為有限總體和無(wú)限總體主要是為了判別在抽樣中每次抽取是否獨(dú)立。對(duì)于無(wú)限總體,每次抽取一個(gè)單位,并不影響下一次的抽樣結(jié)果,因此每次抽取可以看做是獨(dú)立的。對(duì)于有限總體,抽取一個(gè)單位后,總體元素就會(huì)減少一個(gè),前一次的抽樣結(jié)果往往會(huì)影響第二次的抽樣結(jié)果,因此每次抽取是不獨(dú)立的。這些因素會(huì)影響到抽樣推斷的結(jié)果。最后,再對(duì)總體的概念作進(jìn)一步的說(shuō)明。如前所述,要檢驗(yàn)一批燈泡的壽命,這批燈泡構(gòu)成的集合就是總體。在統(tǒng)計(jì)問(wèn)題中,我們只是關(guān)心每個(gè)燈泡的壽命,而不是燈泡本身,所以也可以把這批燈泡的壽命集合作為總體,這個(gè)總體是一些實(shí)數(shù)構(gòu)成的集合。一般而言,有限總體就是有限個(gè)實(shí)數(shù)的集合。如果不是針對(duì)一批特定的燈泡,而是全面地考察某企業(yè)生產(chǎn)的燈泡壽命,可能的壽命是多少呢?答案是[0,+∞)這樣一個(gè)區(qū)間?;蛘哌@樣看這個(gè)問(wèn)題,隨機(jī)地從該企業(yè)生產(chǎn)的燈泡中拿出一個(gè),問(wèn)這個(gè)燈泡可能的壽命是多少,答案只能是“非負(fù)實(shí)數(shù)”,當(dāng)然這個(gè)“非負(fù)實(shí)數(shù)”在實(shí)際檢驗(yàn)前是未知的。這時(shí)稱該企業(yè)生產(chǎn)的燈泡壽命總體是取值于[0,+∞)區(qū)間上的一個(gè)隨機(jī)變量,這是一個(gè)無(wú)限總體。在統(tǒng)計(jì)推斷中通常是針對(duì)無(wú)限總體的,因而通常把總體看做隨機(jī)變量。通常情況下,統(tǒng)計(jì)上的總體是一組觀測(cè)數(shù)據(jù),而不是一群人或一些物品的集合。2.樣本樣本(sample)是從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素的數(shù)目稱為樣本量(samplesize)。抽樣的目的是根據(jù)樣本提供的信息推斷總體的特征。比如,從一批燈泡中隨機(jī)抽取100個(gè),這100個(gè)燈泡就構(gòu)成了一個(gè)樣本,然后根據(jù)這100個(gè)燈泡的平均使用壽命去推斷這批燈泡的平均使用壽命。1.3.2參數(shù)和統(tǒng)計(jì)量1.參數(shù)參數(shù)(parameter)是用來(lái)描述總體特征的概括性數(shù)字度量,它是研究者想要了解的總體的某種特征值。研究者所關(guān)心的參數(shù)通常有總體平均數(shù)、總體標(biāo)準(zhǔn)差、總體比例等。在統(tǒng)計(jì)中,總體參數(shù)通常用希臘字母表示。比如,總體平均數(shù)用μ(mu)表示,總體標(biāo)準(zhǔn)差用σ(sigma)表示,總體比例用π(pi)表示,等等。由于總體數(shù)據(jù)通常是不知道的,所以參數(shù)是一個(gè)未知的常數(shù)。比如,我們不知道某一地區(qū)所有人口的平均年齡,不知道一個(gè)城市所有家庭的收入的差異,不知道一批產(chǎn)品的合格率,等等。正因?yàn)槿绱?,所以才進(jìn)行抽樣,根據(jù)樣本計(jì)算出某些值去估計(jì)總體參數(shù)。2.統(tǒng)計(jì)量統(tǒng)計(jì)量(statistic)是用來(lái)描述樣本特征的概括性數(shù)字度量。它是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一個(gè)量,由于抽樣是隨機(jī)的,因此統(tǒng)計(jì)量是樣本的函數(shù)。研究者所關(guān)心的統(tǒng)計(jì)量主要有樣本平均數(shù)、樣本標(biāo)準(zhǔn)差、樣本比例等。樣本統(tǒng)計(jì)量通常用英文字母來(lái)表示。比如,樣本平均數(shù)用(讀作x-bar)表示,樣本標(biāo)準(zhǔn)差用s表示,樣本比例用p表示,等等。由于樣本是已經(jīng)抽出來(lái)的,所以統(tǒng)計(jì)量總是知道的。抽樣的目的就是要根據(jù)樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。比如,用樣本平均數(shù)()去估計(jì)總體平均數(shù)(μ),用樣本標(biāo)準(zhǔn)差(s)去估計(jì)總體標(biāo)準(zhǔn)差(σ),用樣本比例(p)去估計(jì)總體比例(π),等等。有關(guān)總體、樣本、參數(shù)、統(tǒng)計(jì)量的概念可以用圖1—2來(lái)表示。圖1—2總體和樣本、參數(shù)和統(tǒng)計(jì)量除了樣本均值、樣本比例、樣本方差這類統(tǒng)計(jì)量,還有一些是為統(tǒng)計(jì)分析的需要而構(gòu)造出來(lái)的統(tǒng)計(jì)量,比如用于統(tǒng)計(jì)檢驗(yàn)的z統(tǒng)計(jì)量、t統(tǒng)計(jì)量、X2統(tǒng)計(jì)量、F統(tǒng)計(jì)量,等等,它們的含義將在后面相關(guān)的章節(jié)中再作介紹。1.3.3變量變量(variable)是說(shuō)明現(xiàn)象某種特征的概念,其特點(diǎn)是從一次觀察到下一次觀察結(jié)果會(huì)呈現(xiàn)出差別或變化。如“商品銷售額”、“受教育程度”、“產(chǎn)品的質(zhì)量等級(jí)”等都是變量。變量的具體取值稱為變量值。比如商品銷售額可以是20萬(wàn)元、30萬(wàn)元、50萬(wàn)元等,這些數(shù)字就是變量值。統(tǒng)計(jì)數(shù)據(jù)就是統(tǒng)計(jì)變量的某些取值。變量可以分為以下幾種類型。1.分類變量分類變量(categoricalvariable)是說(shuō)明事物類別的一個(gè)名稱,其取值是分類數(shù)據(jù)。如“性別”就是一個(gè)分類變量,其變量值為“男”或“女”;“行業(yè)”也是一個(gè)分類變量,其變量值可以為“零售業(yè)”、“旅游業(yè)”、“汽車制造業(yè)”等。2.順序變量順序變量(rankvariable)是說(shuō)明事物有序類別的一個(gè)名稱,其取值是順序數(shù)據(jù)。如“產(chǎn)品等級(jí)”就是一個(gè)順序變量,其變量值可以為“一等品”、“二等品”、“三等品”、“次品”等;“受教育程度”也是一個(gè)順序變量,其變量值可以為“小學(xué)”、“初中”、“高中”、“大學(xué)”等;一個(gè)人對(duì)某種事物的看法也是一個(gè)順序變量,其變量值可以為“同意”、“保持中立”、“反對(duì)”等。3.?dāng)?shù)值型變量數(shù)值型變量(metricvariable)是說(shuō)明事物數(shù)字特征的一個(gè)名稱,其取值是數(shù)值型數(shù)據(jù)。如“產(chǎn)品產(chǎn)量”、“商品銷售額”、“零件尺寸”、“年齡”、“時(shí)間”等都是數(shù)值型變量,這些變量可以取不同的數(shù)值。數(shù)值型變量根據(jù)其取值的不同,又可以分為離散型變量和連續(xù)型變量。離散型變量(discretevariable)是只能取可數(shù)值的變量,它只能取有限個(gè)值,而且其取值都以整位數(shù)斷開(kāi),可以一一列舉,如“企業(yè)數(shù)”、“產(chǎn)品數(shù)量”等就是離散型變量。連續(xù)型變量(continuousvariable)是可以在一個(gè)或多個(gè)區(qū)間中取任何值的變量,它的取值是連續(xù)不斷的,不能一一列舉,如“年齡”、“溫度”、“零件尺寸的誤差”等都是連續(xù)型變量。在對(duì)社會(huì)和經(jīng)濟(jì)問(wèn)題的研究中,當(dāng)離散型變量的取值很多時(shí),也可以將離散型變量當(dāng)做連續(xù)型變量來(lái)處理。變量這一概念以后經(jīng)常要用到,但多數(shù)情況下所說(shuō)的變量主要是指數(shù)值型變量,大多數(shù)統(tǒng)計(jì)方法所處理的也都是數(shù)值型變量。當(dāng)然,也可以從其他角度對(duì)變量進(jìn)行分類,比如隨機(jī)變量和非隨機(jī)變量、經(jīng)驗(yàn)變量(empiricalvariable)和理論變量(theoreticalvariable)等。經(jīng)驗(yàn)變量所描述的是周圍環(huán)境中可以觀察到的事物。理論變量則是由統(tǒng)計(jì)學(xué)家用數(shù)學(xué)方法所構(gòu)造出來(lái)的一些變量,比如后面的有些章節(jié)中將要用到的z統(tǒng)計(jì)量、t統(tǒng)計(jì)量、X2統(tǒng)計(jì)量、F統(tǒng)計(jì)量等都是理論變量。思考與練習(xí)一、思考題1.1什么是統(tǒng)計(jì)學(xué)?1.2解釋描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。1.3統(tǒng)計(jì)數(shù)據(jù)可分為哪幾種類型?不同類型的數(shù)據(jù)各有什么特點(diǎn)?1.4解釋分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的含義。1.5舉例說(shuō)明總體、樣本、參數(shù)、統(tǒng)計(jì)量、變量這幾個(gè)概念。1.6變量可分為哪幾類?1.7舉例說(shuō)明離散型變量和連續(xù)型變量。1.8請(qǐng)舉出統(tǒng)計(jì)應(yīng)用的幾個(gè)例子。1.9請(qǐng)舉出應(yīng)用統(tǒng)計(jì)的幾個(gè)領(lǐng)域。二、練習(xí)題1.1指出下面變量的類型。(1)年齡。(2)性別。(3)汽車產(chǎn)量。(4)員工對(duì)企業(yè)某項(xiàng)改革措施的態(tài)度(贊成、中立、反對(duì))。(5)購(gòu)買(mǎi)商品時(shí)的支付方式(現(xiàn)金、信用卡、支票)。1.2某研究部門(mén)準(zhǔn)備抽取2000個(gè)職工家庭推斷該城市所有職工家庭的年人均收入。要求:(1)描述總體和樣本。(2)指出參數(shù)和統(tǒng)計(jì)量。1.3一家研究機(jī)構(gòu)從IT從業(yè)者中隨機(jī)抽取1000人作為樣本進(jìn)行調(diào)查,其中60%回答他們的月收入在5000元以上,50%的人回答他們的消費(fèi)支付方式是用信用卡?;卮鹨韵聠?wèn)題:(1)這一研究的總體是什么?(2)月收入是分類變量、順序變量還是數(shù)值型變量?(3)消費(fèi)支付方式是分類變量、順序變量還是數(shù)值型變量?(4)這一研究涉及截面數(shù)據(jù)還是時(shí)間序列數(shù)據(jù)?1.4一項(xiàng)調(diào)查表明,消費(fèi)者每月在網(wǎng)上購(gòu)物的平均花費(fèi)是200元,他們選擇在網(wǎng)上購(gòu)物的主要原因是“價(jià)格便宜”?;卮鹨韵聠?wèn)題:(1)這一研究的總體是什么?(2)“消費(fèi)者在網(wǎng)上購(gòu)物的原因”是分類變量、順序變量還是數(shù)值型變量?(3)研究者所關(guān)心的參數(shù)是什么?(4)“消費(fèi)者每月在網(wǎng)上購(gòu)物的平均花費(fèi)是200元”是參數(shù)還是統(tǒng)計(jì)量?(5)研究者所使用的主要是描述統(tǒng)計(jì)方法還是推斷統(tǒng)計(jì)方法?————————————————————\h(1)數(shù)據(jù)的測(cè)量尺度有四種:(1)分類尺度(nominalscale)。按照事物的某種屬性對(duì)其進(jìn)行平行的分類,數(shù)據(jù)表現(xiàn)為類別。(2)順序尺度(ordinalscale)。對(duì)事物類別順序的測(cè)度,數(shù)據(jù)表現(xiàn)為有序的類別。(3)間隔尺度(intervalscale)。對(duì)事物類別或次序之間間距的測(cè)度,沒(méi)有絕對(duì)零點(diǎn),數(shù)據(jù)表現(xiàn)為數(shù)字。(4)比率尺度(ratioscale)。對(duì)事物類別或次序之間間距的測(cè)度,有絕對(duì)零點(diǎn),數(shù)據(jù)表現(xiàn)為數(shù)字。第2章數(shù)據(jù)的搜集統(tǒng)計(jì)應(yīng)用全球性調(diào)查報(bào)告:中國(guó)人均性伴侶數(shù)全球排第一\h(1)近日,2004年杜蕾斯全球性調(diào)查報(bào)告向社會(huì)發(fā)布。引人注目的是報(bào)告中顯示中國(guó)人的平均性伴侶數(shù)最多,為19.3人,遠(yuǎn)遠(yuǎn)高于全球的平均數(shù)10.5人;而中國(guó)人平均每年性生活的頻率卻只有90次,排全球倒數(shù)第7位,低于全球平均水平103次。同時(shí),報(bào)告還顯示中國(guó)首次接受性教育的年齡為13.7歲,最接近世界平均水平,然而卻只有22%的調(diào)查對(duì)象認(rèn)為青少年性教育由家人或監(jiān)護(hù)人完成。為什么性伴侶最多,性頻率卻不高?首次接受性教育的年齡走低,卻不是由家長(zhǎng)來(lái)完成性教育任務(wù)?諸多問(wèn)題引發(fā)了社會(huì)大眾的廣泛爭(zhēng)論。問(wèn)題的關(guān)鍵在于,上述數(shù)據(jù)是怎么得到的?人們購(gòu)買(mǎi)住房是喜歡大戶型還是喜歡小戶型?對(duì)父母的孝敬程度與子女的性別有關(guān)系嗎?國(guó)民在購(gòu)買(mǎi)保險(xiǎn)的時(shí)候,是選擇國(guó)內(nèi)的保險(xiǎn)公司,還是選擇國(guó)外的保險(xiǎn)公司?這些都是我們感興趣卻又不知道答案的問(wèn)題。為了回答這些問(wèn)題,需要搜集相關(guān)的數(shù)據(jù)進(jìn)行分析。這就是說(shuō),當(dāng)研究的問(wèn)題確定之后,我們就要考慮為進(jìn)行研究所需要的數(shù)據(jù),這里包括:我們從哪里獲得數(shù)據(jù)?哪里有我們所需要的數(shù)據(jù)?如果需要調(diào)查,有那么多的潛在被調(diào)查者,我們應(yīng)當(dāng)向誰(shuí)進(jìn)行調(diào)查?選中被調(diào)查者以后,我們?cè)鯓訉?shí)施調(diào)查?有些研究問(wèn)題可能需要通過(guò)實(shí)驗(yàn)的方法獲得數(shù)據(jù),那么怎樣使用實(shí)驗(yàn)方法獲得數(shù)據(jù)呢?我們所得到的這些數(shù)據(jù)都很準(zhǔn)確嗎?如果不準(zhǔn)確,誤差是怎么產(chǎn)生的?應(yīng)當(dāng)怎樣控制誤差以便獲得較高質(zhì)量的數(shù)據(jù)?這些工作都是一項(xiàng)統(tǒng)計(jì)研究活動(dòng)所不可缺少的環(huán)節(jié)。本章將對(duì)上述有關(guān)問(wèn)題加以討論。2.1數(shù)據(jù)的來(lái)源所有統(tǒng)計(jì)數(shù)據(jù)追蹤其初始來(lái)源,都是來(lái)自調(diào)查或?qū)嶒?yàn)。但是,從使用者的角度看,統(tǒng)計(jì)數(shù)據(jù)主要來(lái)自兩條渠道:一個(gè)是數(shù)據(jù)的間接來(lái)源,即數(shù)據(jù)是由別人通過(guò)調(diào)查或?qū)嶒?yàn)的方式搜集的,使用者只是找到它們并加以使用,對(duì)此我們稱為數(shù)據(jù)的間接來(lái)源。另一個(gè)是通過(guò)自己的調(diào)查或?qū)嶒?yàn)活動(dòng),直接獲得第一手?jǐn)?shù)據(jù),對(duì)此我們稱為數(shù)據(jù)的直接來(lái)源。本節(jié)將對(duì)獲取數(shù)據(jù)的這兩條渠道分別加以介紹。2.1.1數(shù)據(jù)的間接來(lái)源如果與研究?jī)?nèi)容有關(guān)的原信息已經(jīng)存在,我們只是對(duì)這些原信息重新加工、整理,使之成為我們進(jìn)行統(tǒng)計(jì)分析可以使用的數(shù)據(jù),則把它們稱為間接來(lái)源的數(shù)據(jù)。從搜集的范圍看,這些數(shù)據(jù)可以取自系統(tǒng)外部,也可以取自系統(tǒng)內(nèi)部。數(shù)據(jù)取自系統(tǒng)外部的主要渠道有:統(tǒng)計(jì)部門(mén)和各級(jí)政府部門(mén)公布的有關(guān)資料,如定期發(fā)布的統(tǒng)計(jì)公報(bào),定期出版的各類統(tǒng)計(jì)年鑒;各類經(jīng)濟(jì)信息中心、信息咨詢機(jī)構(gòu)、專業(yè)調(diào)查機(jī)構(gòu)、各行業(yè)協(xié)會(huì)和聯(lián)合會(huì)提供的市場(chǎng)信息和行業(yè)發(fā)展的數(shù)據(jù)情報(bào);各類專業(yè)期刊、報(bào)紙、書(shū)籍所提供的文獻(xiàn)資料;各種會(huì)議,如博覽會(huì)、展銷會(huì)、交易會(huì)及專業(yè)性、學(xué)術(shù)性研討會(huì)上交流的有關(guān)資料;從互聯(lián)網(wǎng)或圖書(shū)館查閱到的相關(guān)資料,等等。取自系統(tǒng)內(nèi)部的資料,如果就經(jīng)濟(jì)活動(dòng)而言,則主要包括業(yè)務(wù)資料,如與業(yè)務(wù)經(jīng)營(yíng)活動(dòng)有關(guān)的各種單據(jù)、記錄;經(jīng)營(yíng)活動(dòng)過(guò)程中的各種統(tǒng)計(jì)報(bào)表;各種財(cái)務(wù)、會(huì)計(jì)核算和分析資料等。相對(duì)而言,這種二手資料的搜集比較容易,采集數(shù)據(jù)的成本低,并且能很快得到。二手資料的作用也非常廣泛,除了分析所要研究的問(wèn)題,這些資料還可以提供研究問(wèn)題的背景,幫助研究者更好地定義問(wèn)題,檢驗(yàn)和回答某些疑問(wèn)和假設(shè),尋找研究問(wèn)題的思路和途徑。因此,搜集二手資料是研究者首先考慮并采用的。分析也應(yīng)該首先從對(duì)二手資料的分析開(kāi)始。但是,二手資料也有很大的局限性,研究者在使用二手資料時(shí)要保持謹(jǐn)慎的態(tài)度。因?yàn)槎仲Y料并不是為你特定的研究問(wèn)題而產(chǎn)生的,所以在回答你所研究的問(wèn)題方面可能是有欠缺的,如資料的相關(guān)性不夠,口徑可能不一致,數(shù)據(jù)也許不準(zhǔn)確,也許過(guò)時(shí)了,等等。因此,在使用二手資料前,對(duì)二手資料進(jìn)行評(píng)估是必要的。對(duì)二手資料進(jìn)行評(píng)估可以考慮如下一些內(nèi)容:(1)資料是誰(shuí)搜集的?這主要是考察數(shù)據(jù)搜集者的實(shí)力和社會(huì)信譽(yù)度。例如,對(duì)于全國(guó)性的宏觀數(shù)據(jù),與某個(gè)專業(yè)性的調(diào)查機(jī)構(gòu)相比,政府有關(guān)部門(mén)公布的數(shù)據(jù)可信度更高。(2)為什么目的而搜集?為了某個(gè)集團(tuán)的利益而搜集的數(shù)據(jù)是值得懷疑的。(3)數(shù)據(jù)是怎樣搜集的?搜集數(shù)據(jù)可以有多種方法,不同方法所采集到的數(shù)據(jù),其解釋力和說(shuō)服力都是不同的。如果不了解搜集數(shù)據(jù)所用的方法,很難對(duì)數(shù)據(jù)的質(zhì)量做出客觀的評(píng)價(jià)。數(shù)據(jù)的質(zhì)量來(lái)源于數(shù)據(jù)的產(chǎn)生過(guò)程。(4)什么時(shí)候搜集的?過(guò)時(shí)的數(shù)據(jù),其說(shuō)服力自然受到質(zhì)疑。使用二手?jǐn)?shù)據(jù),要注意數(shù)據(jù)的定義、含義、計(jì)算口徑和計(jì)算方法,避免錯(cuò)用、誤用、濫用。在引用二手?jǐn)?shù)據(jù)時(shí),應(yīng)注明數(shù)據(jù)的來(lái)源,以尊重他人的勞動(dòng)成果。2.1.2數(shù)據(jù)的直接來(lái)源雖然二手?jǐn)?shù)據(jù)具有搜集方便、數(shù)據(jù)采集快、采集成本低等優(yōu)點(diǎn),但對(duì)一個(gè)特定的研究問(wèn)題而言,二手資料的主要弱點(diǎn)是相關(guān)性不夠,所以僅僅靠二手資料還不能回答研究所提出的問(wèn)題,這時(shí)就要通過(guò)調(diào)查的方法和實(shí)驗(yàn)的方法直接獲得一手資料。我們把通過(guò)調(diào)查方法獲得的數(shù)據(jù)稱為調(diào)查數(shù)據(jù),把通過(guò)實(shí)驗(yàn)方法得到的數(shù)據(jù)稱為實(shí)驗(yàn)數(shù)據(jù)。調(diào)查通常是對(duì)社會(huì)現(xiàn)象而言的。例如,經(jīng)濟(jì)學(xué)家通過(guò)搜集經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)來(lái)分析經(jīng)濟(jì)形勢(shì)、某種經(jīng)濟(jì)現(xiàn)象的發(fā)展趨勢(shì)、經(jīng)濟(jì)現(xiàn)象之間的相互聯(lián)系和影響。社會(huì)學(xué)家通過(guò)搜集有關(guān)人的數(shù)據(jù)以了解人類行為。管理學(xué)家通過(guò)搜集生產(chǎn)、經(jīng)營(yíng)活動(dòng)的有關(guān)數(shù)據(jù)分析生產(chǎn)過(guò)程的協(xié)調(diào)性和效率。調(diào)查數(shù)據(jù)通常取自有限總體,即總體所包含的個(gè)體單位是有限的。如果調(diào)查針對(duì)總體中的所有個(gè)體單位進(jìn)行,就把這種調(diào)查稱為普查。普查數(shù)據(jù)具有信息全面、完整的特點(diǎn),對(duì)普查數(shù)據(jù)的全面分析和深入挖掘是統(tǒng)計(jì)分析的重要內(nèi)容。但是,當(dāng)總體較大時(shí),進(jìn)行普查將是一項(xiàng)很大的工程,由于普查涉及的范圍廣,接受調(diào)查的單位多,所以耗時(shí)、費(fèi)力,調(diào)查的成本也非常高,因此普查是不可能經(jīng)常進(jìn)行的。事實(shí)上,統(tǒng)計(jì)學(xué)家所面臨的經(jīng)常是樣本的數(shù)據(jù),如何從總體中抽取出一個(gè)有效的樣本,就成為統(tǒng)計(jì)學(xué)家需要考慮的一個(gè)問(wèn)題。對(duì)于調(diào)查數(shù)據(jù)將在2.2中專門(mén)討論。實(shí)驗(yàn)大多是對(duì)自然現(xiàn)象而言的。例如,化學(xué)家通過(guò)實(shí)驗(yàn)了解不同元素結(jié)合后產(chǎn)生的變化,農(nóng)學(xué)家通過(guò)實(shí)驗(yàn)了解水分、溫度對(duì)農(nóng)作物產(chǎn)量的影響,醫(yī)學(xué)家通過(guò)實(shí)驗(yàn)驗(yàn)證新藥的療效。但實(shí)驗(yàn)作為搜集數(shù)據(jù)的一種科學(xué)的方法也被廣泛運(yùn)用到社會(huì)科學(xué)中。心理學(xué)、教育學(xué)的研究中大量地使用實(shí)驗(yàn)的方法獲取所需要的數(shù)據(jù),社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)中也有許多使用實(shí)驗(yàn)方法獲得研究數(shù)據(jù)的案例。關(guān)于實(shí)驗(yàn)數(shù)據(jù),我們將在2.3中專門(mén)討論。2.2調(diào)查數(shù)據(jù)2.2.1概率抽樣和非概率抽樣在數(shù)據(jù)采集階段,統(tǒng)計(jì)學(xué)家面臨的一個(gè)關(guān)鍵問(wèn)題是如何抽選出一個(gè)好的樣本。好的樣本都是相對(duì)而言的,相對(duì)包括兩方面的含義:一個(gè)含義是針對(duì)研究的問(wèn)題而言的。不同的研究問(wèn)題,對(duì)樣本的要求會(huì)有所差別,對(duì)某一個(gè)研究問(wèn)題,這可能是一個(gè)不錯(cuò)的樣本,對(duì)另一個(gè)研究問(wèn)題,這個(gè)樣本可能就是糟糕的。例如,如果研究顧客的滿意度,樣本選取應(yīng)當(dāng)來(lái)自該產(chǎn)品的用戶,而如果了解消費(fèi)者對(duì)該產(chǎn)品的購(gòu)買(mǎi)意愿,樣本就應(yīng)當(dāng)取自所有潛在的購(gòu)買(mǎi)者。所以,進(jìn)行什么樣的抽樣設(shè)計(jì)首先取決于研究目的。另一個(gè)含義是針對(duì)調(diào)查費(fèi)用與估計(jì)精度的關(guān)系而言的。進(jìn)行數(shù)據(jù)搜集總要投入一定的調(diào)查費(fèi)用,調(diào)查中也希望獲得更多的高質(zhì)量的數(shù)據(jù)。但兩者往往是有矛盾的,一個(gè)好的樣本應(yīng)符合最好的性能價(jià)格比,即在相同調(diào)查費(fèi)用的條件下,獲得數(shù)據(jù)的估計(jì)精度最高,或在相同估計(jì)精度的條件下,調(diào)查成本最低。在研究中,我們對(duì)估計(jì)結(jié)果的精度要求是可以有差別的,有些問(wèn)題很重要,我們希望估計(jì)的精度高一些,有些數(shù)據(jù)相比而言不太重要,放松估計(jì)精度而節(jié)省大量調(diào)查費(fèi)用也是一個(gè)不錯(cuò)的選擇,正如對(duì)航天器中精密儀器主軸加工精度的要求和制作一根香腸時(shí)所要求的精度不能相提并論一樣,對(duì)投資股票收益率的估計(jì)和對(duì)電視節(jié)目收視率的估計(jì)精度的要求也可以有所不同,因?yàn)樗鼈円馕吨煌暮蠊?。使用抽樣的方式采集?shù)據(jù)的具體方式有許多種,可以將這些不同的方式分為兩類:概率抽樣和非概率抽樣。1.概率抽樣概率抽樣(probabilitysampling)也稱隨機(jī)抽樣,是指遵循隨機(jī)原則進(jìn)行的抽樣,總體中每個(gè)單位都有一定的機(jī)會(huì)被選入樣本。它具有下面幾個(gè)特點(diǎn):首先,抽樣時(shí)是按一定的概率以隨機(jī)原則抽取樣本。所謂隨機(jī)原則就是在抽取樣本時(shí)排除主觀上有意識(shí)地抽取調(diào)查單位,使每個(gè)單位都有一定的機(jī)會(huì)被抽中。需要注意的是,隨機(jī)不等于隨便,隨機(jī)有嚴(yán)格的科學(xué)含義,可以用概率來(lái)描述,而隨便則帶有人為的主觀的因素。例如,要在一棟樓內(nèi)抽取10位居民作為樣本,若采用隨機(jī)原則,就需要事先將居住在該樓的居民按某種順序編上號(hào),通過(guò)一定的隨機(jī)化程序,如使用隨機(jī)數(shù)表,抽取出樣本,這樣可以保證居住在該樓的每位居民都有一定的機(jī)會(huì)被選中。而如果調(diào)查人員站在樓前,將最先走出樓外的10位居民選入樣本,這就是隨便而不是隨機(jī),這種方法不能使居住在該樓內(nèi)的所有居民都有一定的機(jī)會(huì)被選中,已經(jīng)在樓外的人不可能被選中,在調(diào)查時(shí)段不外出的人也沒(méi)有機(jī)會(huì)被選中。隨機(jī)與隨便的本質(zhì)區(qū)別就在于,是否按照給定的入樣概率,通過(guò)一定的隨機(jī)化程序抽取樣本單元。其次,每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的。最后,當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率。這就是說(shuō),估計(jì)量不僅與樣本單位的觀測(cè)值有關(guān),也與其入樣概率有關(guān)。需要提及的是,概率抽樣與等概率抽樣是兩個(gè)不同的概念。當(dāng)我們談到概率抽樣時(shí),是指總體中的每個(gè)單位都有一定的非零概率被抽中,單位之間被抽中的概率可以相等,也可以不等。若是前者,稱為等概率抽樣;若是后者,稱為不等概率抽樣。調(diào)查的實(shí)踐中經(jīng)常采用的概率抽樣方式有以下幾種:(1)簡(jiǎn)單隨機(jī)抽樣。進(jìn)行概率抽樣需要抽樣框,抽樣框(samplingframe)通常包括所有總體單位的信息,如企業(yè)名錄(抽選企業(yè))、學(xué)生名冊(cè)(抽選學(xué)生)或住戶門(mén)牌號(hào)碼(抽選住戶)等。抽樣框的作用不僅在于提供備選單位的名單以供抽選,它還是計(jì)算各個(gè)單位入樣概率的依據(jù)。簡(jiǎn)單隨機(jī)抽樣(simplerandomsampling)就是從包括總體N個(gè)單位的抽樣框中隨機(jī)地、一個(gè)一個(gè)地抽取n個(gè)單位作為樣本,每個(gè)單位的入樣概率是相等的。抽樣的隨機(jī)性是通過(guò)抽樣的隨機(jī)化程序體現(xiàn)的,實(shí)施隨機(jī)化程序可以使用隨機(jī)數(shù)字表,也可以使用能產(chǎn)生符合要求的隨機(jī)數(shù)序列的計(jì)算機(jī)程序。本書(shū)最后的附錄部分,有一份截取的隨機(jī)數(shù)字表。隨機(jī)數(shù)字表是由數(shù)字0,1,…,9組成的表,每個(gè)數(shù)字都有同樣的機(jī)會(huì)被抽中。用隨機(jī)數(shù)字表抽取簡(jiǎn)單隨機(jī)樣本時(shí),可用下面兩種方法。方法一:根據(jù)總體單位個(gè)數(shù)N的位數(shù)決定在隨機(jī)數(shù)字表中隨機(jī)抽取幾列,如N=678,要抽取n=5的樣本,這時(shí)N為3位數(shù),則在隨機(jī)數(shù)字表中隨機(jī)抽取3列,順序往下,選出頭5個(gè)001~678之間互不相同的數(shù),如果這3列隨機(jī)數(shù)字不夠,可另選其他3列繼續(xù),直到抽滿n個(gè)單元為止。方法二:有時(shí)方法一的執(zhí)行效率可能不高,通常是首位數(shù)比較小的時(shí)候。假設(shè)N=327,首位數(shù)是3,比較小。如果按方法一,在隨機(jī)數(shù)字表中001~327的范圍內(nèi)抽選,有許多數(shù)就會(huì)大于327,例如在隨機(jī)數(shù)字表中抽到486,在001~327范圍之外,只好遺棄,比較可惜。這時(shí)可采用余數(shù)入樣的方法,即486÷327,商為1,余數(shù)為159,則第159個(gè)單位被抽中。如果在隨機(jī)數(shù)字表中抽到999,則999÷327,商為3,余數(shù)為18,則第18個(gè)單位被抽中,依此類推。在使用隨機(jī)數(shù)字表時(shí),為克服可能的個(gè)人習(xí)慣,增加隨機(jī)性,使用隨機(jī)數(shù)字表的頁(yè)號(hào)及起始點(diǎn)應(yīng)該由隨機(jī)數(shù)產(chǎn)生,如隨意翻開(kāi)一頁(yè),閉上眼睛,將火柴隨意扔到頁(yè)面上,將火柴頭所指的數(shù)字作為頁(yè)號(hào),同樣的方法產(chǎn)生起始行號(hào)和起始列號(hào)。簡(jiǎn)單隨機(jī)抽樣是一種最基本的抽樣方法,是其他抽樣方法的基礎(chǔ)。這種方法的突出特點(diǎn)是簡(jiǎn)單、直觀,在抽樣框完整時(shí),可以直接從中抽取樣本,由于抽選的概率相同,用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)及計(jì)算估計(jì)量誤差都比較方便。但簡(jiǎn)單隨機(jī)抽樣在實(shí)際應(yīng)用中也有一些局限性:首先,它要求包含所有總體單位的名單作為抽樣框,當(dāng)N很大時(shí),構(gòu)造這樣的抽樣框并不容易;其次,根據(jù)這種方法抽出的單位很分散,給實(shí)施調(diào)查增加了困難;最后,這種方法沒(méi)有利用其他輔助信息以提高估計(jì)的效率。所以,在規(guī)模較大的調(diào)查中,很少直接采用簡(jiǎn)單隨機(jī)抽樣,一般是把這種方法和其他抽樣方法結(jié)合起來(lái)使用。(2)分層抽樣。分層抽樣(stratifiedsampling)是將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。將各層的樣本結(jié)合起來(lái),對(duì)總體的目標(biāo)量進(jìn)行估計(jì)。分層抽樣有許多優(yōu)點(diǎn),例如,這種抽樣方法保證了樣本中包含有各種特征的抽樣單位,樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而可以有效地提高估計(jì)的精度;分層抽樣在一定條件下為組織實(shí)施調(diào)查提供了方便(當(dāng)層的劃分是按行業(yè)或行政區(qū)劃進(jìn)行時(shí));分層抽樣既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì),等等。這些優(yōu)點(diǎn)使分層抽樣在實(shí)踐中得到了廣泛的應(yīng)用。(3)整群抽樣。將總體中若干個(gè)單位合并為組,這樣的組稱為群。抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查,這樣的抽樣方法稱為整群抽樣(clustersampling)。與簡(jiǎn)單隨機(jī)抽樣相比,整群抽樣的特點(diǎn)在于:抽取樣本時(shí)只需要群的抽樣框,而不必要求具有所有單位的抽樣框,這就大大簡(jiǎn)化了編制抽樣框的工作量。其次,由于群通常是由那些地理位置鄰近的或隸屬于同一系統(tǒng)的單位所構(gòu)成,因此調(diào)查的地點(diǎn)相對(duì)集中,從而節(jié)省了調(diào)查費(fèi)用,方便了調(diào)查的實(shí)施。整群抽樣的主要弱點(diǎn)是估計(jì)的精度較差,因?yàn)橥蝗簝?nèi)的單位或多或少地有些相似,在樣本量相同的條件下,整群抽樣的抽樣誤差通常比較大。一般說(shuō)來(lái)要得到與簡(jiǎn)單隨機(jī)抽樣相同的精度,采用整群抽樣需要增加基本調(diào)查單位。(4)系統(tǒng)抽樣。將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位,這種抽樣方法被稱為系統(tǒng)抽樣(systematicsampling)。典型的系統(tǒng)抽樣是先從數(shù)字1~k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k,…。所以可以把系統(tǒng)抽樣看成是將總體內(nèi)的單位按順序分成k群,用相同的概率抽取出一群的方法。系統(tǒng)抽樣的主要優(yōu)點(diǎn)是操作簡(jiǎn)便,如果有輔助信息,對(duì)總體內(nèi)的單位進(jìn)行有組織的排列,可以有效地提高估計(jì)的精度。系統(tǒng)抽樣的缺點(diǎn)是對(duì)估計(jì)量方差的估計(jì)比較困難。系統(tǒng)抽樣方法在調(diào)查實(shí)踐中有廣泛的應(yīng)用。(5)多階段抽樣。采用類似整群抽樣的方法,首先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查。因?yàn)槿〉眠@些接受調(diào)查的單位需要兩個(gè)步驟,所以將這種抽樣方式稱為二階段抽樣。這里,群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將這種方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣(multi-stagesampling)。例如第一階段抽取初級(jí)單位,第二階段抽取二級(jí)單位,第三階段抽取接受調(diào)查的最終單位就是三階段抽樣,同樣的方法還可以定義四階段抽樣。不過(guò),即便是大規(guī)模的抽樣調(diào)查,抽取樣本的階段也應(yīng)當(dāng)盡可能地減少。因?yàn)槊吭黾右粋€(gè)抽樣階段,就會(huì)增添一份估計(jì)誤差,用樣本對(duì)總體進(jìn)行估計(jì)也更加復(fù)雜。多階段抽樣具有整群抽樣的優(yōu)點(diǎn),它保證了樣本相對(duì)集中,從而節(jié)約了調(diào)查費(fèi)用;不需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣的范圍內(nèi)展開(kāi)。在較大規(guī)模的抽樣調(diào)查中,多階段抽樣是經(jīng)常采用的方法。以上介紹了幾種常見(jiàn)的概率抽樣方式。概率抽樣最主要的優(yōu)點(diǎn)是,可以依據(jù)調(diào)查結(jié)果,計(jì)算估計(jì)量誤差,從而得到對(duì)總體目標(biāo)量進(jìn)行推斷的可靠程度。從另一個(gè)方面講,也可以按照要求的精確度,計(jì)算必要的樣本單位數(shù)目。所有這些都為統(tǒng)計(jì)估計(jì)結(jié)果的評(píng)估提供了有力的依據(jù),所以,統(tǒng)計(jì)分析的樣本主要是概率樣本,即樣本是采用概率抽樣方式得到的。2.非概率抽樣非概率抽樣(non-probabilitysampling)是相對(duì)于概率抽樣而言的,指抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查。非概率抽樣的方式有許多種,可以歸為以下幾種類型。(1)方便抽樣。調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位。例如,調(diào)查員在街頭、公園、商店等公共場(chǎng)所進(jìn)行攔截式的調(diào)查;廠家在出售產(chǎn)品的柜臺(tái)前對(duì)路過(guò)的顧客進(jìn)行的調(diào)查,等等。方便抽樣的最大特點(diǎn)是容易實(shí)施,調(diào)查的成本低,但這種抽樣方式也有明顯的弱點(diǎn)。例如,樣本單位的確定帶有隨意性,因此,方便樣本無(wú)法代表有明確定義的總體,將方便樣本的調(diào)查結(jié)果推廣到總體是沒(méi)有任何意義的。因此,如果研究的目的是對(duì)總體有關(guān)的參數(shù)進(jìn)行推斷,使用方便樣本是不合適的。但在科學(xué)研究中,使用方便樣本可以產(chǎn)生一些想法以及對(duì)研究?jī)?nèi)容的初步認(rèn)識(shí),或建立假設(shè)。(2)判斷抽樣。判斷抽樣是另一種比較方便的抽樣方式,是指研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的地選擇一些單位作為樣本,實(shí)施時(shí)根據(jù)不同的目的有重點(diǎn)抽樣、典型抽樣、代表抽樣等方式。重點(diǎn)抽樣是從調(diào)查對(duì)象的全部單位中選擇少數(shù)重點(diǎn)單位,對(duì)其實(shí)施調(diào)查。這些重點(diǎn)單位的數(shù)量雖然不多,但在總體中占有重要地位。例如,要了解全國(guó)鋼鐵企業(yè)的生產(chǎn)狀況,可以選擇產(chǎn)量較大的幾個(gè)鋼鐵企業(yè),如寶鋼、鞍鋼、首鋼等,對(duì)這些重點(diǎn)單位進(jìn)行調(diào)查,就可以了解鋼鐵產(chǎn)量的大致情況及產(chǎn)量變化的基本走勢(shì)。典型抽樣是從總體中選擇若干個(gè)典型的單位進(jìn)行深入的調(diào)研,目的是通過(guò)典型單位來(lái)描述或揭示所研究問(wèn)題的本質(zhì)和規(guī)律,因此,選擇的典型單位應(yīng)該具有研究問(wèn)題的本質(zhì)或特征。例如,研究青少年犯罪問(wèn)題,可以選擇一些典型的犯人,對(duì)其做深入細(xì)致的調(diào)查,掌握大量一手資料,進(jìn)而分析青少年犯罪的一般規(guī)律。代表抽樣是通過(guò)分析,選擇具有代表性的單位作為樣本,在某種程度上,也具有典型抽樣的含義。例如,某奶粉生產(chǎn)企業(yè)欲了解消費(fèi)者對(duì)奶粉成分的需求,可以調(diào)查一些年輕的母親,因?yàn)樗齻冑?gòu)買(mǎi)奶粉的數(shù)量較大,并對(duì)奶粉的成分有更高的要求,通過(guò)她們,可以了解消費(fèi)者購(gòu)買(mǎi)奶粉時(shí)的選擇意向。判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗(yàn)、專業(yè)程度和創(chuàng)造性。這種方式的抽樣成本比較低,也容易操作,但由于樣本是人為確定的,沒(méi)有依據(jù)隨機(jī)的原則,因而調(diào)查結(jié)果不能用于對(duì)總體有關(guān)參數(shù)進(jìn)行估計(jì)。(3)自愿樣本。自愿樣本指被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息。例如,參與報(bào)刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問(wèn)卷活動(dòng),向某類節(jié)目撥打熱線電話等,都屬于自愿樣本。自愿樣本與抽樣的隨機(jī)性無(wú)關(guān),樣本的組成往往集中于某類特定的人群,尤其集中于對(duì)該調(diào)查活動(dòng)感興趣的人群,因此,這種樣本是有偏的。我們不能依據(jù)樣本的信息對(duì)總體的狀況進(jìn)行估計(jì),但自愿樣本仍可以給研究人員提供許多有價(jià)值的信息,它可以反映某類群體的一般看法。(4)滾雪球抽樣。滾雪球抽樣往往用于對(duì)稀少群體的調(diào)查。在滾雪球抽樣中,首先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供另外一些屬于研究總體的調(diào)查對(duì)象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過(guò)程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)。例如,欲對(duì)冬泳愛(ài)好者進(jìn)行某項(xiàng)調(diào)查,調(diào)查人員首先找到若干名冬泳愛(ài)好者,然后通過(guò)他們找到更多的冬泳愛(ài)好者。滾雪球抽樣也屬于非概率抽樣,因?yàn)榕c隨機(jī)抽取的被調(diào)查者相比,被推薦的被調(diào)查者在許多方面與推薦他們的那些人更為相似。滾雪球抽樣的主要優(yōu)點(diǎn)是容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低。它適合對(duì)特定群體進(jìn)行研究的資料搜集。(5)配額抽樣。配額抽樣類似于概率抽樣中的分層抽樣,在市場(chǎng)調(diào)查中有廣泛的應(yīng)用。它是首先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位。這種抽樣方式操作比較簡(jiǎn)單,而且可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似。但因?yàn)樵诔槿【唧w樣本單位時(shí),并不是依據(jù)隨機(jī)原則,所以它屬于非概率抽樣。在配額抽樣中,可以按單一變量控制,也可以按交叉變量控制。表2—1是單一變量控制的例子。在一個(gè)城市中采用配額抽樣抽出一個(gè)n=500的樣本??刂谱兞坑心挲g和性別,配額是按單個(gè)變量分別分配的,如各個(gè)年齡段上的配額和性別的配額。這種配額抽樣操作比較簡(jiǎn)便,但有可能出現(xiàn)偏斜,如年齡低的均為女性,年齡高的均為男性。表2—2是交叉變量控制的例子。表2—1單一變量控制配額分配表表2—2交叉變量控制配額分配表交叉變量配額控制可以保證樣本的分布更為均勻,但現(xiàn)場(chǎng)調(diào)查中為了保證配額的實(shí)現(xiàn),尤其是在調(diào)查接近結(jié)束時(shí),所選的樣本單位要同時(shí)滿足特定的配額,操作的難度可能要大一些。3.概率抽樣與非概率抽樣的比較概率抽樣與非概率抽樣是性質(zhì)不同的兩種抽樣類型,在調(diào)查中采用何種抽樣類型,取決于多種因素,包括研究問(wèn)題的性質(zhì)、使用數(shù)據(jù)要說(shuō)明的問(wèn)題、調(diào)查對(duì)象的特征、調(diào)查費(fèi)用、時(shí)間等因素。由于非概率抽樣不是依據(jù)隨機(jī)原則抽選樣本,樣本統(tǒng)計(jì)量的分布是不確切的,因而無(wú)法使用樣本的結(jié)果對(duì)總體相應(yīng)的參數(shù)進(jìn)行推斷。如果調(diào)查的目標(biāo)是用樣本的調(diào)查結(jié)果對(duì)總體相應(yīng)的參數(shù)進(jìn)行估計(jì),并計(jì)算估計(jì)的誤差,得到總體參數(shù)的置信區(qū)間,這時(shí)就不適合采用非概率抽樣。非概率樣本的特點(diǎn)是操作簡(jiǎn)便、時(shí)效快、成本低,而且對(duì)于抽樣中的統(tǒng)計(jì)學(xué)專業(yè)技術(shù)要求不是很高。非概率抽樣適合探索性的研究,調(diào)查的結(jié)果用于發(fā)現(xiàn)問(wèn)題,為更深入的數(shù)量分析提供準(zhǔn)備。非概率抽樣也適合市場(chǎng)調(diào)查中的概念測(cè)試,如產(chǎn)品包裝測(cè)試、廣告測(cè)試等。概率抽樣是依據(jù)隨機(jī)原則抽選樣本,這時(shí)樣本統(tǒng)計(jì)量的理論分布是存在的,因此可以根據(jù)調(diào)查的結(jié)果對(duì)總體的有關(guān)參數(shù)進(jìn)行估計(jì),計(jì)算估計(jì)誤差,得到總體參數(shù)的置信區(qū)間,并且在進(jìn)行抽樣設(shè)計(jì)時(shí),對(duì)估計(jì)的精度提出要求,計(jì)算為滿足特定精度要求所需要的樣本量。所以,如果調(diào)查的目的在于掌握研究對(duì)象總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就應(yīng)當(dāng)使用概率抽樣的方法。當(dāng)然,概率抽樣的技術(shù)含量更高,無(wú)論是抽選樣本還是對(duì)調(diào)查數(shù)據(jù)進(jìn)行分析,都要求有較高的統(tǒng)計(jì)學(xué)專業(yè)知識(shí),調(diào)查的成本也比非概率抽樣的調(diào)查成本高。有時(shí)在一項(xiàng)研究項(xiàng)目中,也可以把概率抽樣和非概率抽樣相結(jié)合,發(fā)揮各自的特點(diǎn),滿足研究中的不同需求。鑒于概率抽樣對(duì)統(tǒng)計(jì)學(xué)專業(yè)知識(shí)的需求,在本書(shū)后面對(duì)統(tǒng)計(jì)方法的討論中,若沒(méi)有特殊說(shuō)明,均假定數(shù)據(jù)取自概率樣本。同樣需要說(shuō)明,由于概率抽樣又有抽取樣本的不同方式(參見(jiàn)前面對(duì)概率抽樣的討論),而本書(shū)并不是論述抽樣技術(shù)的專門(mén)書(shū)籍,所以在本書(shū)后面的討論中均假定樣本是采用簡(jiǎn)單隨機(jī)抽樣的方式抽選出的,這樣有助于我們集中把握推斷統(tǒng)計(jì)的基本原理。對(duì)其他抽樣方式感興趣的讀者,請(qǐng)參閱抽樣技術(shù)專門(mén)的書(shū)籍。2.2.2搜集數(shù)據(jù)的基本方法樣本單位確定之后,對(duì)這些單位實(shí)施調(diào)查,即從樣本單位那里得到所需要的數(shù)據(jù),可以采用不同的方法。搜集數(shù)據(jù)的基本方法有以下幾種。1.自填式自填式指在沒(méi)有調(diào)查員協(xié)助的情況下由被調(diào)查者自己填寫(xiě),完成調(diào)查問(wèn)卷。把問(wèn)卷遞送給被調(diào)查者的方法有很多,如調(diào)查員分發(fā),通過(guò)郵寄方式,通過(guò)網(wǎng)絡(luò)方式,或把問(wèn)卷刊登在媒體上,等等。由于被調(diào)查者在填答問(wèn)卷時(shí)調(diào)查員一般不在現(xiàn)場(chǎng),對(duì)于問(wèn)卷中的疑問(wèn)無(wú)人解答,所以這種方法要求調(diào)查問(wèn)卷結(jié)構(gòu)嚴(yán)謹(jǐn),有清楚的說(shuō)明,讓被調(diào)查者一看就知道如何完成問(wèn)卷。與其他調(diào)查方式相比,自填式問(wèn)卷應(yīng)有制作詳細(xì)、形象友好的說(shuō)明,必要時(shí)可在問(wèn)卷上提供調(diào)查人員的聯(lián)系電話,以便被調(diào)查者遇到疑問(wèn)時(shí)與調(diào)查員聯(lián)絡(luò)。自填式方法通常要求被調(diào)查者具有一定的文化素養(yǎng),可以讀懂問(wèn)卷,能正確理解調(diào)查問(wèn)卷中的問(wèn)題并進(jìn)行回答。與其他搜集數(shù)據(jù)的方式相比,調(diào)查組織者對(duì)自填式方法的管理相對(duì)容易,只要把問(wèn)卷正確地送達(dá)被調(diào)查者手中即可。自填式的調(diào)查成本也是最低的,增大樣本量對(duì)調(diào)查費(fèi)用的影響很小,所以可以進(jìn)行大范圍的調(diào)查。這種方式也有利于被調(diào)查者,他們可以選擇方便的時(shí)間填答問(wèn)卷,可以參考有關(guān)記錄而不必依靠記憶進(jìn)行回答。由于填寫(xiě)問(wèn)卷時(shí)調(diào)查員不在場(chǎng),因而自填式方法也可以在一定程度上減小被調(diào)查者回答敏感性問(wèn)題的壓力。自填式方法的弱點(diǎn)也是明顯的。首先,問(wèn)卷的回收率比較低,因?yàn)楸徽{(diào)查者往往不夠重視,在完成問(wèn)卷方面沒(méi)有壓力,所以把問(wèn)卷放棄不答。同時(shí),由于不重視,被調(diào)查者也容易把問(wèn)卷丟失和遺忘。所以采用自填式方法時(shí),通常需要做很多跟蹤回訪工作以取得較高的回收率。其次,自填式方法不適合結(jié)構(gòu)復(fù)雜的問(wèn)卷,因?yàn)樵S多被調(diào)查者不會(huì)去認(rèn)真閱讀填寫(xiě)問(wèn)卷的指南,如果問(wèn)卷中出現(xiàn)跳答、轉(zhuǎn)答這樣的問(wèn)題,被調(diào)查者往往出現(xiàn)回答錯(cuò)誤,而如果問(wèn)卷中不使用跳答、轉(zhuǎn)答這樣的技術(shù)手段,研究人員可能就無(wú)法搜集到最合適的所需信息。因此,自填式方法對(duì)調(diào)查的內(nèi)容會(huì)有所局限。此外,自填式方法的調(diào)查周期通常都比較長(zhǎng),調(diào)查人員也需要對(duì)問(wèn)卷的遞送和回收方法進(jìn)行仔細(xì)的研究和選擇。最后,對(duì)于在數(shù)據(jù)搜集過(guò)程中出現(xiàn)的問(wèn)題,一般難以及時(shí)采取調(diào)改措施。2.面訪式面訪式是指現(xiàn)場(chǎng)調(diào)查中調(diào)查員與被調(diào)查者面對(duì)面,調(diào)查員提問(wèn)、被調(diào)查者回答這種調(diào)查方式。面訪式的主要優(yōu)點(diǎn)是,由于是面對(duì)面的交流,調(diào)查人員可以激勵(lì)被調(diào)查者的參與意識(shí),對(duì)不愿意參與的被訪者進(jìn)行說(shuō)服工作,由此提高調(diào)查的回答率。調(diào)查員可以在現(xiàn)場(chǎng)解釋問(wèn)卷,回答被調(diào)查者的問(wèn)題,同時(shí),對(duì)被調(diào)查者的回答進(jìn)行鑒別和澄清,提高調(diào)查數(shù)據(jù)的質(zhì)量,并且可以對(duì)識(shí)字率低的群體實(shí)施調(diào)查。由于調(diào)查問(wèn)卷是由經(jīng)過(guò)培訓(xùn)的調(diào)查員所控制的,所以在問(wèn)卷設(shè)計(jì)中可以采用更多的技術(shù)手段,使得調(diào)查問(wèn)題的組合更為科學(xué)、合理。而且,在面訪調(diào)查中,還可以借助其他調(diào)查工具(圖片、照片、卡片、實(shí)物等)豐富調(diào)查內(nèi)容。面訪式的數(shù)據(jù)搜集方法還有一個(gè)優(yōu)點(diǎn),即它能對(duì)數(shù)據(jù)搜集所花費(fèi)的時(shí)間進(jìn)行調(diào)節(jié),如果數(shù)據(jù)搜集進(jìn)展太慢,需要加快速度,就可以雇用更多的調(diào)查員,而這在使用自填式方法時(shí)是不可能的。面訪式方法的弱點(diǎn)主要有:首先,調(diào)查的成本比較高,因?yàn)橐姓{(diào)查員的培訓(xùn)費(fèi)用、調(diào)查員的工資、面訪調(diào)查中送給被調(diào)查者的小禮品和調(diào)查員的交通費(fèi)用等,而且調(diào)查費(fèi)用與樣本量關(guān)系十分密切,所以,在大樣本調(diào)查中,研究人員面臨著調(diào)查成本的巨大壓力。其次,面訪這種搜集數(shù)據(jù)的方式對(duì)調(diào)查過(guò)程的質(zhì)量控制有一定難度,調(diào)查的數(shù)據(jù)質(zhì)量與調(diào)查員的工作態(tài)度、責(zé)任心有直接關(guān)系,當(dāng)大量調(diào)查員參與調(diào)查時(shí),如何保證高質(zhì)量的現(xiàn)場(chǎng)操作就是一個(gè)很重要的問(wèn)題。此外,對(duì)于敏感性問(wèn)題,除非對(duì)調(diào)查員進(jìn)行角色篩選,對(duì)調(diào)查員的訪談技巧進(jìn)行專門(mén)的技術(shù)培訓(xùn),否則,在面對(duì)面條件下,被調(diào)查者通常不會(huì)像自填式方法下那樣放松,也不愿意回答。3.電話式電話式是指調(diào)查人員通過(guò)打電話的方式向被調(diào)查者實(shí)施調(diào)查。電話調(diào)查的最大特點(diǎn)是速度快,能夠在很短的時(shí)間內(nèi)完成調(diào)查。電話調(diào)查特別適合樣本單位十分分散的情況,由于不需要支付調(diào)查員的交通費(fèi),數(shù)據(jù)搜集的成本大大下降。電話調(diào)查對(duì)調(diào)查員也是安全的,他們不必在晚上走訪偏僻的居民區(qū),而在面訪調(diào)查中,這些都是不可避免的。在電話調(diào)查中,對(duì)訪問(wèn)過(guò)程的控制也比較容易,因?yàn)檎{(diào)查員的工作地點(diǎn)都在一起,調(diào)查中遇到的問(wèn)題可以得到及時(shí)處理和解決,調(diào)查督導(dǎo)對(duì)訪問(wèn)實(shí)施監(jiān)聽(tīng)也很容易。目前,這方面的技術(shù)正在向計(jì)算機(jī)輔助電話調(diào)查(computerassistedtelephoneinterview,CATI)方向發(fā)展。CATI系統(tǒng)把計(jì)算機(jī)與電話訪問(wèn)連接起來(lái),調(diào)查的問(wèn)卷輸入計(jì)算機(jī),調(diào)查員在計(jì)算機(jī)屏幕前操作,隨機(jī)樣本的抽選由計(jì)算機(jī)完成,由計(jì)算機(jī)進(jìn)行自動(dòng)撥號(hào),調(diào)查員將調(diào)查結(jié)果(用鼠標(biāo)點(diǎn)擊選項(xiàng))輸入計(jì)算機(jī),設(shè)計(jì)的程序可以對(duì)錄入的結(jié)果進(jìn)行邏輯審核,從而保證了數(shù)據(jù)的合理性。可以在調(diào)查過(guò)程中隨時(shí)得到即時(shí)的調(diào)查結(jié)果統(tǒng)計(jì),從而發(fā)現(xiàn)樣本結(jié)構(gòu)、樣本分布等有關(guān)問(wèn)題,并及時(shí)采取相應(yīng)措施,使得樣本的組成更為合理。對(duì)于無(wú)人接聽(tīng),或?qū)Ψ揭驗(yàn)槊Γ壳盁o(wú)法接受調(diào)查等特殊情況,CATI系統(tǒng)可以自動(dòng)記載下來(lái),并在適當(dāng)?shù)臅r(shí)候向調(diào)查人員做出提示,對(duì)這些樣本單位進(jìn)行重新調(diào)查。目前在發(fā)達(dá)國(guó)家,使用CATI系統(tǒng)已經(jīng)成為數(shù)據(jù)搜集的最主要方法。我國(guó)電話擁有率增長(zhǎng)很快,使用電話調(diào)查的方式搜集數(shù)據(jù)有廣闊的發(fā)展空間。電話調(diào)查也有一定的局限性。因?yàn)殡娫捳{(diào)查的工具是電話,如果被調(diào)查者沒(méi)有電話,調(diào)查將無(wú)法實(shí)施。所以在電話擁有率不高的地區(qū),電話調(diào)查這種方式就受到限制。另外,使用電話進(jìn)行訪問(wèn)的時(shí)間不能太長(zhǎng),人們不愿意通過(guò)電話進(jìn)行冗長(zhǎng)的交談,被訪者對(duì)這項(xiàng)調(diào)查的內(nèi)容并不感興趣時(shí)就更是如此。同時(shí),電話調(diào)查所使用的問(wèn)卷要簡(jiǎn)單,如果問(wèn)卷答案的選項(xiàng)過(guò)長(zhǎng)、過(guò)多,被調(diào)查者聽(tīng)了后面,忘了前面,不僅造成調(diào)查進(jìn)度的延緩,被調(diào)查者還很容易掛斷電話。最后,與面訪式相比,電話調(diào)查由于不是面對(duì)面的交流,在被訪者不愿意接受調(diào)查時(shí),要說(shuō)服他們就更為困難。此外,搜集數(shù)據(jù)的方法還有觀察式,即調(diào)查人員通過(guò)直接觀測(cè)的方法獲取信息,如利用安置在超市中的錄像設(shè)備觀察顧客挑選商品時(shí)的表情;在十字路口通過(guò)計(jì)數(shù)的方法估算車流量等。4.?dāng)?shù)據(jù)搜集方法的選擇搜集數(shù)據(jù)的不同方法各有特點(diǎn),在考慮選擇數(shù)據(jù)搜集方法時(shí),有些問(wèn)題是需要考慮的。(1)抽樣框中的有關(guān)信息。抽樣框中的有關(guān)信息是影響方法選擇的一個(gè)因素。如果抽樣框中沒(méi)有通信地址,就不能將自填式問(wèn)卷寄給被調(diào)查者;如果沒(méi)有計(jì)算機(jī)隨機(jī)數(shù)字撥號(hào)系統(tǒng),又沒(méi)有電話號(hào)碼的抽樣框,電話調(diào)查的概率樣本就難以產(chǎn)生,這時(shí),電話訪問(wèn)方式就無(wú)法使用。(2)目標(biāo)總體的特征。目標(biāo)總體的特征也影響數(shù)據(jù)搜集方法。目標(biāo)總體的特征表現(xiàn)在多個(gè)方面。例如,如果總體的識(shí)字率很低,對(duì)問(wèn)卷的理解有困難,就不宜使用自填式方法。樣本的地理分布也很重要,如果樣本單位分布很廣,地域跨度大,進(jìn)行面訪調(diào)查的交通費(fèi)用就會(huì)很高,而且調(diào)查過(guò)程的管理和質(zhì)量監(jiān)控也不容易。(3)調(diào)查問(wèn)題的內(nèi)容。調(diào)查問(wèn)題的內(nèi)容也會(huì)影響數(shù)據(jù)搜集。對(duì)于比較復(fù)雜的問(wèn)題,面訪調(diào)查比較適合,因?yàn)檎{(diào)查員可以在現(xiàn)場(chǎng)對(duì)模糊的問(wèn)題進(jìn)行解釋和澄清,并判斷被訪者對(duì)問(wèn)題是否真正理解,調(diào)查問(wèn)卷的設(shè)計(jì)也可以采用更多技術(shù),如跳答、轉(zhuǎn)答等,使搜集的數(shù)據(jù)滿足研究的需求。而如果調(diào)查的問(wèn)題涉及一些敏感性問(wèn)題,那么設(shè)置匿名的數(shù)據(jù)搜集方法,如自填式或電話調(diào)查可能更合適。(4)有形輔助物的使用。有形輔助物的使用對(duì)調(diào)查常常是有幫助或是必要的,例如在調(diào)查期間顯示產(chǎn)品、產(chǎn)品的樣本、廣告或促銷演示等,在一些市場(chǎng)調(diào)查中,有時(shí)還需要被調(diào)查者試用產(chǎn)品,然后接受調(diào)查。在這些情況下,面訪式是最合適的方法。通過(guò)郵寄問(wèn)卷的自填式也可以有一些效果,因?yàn)榭梢噪S問(wèn)卷同時(shí)郵寄有關(guān)調(diào)查內(nèi)容的圖片。但電話調(diào)查對(duì)有形輔助物的使用就受到限制。(5)實(shí)施調(diào)查的資源。實(shí)施調(diào)查的資源會(huì)對(duì)搜集數(shù)據(jù)方法產(chǎn)生重大影響。這些資源包括經(jīng)費(fèi)預(yù)算、人員、調(diào)查設(shè)備和調(diào)查所需時(shí)間。面訪調(diào)查的費(fèi)用是最高的,需要支付調(diào)查員的勞務(wù)費(fèi)、調(diào)查交通費(fèi)、被訪者的禮品費(fèi)等,還要找到能夠滿足調(diào)查需要的一定數(shù)量的調(diào)查員。如果使用計(jì)算機(jī)輔助電話調(diào)查,就需要有計(jì)算機(jī)設(shè)備和CATI操作系統(tǒng)。(6)管理與控制。有些數(shù)據(jù)搜集方法比另一些方法更容易管理。例如,在電話調(diào)查中,調(diào)查員通常集中在調(diào)查中心一起工作,因此,管理和控制相對(duì)簡(jiǎn)單。而面訪調(diào)查中調(diào)查員是分散、獨(dú)立地進(jìn)行工作,對(duì)他們的管理與控制就有一定困難。(7)質(zhì)量要求。質(zhì)量要求也是確定數(shù)據(jù)搜集方法的一個(gè)重要因素。如果調(diào)查員是經(jīng)過(guò)考核選拔出來(lái)的,有較好的素質(zhì)和責(zé)任心,并經(jīng)過(guò)專門(mén)的培訓(xùn),這時(shí)面訪調(diào)查就能夠有效地減小被訪者的回答誤差。例如,對(duì)于調(diào)查中所使用的概念,調(diào)查員能夠給出清晰無(wú)誤的解釋;有經(jīng)驗(yàn)的調(diào)查員還可以對(duì)被訪者回答的真實(shí)性做出判斷,并使用調(diào)查詢問(wèn)中的相關(guān)技術(shù)進(jìn)行澄清,以保證高質(zhì)量的數(shù)據(jù)。回答率也是影響數(shù)據(jù)質(zhì)量的一個(gè)重要方面。由于面訪具有面對(duì)面交流的有利條件,所以一般而言,面訪式的回答率最高,而自填式的回答率最低。但面訪式的調(diào)查成本也是最高的,而自填式的調(diào)查成本最低。三種搜集數(shù)據(jù)方法的特點(diǎn)如表2—3所示。表2—3搜集數(shù)據(jù)不同方法的特點(diǎn)由此可知,沒(méi)有哪一種方法在所有方面都是最好的,因此,在數(shù)據(jù)搜集使用方法的選擇中要根據(jù)調(diào)查所需要信息的性質(zhì)、調(diào)查對(duì)象的特點(diǎn)、對(duì)數(shù)據(jù)質(zhì)量和回答率的要求,以及預(yù)算費(fèi)用和時(shí)間要求等多方面因素綜合而定。也許沒(méi)有一種方法是適用的,這時(shí)就要考慮研究人員對(duì)數(shù)據(jù)需求的最主要方面。需要說(shuō)明的是,各種方法并不是相互排斥的;相反,在許多方面恰恰是相互補(bǔ)充的,因此,在一項(xiàng)調(diào)研活動(dòng)中將各種方法結(jié)合起來(lái)使用也許是不錯(cuò)的選擇。例如,對(duì)被選中的調(diào)查單位首先采用郵寄問(wèn)卷,讓受訪者自填的方式,對(duì)沒(méi)有返回問(wèn)卷的受訪者,再進(jìn)行電話追訪或面訪。2.3實(shí)驗(yàn)數(shù)據(jù)搜集數(shù)據(jù)的另一類方法是通過(guò)實(shí)驗(yàn),在實(shí)驗(yàn)中控制一個(gè)或多個(gè)變量,在有控制的條件下得到觀測(cè)結(jié)果。所以,實(shí)驗(yàn)數(shù)據(jù)(experimentdata)是指在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而搜集到的變量的數(shù)據(jù)。例如,對(duì)在一起飼養(yǎng)的一群牲畜,分別喂給不同的飼料,以檢驗(yàn)不同飼料對(duì)牲畜增重的影響。實(shí)驗(yàn)是檢驗(yàn)變量間因果關(guān)系的一種方法。在實(shí)驗(yàn)中,研究人員要控制某一情形的所有相關(guān)方面,操縱少數(shù)感興趣的變量,然后觀察實(shí)驗(yàn)的結(jié)果。2.3.1實(shí)驗(yàn)組和對(duì)照組實(shí)驗(yàn)不僅是搜集數(shù)據(jù)的一種方式,而且是一種研究方法。實(shí)驗(yàn)法的基本邏輯是:有意識(shí)地改變某個(gè)變量的情況(不妨設(shè)為A項(xiàng)),然后看另一個(gè)變量變化的情況(不妨設(shè)為B項(xiàng))。如果B項(xiàng)隨著A項(xiàng)的變化而變化,就說(shuō)明A項(xiàng)對(duì)B項(xiàng)有影響。為此,需要將研究對(duì)象分為兩組,一個(gè)為實(shí)驗(yàn)組,一個(gè)為對(duì)照組。實(shí)驗(yàn)組(experimentgroup)是指隨機(jī)抽選的實(shí)驗(yàn)對(duì)象的子集。在這個(gè)子集中,每個(gè)單位接受某種特別的處理。而在對(duì)照組(controlgroup)中,每個(gè)單位不接受實(shí)驗(yàn)組成員所接受的某種特別的處理。早在17世紀(jì)初,英國(guó)海軍就試圖運(yùn)用實(shí)驗(yàn)法找到壞血病的起因。當(dāng)時(shí),在海上長(zhǎng)期航行的水手們面臨壞血病的威脅,皮膚上有青灰斑點(diǎn),牙齦大量出血,英國(guó)海軍部懷疑這是由于缺乏柑橘類水果所導(dǎo)致的。當(dāng)這個(gè)想法被提出時(shí),恰好有四艘海軍軍艦正要離開(kāi)英國(guó)本土做長(zhǎng)期航行,為調(diào)查是否是因?yàn)槿狈Ω涕兕愃鴮?dǎo)致這種疾病,海軍部安排其中一艘軍艦上的水手每天喝柑橘汁,而其他三艘軍艦上的水手則沒(méi)有柑橘汁供應(yīng)。航行還未結(jié)束,沒(méi)有喝柑橘汁的水手們開(kāi)始成批地生病,以至于不得不把每天喝柑橘汁的水手分配到這三艘軍艦上以幫助這些軍艦進(jìn)港。在這項(xiàng)實(shí)驗(yàn)中,喝柑橘汁的水手們構(gòu)成了實(shí)驗(yàn)組,沒(méi)有喝柑橘汁的水手們構(gòu)成了對(duì)照組,需要對(duì)照組的原因是,若沒(méi)有對(duì)照組,就無(wú)法判定A項(xiàng)是否對(duì)B項(xiàng)產(chǎn)生影響。設(shè)想,如果四艘軍艦上的水手們都喝柑橘汁,那么,沒(méi)有得壞血病的原因是什么就無(wú)法驗(yàn)證。一個(gè)好的實(shí)驗(yàn)設(shè)計(jì)都有一個(gè)實(shí)驗(yàn)組和一個(gè)或多個(gè)對(duì)照組。但是,英國(guó)海軍的實(shí)驗(yàn)還是有欠缺的,主要表現(xiàn)在兩點(diǎn);首先,實(shí)驗(yàn)組和對(duì)照組所處的外部環(huán)境應(yīng)該相同,在這個(gè)原則下,每艘船上都應(yīng)該有喝柑橘汁和不喝柑橘汁的實(shí)驗(yàn)者,這樣就排除了船的因素的影響。其次,實(shí)驗(yàn)者在哪個(gè)組應(yīng)該隨機(jī)產(chǎn)生,否則,喜歡喝柑橘汁的人跑到了實(shí)驗(yàn)組,而喜歡喝酒的人在對(duì)照組,在研究開(kāi)始之前兩組的人員身體狀況就存在差異,這樣就無(wú)法說(shuō)明問(wèn)題。如果實(shí)驗(yàn)對(duì)象是隨機(jī)安排的,那么健康和不健康的水手在每一組中的數(shù)目差不多,身體狀況對(duì)導(dǎo)致壞血病的影響就被抵消了,實(shí)驗(yàn)數(shù)據(jù)才有更高的可信度。一個(gè)好的實(shí)驗(yàn),對(duì)照組和實(shí)驗(yàn)組的產(chǎn)生不僅應(yīng)該是隨機(jī)的,而且應(yīng)該是匹配的。所謂匹配,是指對(duì)實(shí)驗(yàn)單位的背景材料進(jìn)行分析比較,將情況類似的每對(duì)單位分別隨機(jī)地分配到實(shí)驗(yàn)組和對(duì)照組。例如,在實(shí)驗(yàn)新藥或新的療法時(shí),將接受實(shí)驗(yàn)的患者按照年齡、性別、病情等變量匹配后分別分到實(shí)驗(yàn)組和對(duì)照組。這樣,在不同組的患者有大致相同的背景。同時(shí),分組的結(jié)果不讓患者知道,最好主持評(píng)價(jià)的醫(yī)生也不知道,這可以稱為雙盲法。雙盲法也是在實(shí)驗(yàn)設(shè)計(jì)中應(yīng)采用的。2.3.2實(shí)驗(yàn)中的若干問(wèn)題實(shí)驗(yàn)法的邏輯嚴(yán)密,是證明假設(shè)、分析事物因果關(guān)系的一個(gè)良好方式,但在實(shí)驗(yàn)過(guò)程中也會(huì)遇到一些問(wèn)題。1.人的意愿根據(jù)前面的討論,我們知道,在劃分實(shí)驗(yàn)組和對(duì)照組時(shí),應(yīng)該采用隨機(jī)原則,但在實(shí)施過(guò)程中會(huì)遇到挑戰(zhàn)。如果研究的對(duì)象是人,這種挑戰(zhàn)就更為明顯。人們都有自己的生活方式和處世原則,都有自己的愛(ài)好和興趣,他們未必會(huì)按照研究者的要求和布置行事。他們不會(huì)讓自己的行為拘泥于一定的控制條件下。2.心理問(wèn)題在實(shí)驗(yàn)研究中,人們對(duì)被研究非常敏感,這使得他們更加注意自我,從而走向另一個(gè)極端。記錄這種影響的例子之一是1924—1933年間,對(duì)通用電氣公司的工人生產(chǎn)率的系列調(diào)查。在一次調(diào)查中,一組社會(huì)學(xué)家和公司人事部門(mén)的成員想要研究車間照明程度對(duì)工人勞動(dòng)生產(chǎn)率的影響。研究者增大照明度,發(fā)現(xiàn)產(chǎn)量增加。令人奇怪的是,當(dāng)他們減少照明度,產(chǎn)量也增加??磥?lái)無(wú)論做什么,工人的產(chǎn)量都會(huì)增加。后來(lái)發(fā)現(xiàn),增加產(chǎn)量的原因不在于照明度,而是工人意識(shí)到有人在注意他們的行為,從而表現(xiàn)出一種容易被社會(huì)認(rèn)可和接受的行為,盡管這種行為并不是他們所喜愛(ài)的。3.道德問(wèn)題道德問(wèn)題使得對(duì)人和動(dòng)物做的實(shí)驗(yàn)復(fù)雜化了。當(dāng)某種實(shí)驗(yàn)涉及道德問(wèn)題時(shí),人們會(huì)處于進(jìn)退兩難的尷尬境地。例如,有一種理論認(rèn)為,人口密度大會(huì)導(dǎo)致犯罪率的上升。研究人員通過(guò)動(dòng)物實(shí)驗(yàn),觀察作為實(shí)驗(yàn)對(duì)象的小白鼠的行為變化。隨著被關(guān)在一起的小白鼠的密度不斷增加,老鼠變得越來(lái)越煩躁,最后導(dǎo)致相互攻擊、自相殘殺。顯然,對(duì)人做這種實(shí)驗(yàn)是不道德的,那么對(duì)老鼠做這種實(shí)驗(yàn)就道德嗎?又比如,在做藥物實(shí)驗(yàn)時(shí),如何看待實(shí)驗(yàn)組和對(duì)照組的結(jié)果呢?例如,發(fā)明了一種有望治療艾滋病的新藥,實(shí)驗(yàn)組的患者服用這種藥,而對(duì)照組的患者不能服用這種藥。如果新藥是有效的,對(duì)照組的人們得不到新藥就會(huì)面臨死亡的威脅。然而,如果發(fā)現(xiàn)這種藥有副作用,從而導(dǎo)致服用該藥的人在兩年以后有更高的死亡率,那么,沒(méi)有服用這種藥的對(duì)照組患者則可能避免這種風(fēng)險(xiǎn)。這中間確實(shí)存在道德的困境。2.3.3實(shí)驗(yàn)中的統(tǒng)計(jì)統(tǒng)計(jì)在實(shí)驗(yàn)的過(guò)程中發(fā)揮著重要的作用。這些作用主要表現(xiàn)在:確定進(jìn)行實(shí)驗(yàn)所需要的單位的個(gè)數(shù),以保證實(shí)驗(yàn)可以達(dá)到統(tǒng)計(jì)顯著的結(jié)果;將統(tǒng)計(jì)的思想融入實(shí)驗(yàn)設(shè)計(jì),使實(shí)驗(yàn)設(shè)計(jì)符合統(tǒng)計(jì)分析的標(biāo)準(zhǔn);提供盡可能最有效地同時(shí)研究幾個(gè)變量影響的方法。確定進(jìn)行實(shí)驗(yàn)所需要的單位的個(gè)數(shù),以便得到對(duì)實(shí)驗(yàn)精度預(yù)期的結(jié)果,這需要統(tǒng)計(jì)學(xué)的專業(yè)知識(shí)。一般說(shuō)來(lái),實(shí)驗(yàn)數(shù)據(jù)越多越好。但進(jìn)行大規(guī)模的實(shí)驗(yàn),搜集數(shù)據(jù)的成本將非常高,所需要的時(shí)間也更長(zhǎng)。統(tǒng)計(jì)分析能夠?yàn)樵诰扰c費(fèi)用的平衡中做出決斷提供可以參考的信息。進(jìn)行實(shí)驗(yàn)設(shè)計(jì),也離不開(kāi)統(tǒng)計(jì)學(xué)知識(shí)。實(shí)驗(yàn)設(shè)計(jì)本身就是一個(gè)統(tǒng)計(jì)問(wèn)題。實(shí)驗(yàn)設(shè)計(jì)是研究如何根據(jù)研究問(wèn)題的需要,科學(xué)地安排實(shí)驗(yàn),使我們能用盡可能少的實(shí)驗(yàn)獲得盡可能多的信息。實(shí)驗(yàn)設(shè)計(jì)的有關(guān)問(wèn)題將在后續(xù)章節(jié)中介紹。在對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析時(shí),根據(jù)研究的需要,統(tǒng)計(jì)可以提供最恰當(dāng)?shù)姆治龇椒?。一個(gè)好的實(shí)驗(yàn),應(yīng)該在兩個(gè)方面都有效。一個(gè)方面是內(nèi)部的有效性,內(nèi)部的有效性意味著實(shí)驗(yàn)測(cè)量的準(zhǔn)確性。實(shí)驗(yàn)的目的是要考察自變量和因變量之間的因果關(guān)系,而如果實(shí)驗(yàn)觀察結(jié)果受到其他無(wú)關(guān)變量的影響,就很難推斷自變量與因變量之間的因果關(guān)系。另一個(gè)方面是外部的有效性,外部的有效性決定是否可以將實(shí)驗(yàn)中發(fā)現(xiàn)的因果關(guān)系進(jìn)行推廣,即能否將結(jié)果推廣到實(shí)驗(yàn)環(huán)境以外的情況?如果可以,結(jié)果可以推廣到什么樣的總體、什么樣的環(huán)境、什么樣的自變量和因變量?與實(shí)驗(yàn)情況完全相同的純環(huán)境在社會(huì)現(xiàn)實(shí)中是很難復(fù)制的,那么,實(shí)驗(yàn)結(jié)果是否還有效?對(duì)這些問(wèn)題給出分析和解釋,需要利用統(tǒng)計(jì)方法。例如,多元回歸分析可以近似地將各個(gè)變量的影響區(qū)分開(kāi),在滿足一定條件下,定量地比較各個(gè)自變量對(duì)因變量產(chǎn)生的影響。協(xié)方差分析可以通過(guò)調(diào)整每組內(nèi)因變量的平均值,達(dá)到將無(wú)關(guān)變量影響剔除的目的。此外,多元統(tǒng)計(jì)分析的方法在實(shí)驗(yàn)數(shù)據(jù)的分析中也發(fā)揮著重要的作用。2.3.4實(shí)驗(yàn)法案例通過(guò)實(shí)驗(yàn)得到的數(shù)據(jù)稱為實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)可以作為研究者判斷假設(shè)的依據(jù)。下面的兩個(gè)案例或許可以幫助讀者對(duì)實(shí)驗(yàn)數(shù)據(jù)的作用有更多的體會(huì)。案例2.1現(xiàn)場(chǎng)實(shí)驗(yàn)幫助A公司勝訴美國(guó)的A公司生產(chǎn)著名的運(yùn)動(dòng)包,該公司發(fā)現(xiàn)B公司(一個(gè)大型的中心商業(yè)集團(tuán))引進(jìn)一條生產(chǎn)線,生產(chǎn)的運(yùn)動(dòng)包與A公司生產(chǎn)的運(yùn)動(dòng)包形狀幾乎完全一樣,消費(fèi)者很難區(qū)分。A公司指控B公司,說(shuō)B公司誤導(dǎo)消費(fèi)者,讓消費(fèi)者覺(jué)得自己買(mǎi)的是A公司的產(chǎn)品,而實(shí)際買(mǎi)的卻是B公司的產(chǎn)品。為了證實(shí)這一點(diǎn),由第三方進(jìn)行了一次現(xiàn)場(chǎng)實(shí)驗(yàn)。實(shí)驗(yàn)中選擇了兩組婦女,給第一組婦女看的是A公司生產(chǎn)的包,包面上的所有標(biāo)簽都去掉,所有的標(biāo)識(shí)、說(shuō)明都印在包的內(nèi)層。給第二組婦女看的是B公司生產(chǎn)的包,包上的商標(biāo)明顯可見(jiàn),所有的標(biāo)簽和懸掛物都按出售現(xiàn)場(chǎng)的樣子保留。這樣做的目的是希望通過(guò)這種實(shí)驗(yàn)了解婦女們購(gòu)買(mǎi)包時(shí)的選擇標(biāo)準(zhǔn)。例如,她們能否區(qū)分出包的不同來(lái)源或品牌,她們依據(jù)什么進(jìn)行識(shí)別或辨認(rèn),如果靠某些東西來(lái)辨認(rèn),那么這樣做的理由是什么。每組樣本都是200人,實(shí)驗(yàn)分別在芝加哥、洛杉磯和紐約的大商場(chǎng)進(jìn)行。調(diào)查采用攔截式面訪,被調(diào)查者是配額樣本,即按婦女不同的年齡比例分配樣本單位。實(shí)驗(yàn)結(jié)果表明,大多數(shù)消費(fèi)者無(wú)法區(qū)分兩種包的不同來(lái)源,她們購(gòu)買(mǎi)包時(shí)的依據(jù)主要是包的款式,而A公司生產(chǎn)的包是名牌商品,這種包的款式是人們所熟悉的。這個(gè)結(jié)果支持了A公司的立場(chǎng)。調(diào)查數(shù)據(jù)幫助A公司在法庭上勝訴,B公司同意停止銷售自己公司所生產(chǎn)的包。案例2.2科普節(jié)目效果實(shí)驗(yàn)為了提高兒童(4~7歲)對(duì)天文學(xué)基本知識(shí)的了解,培養(yǎng)家長(zhǎng)和兒童對(duì)天文學(xué)和觀察天象的積極態(tài)度,提高他們對(duì)天文學(xué)的鑒賞能力,有關(guān)部門(mén)制作了一套天文學(xué)科普節(jié)目,在天文館展出。為了解這套節(jié)目的效果,需要調(diào)查在天文館的觀看經(jīng)歷對(duì)兒童產(chǎn)生了什么影響。這種影響可以分為兩個(gè)層面,一個(gè)是短暫的影響,這可以通過(guò)受訪者對(duì)觀看節(jié)目的感受得到反映;另一個(gè)是長(zhǎng)期影響,即看完節(jié)目后采取了什么相關(guān)行動(dòng)。所以這項(xiàng)節(jié)目效果實(shí)驗(yàn)調(diào)查的設(shè)計(jì)是這樣的:在兒童觀看節(jié)目前和觀看節(jié)目后的幾分鐘內(nèi)對(duì)他們進(jìn)行短暫的調(diào)查。然后,在觀看節(jié)目一個(gè)月以后,進(jìn)行另一項(xiàng)跟蹤調(diào)查。接受調(diào)查的樣本量為兒童500名,家長(zhǎng)500名。首先的調(diào)查是在天文館現(xiàn)場(chǎng)進(jìn)行的。在該節(jié)目演出期間,每個(gè)被抽中的兒童在觀看節(jié)目前接受訪員(年輕的大學(xué)生)大約5分鐘的談話調(diào)查。訪員所詢問(wèn)的問(wèn)題與被訪

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論