版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
市場調(diào)查與預(yù)測15.1數(shù)據(jù)的圖表展示
15.2數(shù)據(jù)的描述性統(tǒng)計
15.3數(shù)據(jù)的推斷統(tǒng)計第15章
定量市場調(diào)查資料分析學(xué)習(xí)目標(biāo)1.掌握不同測量層次數(shù)據(jù)統(tǒng)計表的展示方法和軟件分析技能;2.掌握不同測量層次數(shù)據(jù)的優(yōu)秀統(tǒng)計圖的特征、展示方式和軟件分析技能;3.掌握數(shù)據(jù)的描述統(tǒng)計方法和和軟件分析技能;4.掌握數(shù)據(jù)的推斷統(tǒng)計方法和和軟件分析技能。引例企業(yè)經(jīng)歷過程的重大危機(jī)類型與企業(yè)傳承相關(guān)性統(tǒng)計表表15-1企業(yè)經(jīng)歷過程的重大危機(jī)類型與企業(yè)傳承相關(guān)性統(tǒng)計表資料來源:李蘭,仲為國,彭泗清,郝大海,王云峰.企業(yè)家精神與事業(yè)傳承:現(xiàn)狀、影響因素及建議——2020·中國企業(yè)家成長與發(fā)展專題調(diào)查報告[J].南開管理評論,2021.1:213-224.定量資料分析實質(zhì)上是按照數(shù)據(jù)分析任務(wù)書的具體要求,對調(diào)查數(shù)據(jù)進(jìn)行全面系統(tǒng)地分析,以滿足客戶對相關(guān)決策信息的需求。定量資料分析可以按數(shù)據(jù)資料分析的程度分為基礎(chǔ)統(tǒng)計分析和高級統(tǒng)計分析。見附表?;A(chǔ)統(tǒng)計分析主要是應(yīng)用單變量技術(shù),適用于樣本中的一個單位只有一個度量值,或雖有多個度量值,但每個度量值都是按一個變量單獨進(jìn)行分析的情況。按變量測量層次和樣本數(shù)量可分為更細(xì)的類型。高級統(tǒng)計分析主要采用多變量技術(shù),適用于樣本中的一個單位有多個度量值,而且對應(yīng)的多個變量是同時進(jìn)行分析的情況。按變量中是否有因變量和因變量個數(shù)可以再細(xì)分。定量數(shù)據(jù)分析可以應(yīng)用的統(tǒng)計軟件有很多種,如Excel、SPSS、SAS、S-plus、Minitab、JASP、Statistica和Eviews等等。推薦初學(xué)者應(yīng)用SPSS或Excel。15.0概述
表13-15基礎(chǔ)統(tǒng)計分析方法與內(nèi)容列示基礎(chǔ)統(tǒng)計方法分析內(nèi)容描述統(tǒng)計規(guī)模分析、結(jié)構(gòu)分析、比較分析;頻數(shù)、頻率;指數(shù)集中度分析:均值、眾數(shù)、中位數(shù)、分位數(shù)離散度分析:方差或標(biāo)準(zhǔn)差、變異系數(shù)、異眾比率、極差、四分位差分布形態(tài):偏態(tài)、峰度樣本誤差分析:抽樣方差、抽樣標(biāo)準(zhǔn)差、變異系數(shù)統(tǒng)計推斷推斷指標(biāo):均數(shù)、比例、方差;點估計、區(qū)間估計相關(guān)分析:相關(guān)系數(shù)、列聯(lián)表平均數(shù)差異分析:單因素方差分析回歸分析:F統(tǒng)計量、t統(tǒng)計量、參數(shù)估計表13-16常用基礎(chǔ)統(tǒng)計分析方法(單變量分析技術(shù))定類變量定序、定距、定比變量單個樣本兩個或以上樣本單個樣本兩個或以上樣本獨立樣本配對樣本獨立樣本配對樣本頻數(shù)分析卡方檢驗卡方檢驗W檢驗K-S檢驗符號檢驗馬克紐摩檢驗Z檢驗t檢驗Z檢驗t檢驗單因素方差分析Z檢驗表13-17常用高級統(tǒng)計分析方法列示對稱性技術(shù)(不含因變量)非對稱性技術(shù)(含因變量)變量間的相互依存關(guān)系變量間的相似性一個因變量兩個及以上因變量主成分分析聚類分析多維列聯(lián)表多元方差協(xié)方差分析因子分析聯(lián)合分析方差分析典型相關(guān)分析綜合評價對應(yīng)分析多重回歸分析多組判別分析多維標(biāo)度分析兩組判別分析結(jié)構(gòu)方程模型對數(shù)線性模型方差協(xié)方差分析多元回歸分析Logistic回歸15.1數(shù)據(jù)的圖表展示
15.1.1統(tǒng)計圖表編制的基本要求統(tǒng)計表是指能將大量統(tǒng)計數(shù)字資料加以綜合,并運用表格形式表現(xiàn)統(tǒng)計結(jié)果的載體,是統(tǒng)計和展示數(shù)據(jù)的常用方式和工具。優(yōu)點:統(tǒng)計表使資料呈現(xiàn)更加緊湊、簡明、醒目和有條理,有利于分析者更容易發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),更好地描述現(xiàn)象、揭示現(xiàn)象的本質(zhì)和規(guī)律,有利于讀者閱讀和理解。按分組情況分類:可以區(qū)分為簡單表、簡單分組表、復(fù)合分組表。簡單表是指不經(jīng)任何分組,僅按時間或單位進(jìn)行簡單排列的表格。簡單分組表是指僅按一個標(biāo)志進(jìn)行分組的表格。復(fù)合分組表是指按兩個或兩個以上標(biāo)志進(jìn)行層疊分組的表格。1.統(tǒng)計表的基本結(jié)構(gòu)和設(shè)計要求統(tǒng)計表的結(jié)構(gòu):從形式上看,統(tǒng)計表必須由總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題和數(shù)字資料等構(gòu)成,通常還有計量單位、制表日期、資料來源和注釋等信息??倶?biāo)題是對表格中主要變量及其內(nèi)容的高度概括,一般要滿足3W要求,即說明統(tǒng)計數(shù)據(jù)的時間(When)、地點(Where)及內(nèi)容(What);總標(biāo)題可以視為表格的名稱,應(yīng)該放在表格上方;在同一篇調(diào)查報告中所有的表格都需要統(tǒng)一編號并依次排放。橫行標(biāo)題與縱欄標(biāo)題通常表示的是所研究問題的類別名稱和變量名稱,通常安排在統(tǒng)計表的第一列和第一行;橫行標(biāo)題揭示每一橫行內(nèi)數(shù)據(jù)的意義,縱欄標(biāo)題揭示每一縱欄內(nèi)數(shù)據(jù)的意義。數(shù)字資料是指各空格內(nèi)按要求填寫的數(shù)字。在數(shù)據(jù)計量單位相同時,一般把計量單位放在表格的右上角。如果各項目的數(shù)據(jù)單位不同時,可放在表格里注明。制表日期放在表的右上角,表明制表的時間。其他信息,包括資料來源、指標(biāo)的注釋、必要的說明等內(nèi)容通常放在統(tǒng)計表的下方。設(shè)計和使用統(tǒng)計表時要遵循以下規(guī)則:①統(tǒng)計表的總標(biāo)題應(yīng)簡潔明了,準(zhǔn)確概括表中信息的主要內(nèi)容;②合理安排統(tǒng)計表的結(jié)構(gòu)。橫行標(biāo)題與縱欄標(biāo)題位置可以互換。各欄排列次序應(yīng)以時間、數(shù)量或空間位置等自然順序編排;③合理安排統(tǒng)計表的形狀。從排版美觀角度,統(tǒng)計表的形狀通常選用橫長方形為宜,統(tǒng)計表的橫豎長度比例恰當(dāng),避免過高或過扁的表格形式;④統(tǒng)計表格的上下兩端封閉且為粗線,左右兩端開口,表內(nèi)盡量少用橫豎線;⑤統(tǒng)計表中的數(shù)據(jù)一般右對齊,有小數(shù)點時則應(yīng)統(tǒng)一小數(shù)位數(shù)且小數(shù)點要對齊;⑥統(tǒng)計表不應(yīng)該出現(xiàn)空白單元格。對于沒有數(shù)據(jù)的單元格,應(yīng)以“-”表示;⑦統(tǒng)計表欄目多時要編號,一般按甲、乙、丙或按(1)(2)等次序編號;⑧在必要時應(yīng)在統(tǒng)計表下方寫明資料來源等信息,以表達(dá)對所引資料的作者的致謝和尊重,也為讀者查閱提供方便。表13-13變量類型與統(tǒng)計表的關(guān)系變量類型統(tǒng)計表單變量定類變量定序變量定距變量定比變量簡單頻數(shù)(頻數(shù))表分組頻數(shù)(頻數(shù))表單變量簡單分組表單變量并列分組表兩個變量變量兩兩交互四種變量類型二維列聯(lián)表(簡單、并列分組或復(fù)合分組)三個及以上變量引進(jìn)一個或多個控制變量多維列聯(lián)表(簡單、并列分組或復(fù)合分組)總體要求:統(tǒng)計圖形要具有完整性、相對獨立性和準(zhǔn)確性,要確保閱讀者不借助于其他資料就可以輕松準(zhǔn)確地理解分析者所要表達(dá)的信息。從形式上看,統(tǒng)計圖至少由兩部分構(gòu)成,一是圖,二是標(biāo)題。標(biāo)題是對統(tǒng)計圖核心信息的高度概括,表達(dá)與統(tǒng)計表總標(biāo)題的要求相同,通常放在圖的下方。通常還和統(tǒng)計表一樣需要一些附件,如資料來源、注釋和說明等,具體要求與統(tǒng)計表相同。統(tǒng)計圖上常常還需要做標(biāo)簽、標(biāo)簽是分析者將對數(shù)據(jù)的解釋寫在圖形上。不同變量類型適用的常見統(tǒng)計圖形式類型(表13-14)
變量類型統(tǒng)計圖圖形定類變量條形圖(含帕累托圖)、餅圖(含環(huán)形圖)等定序變量條形圖、餅圖、折線圖(含累計折線圖)、輪廓圖定距變量定比變量通用:條形圖、餅圖、折線圖、直方圖、輪廓圖僅適用于原始數(shù)據(jù):箱線圖、莖葉圖僅適用于多變量:散點圖、雷達(dá)圖、汽泡圖等2.統(tǒng)計圖的類型與設(shè)計準(zhǔn)則什么樣的統(tǒng)計圖是規(guī)范而又漂亮的統(tǒng)計圖呢?塔夫特(EdwardR.Tufte)在其著作《TheVisualDisplayofQuantitativeInformation》(1983)中提出“優(yōu)圖原則”(PrinciplesofGraphicalExcellence),即:最短的時間、最少的墨水、最小的篇幅傳達(dá)最大量的信息,并給出鑒別統(tǒng)計圖優(yōu)劣的五項準(zhǔn)則:(1)一張好圖應(yīng)當(dāng)精心設(shè)計,有助于洞察問題的實質(zhì);(2)一張好圖應(yīng)當(dāng)使復(fù)雜的觀點得到簡明、確切、高效的闡述;(3)一張好圖應(yīng)當(dāng)能在最短的時間內(nèi)以最少的筆墨給讀者提供最大量的信息;(4)一張好圖應(yīng)當(dāng)是多維的;(5)一張好圖應(yīng)當(dāng)表述數(shù)據(jù)的真實情況。簡而言之,一個優(yōu)秀的統(tǒng)計圖應(yīng)該是為了某個明確的目的而完整、準(zhǔn)確、簡潔精練、高效地展示數(shù)據(jù)的有效工具。內(nèi)容和信息是統(tǒng)計圖的靈魂,形狀和形式只是為了更好地讓統(tǒng)計圖成為分析者傳達(dá)信息、閱讀者領(lǐng)會和理解這些信息的“好幫手”,圖形上過多的修飾往往會得不償失。15.1.2定類數(shù)據(jù)的整理與展示定類數(shù)據(jù)是對事物的一種分類,因而主要進(jìn)行分類整理,針對每一類別匯總頻數(shù),計算頻率、比例、百分比或比率等。這些分析結(jié)果可以用文字描述,也可形成頻數(shù)分布表,也可用條形圖、帕累托圖、餅形圖或環(huán)形圖等圖式展示。一個優(yōu)秀的統(tǒng)計圖表往往會更加直觀形象地展示出分析結(jié)果及其隱藏的信息。1.頻數(shù)分布表根據(jù)所要匯總頻數(shù)的變量個數(shù)及是否涉及變量間的關(guān)聯(lián)表達(dá),可以有頻數(shù)分布表和列聯(lián)表。使用SPSS軟件生成頻數(shù)分布表或列聯(lián)表的操作步驟基本相同,都是在“分析”菜單下選擇相應(yīng)的項目,并在對話窗口中按要求選定所要分析的變量和輸出數(shù)據(jù)任務(wù)要求,點擊“確定”就會輸出結(jié)果。2.定類數(shù)據(jù)的圖示分類數(shù)據(jù)的圖示方法主要有條形圖(其中包括帕累托圖)和餅形圖(其中包括環(huán)形圖)。這些圖可以有簡單圖和復(fù)式圖,如果有兩個及以上總體或樣本的分類相同且變量可比,則可以考慮作復(fù)式圖形展示,這時不僅可以對各總體或樣本頻數(shù)分析作分析,還可以對不同總體或樣本進(jìn)行比較研究。15.1.3定序數(shù)據(jù)的整理與展示由于定序數(shù)據(jù)具有分類數(shù)據(jù)的全部特征,因此,所有適用于分類數(shù)據(jù)的頻數(shù)分布表和圖示方法,如頻數(shù)、比例、百分比、比率、條形圖和餅形圖等都適用于對定序數(shù)據(jù)的整理與圖示。定序數(shù)據(jù)的整理和圖示還可以用一些分類數(shù)據(jù)無法應(yīng)用的方法,如計算累積頻數(shù)和累積頻率(百分比)。1.累積頻數(shù)與累積頻率累積頻數(shù)(cumulativefrequencies)是將各有序變量取值(也可稱為類別或組)的頻數(shù)逐級累加起來得到的頻數(shù)。頻數(shù)的累積方法有兩種:一是向上累積,二是向下累積。累積頻數(shù)計算可以提供在某一類別(或數(shù)值)以下或某一類別(或數(shù)值)以上的頻數(shù)之和,可更清晰地看出某個或某些類別為界的頻數(shù)分布特征。同樣可以對頻率或百分比有序累加,得到累積頻率或累積百分比(cumulativepercentages)。2.累積分布表和累積分布曲線累積頻數(shù)或累積頻率可以用累積分布表進(jìn)行展示。根據(jù)累積頻數(shù)或累積頻率分布表可以出繪制累積頻數(shù)分布曲線或累積頻率分布圖。累積分布表的繪制可以在頻數(shù)分布表基礎(chǔ)上進(jìn)行簡單的操作即可完成。累積分布曲線的繪制方法在前面介紹運用SPSS22繪制帕累托圖的制作步驟時已經(jīng)學(xué)習(xí)過,即累積分布曲線與條形圖組合的操作方法:在SPSS數(shù)據(jù)視圖中點擊工具欄中的“分析”按鈕→“質(zhì)量控制”→選擇“拍累托圖”→“簡單帕累托圖”→“個案組的計數(shù)或和”→“定義”→“定義簡單帕累托圖:個案組的計數(shù)或和”→“條的表征”中選擇“計數(shù)”→“類別軸”→選定要計數(shù)的變量→“確定”。15.1.4數(shù)值型數(shù)據(jù)的整理與展示數(shù)值型數(shù)據(jù)可以用定類數(shù)據(jù)和定序數(shù)據(jù)整理與圖示的所有方法,但還可以用其他一些特定的整理和圖示方法,如可以作分組整理和展示。1.數(shù)據(jù)分組所謂數(shù)據(jù)分組就是指根據(jù)市場調(diào)研的目的和要求,將收集到的原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)分成不同若干互不重疊而又窮盡的組別。經(jīng)過分組的數(shù)據(jù)稱為分組數(shù)據(jù)(groupeddata)。根據(jù)變量取值的類別多少和特點可以有兩種方法:單變量值分組和組距分組。當(dāng)變量取值是離散型數(shù)值,且變量值較少的情況下通常選擇單變量值分組,即將每一個變量取值作為一組;當(dāng)變量取值是連續(xù)型數(shù)值或變量值較多的情況下,通常采用組距分組。組距分組是將變量所有取值劃分為若干個依次連接的區(qū)間,將一個區(qū)間的變量值作為一組。組距分組的相關(guān)術(shù)語及計算方法:一個組的最小值稱為下限(lowerlimit);一個組的最大值稱為上限(upperlimit)。根據(jù)是否存在下限或上限,數(shù)據(jù)組可以分為開口組和閉口組。組距(classwidth)表示該組數(shù)據(jù)分布的跨度,可以用公式:“組距=上限?下限”進(jìn)行計算。組中值(classmidpoint)是該組數(shù)據(jù)大小的代表,通常用該組數(shù)據(jù)的均值計算組中值,開口組的組中值計算實際上是在開口組組距等于相鄰組的組距的假定下進(jìn)行的,具體計算公式如下:
在對數(shù)據(jù)進(jìn)行分組時應(yīng)遵循以下原則:①組數(shù)要適當(dāng),以便能夠真實地反映數(shù)據(jù)的差異。組數(shù)太少,可能會掩蓋重要的信息;組數(shù)太多,又起不到分組的作用。一般情況下,一組數(shù)據(jù)所分的組數(shù)不應(yīng)少于5組且不多于15組。②組距要合理,要考慮到研究的需要,還要考慮到計算的方便和意義解釋的要求。譬如,組距分組時通常組距比較適合取5或10的倍數(shù);第一組的下限應(yīng)低于數(shù)據(jù)的最小值,最后一組的上限應(yīng)高于數(shù)據(jù)的最大值;每組組限取個位為0或5的數(shù)為宜。③要使各組內(nèi)的回答性質(zhì)相同,答案相似;而各組之間的回答應(yīng)有差別,即各組之間的答案性質(zhì)不同。④數(shù)據(jù)分組要保證各組之間是互相排斥的,且所有組又包含了所有數(shù)據(jù),對于分組數(shù)據(jù)同樣可以繪制出頻數(shù)分布表,也就是針對每一組分組數(shù)據(jù)可以分別匯總出它們出現(xiàn)的次數(shù),然后用統(tǒng)計表的形式呈現(xiàn)出來。2.單變量數(shù)據(jù)的圖示單變量數(shù)據(jù)的圖示是指只是用來表示單個變量的統(tǒng)計圖,即使由多個統(tǒng)計圖組合為一個圖也只是表示這多個彼此獨立的總體或樣本的統(tǒng)計特征。如前面介紹的條形圖、餅圖、環(huán)形圖及累積分布圖等都是單變量數(shù)據(jù)的圖示方式,同樣適用于展示數(shù)值型數(shù)據(jù)。數(shù)值型數(shù)據(jù)還具有定類數(shù)據(jù)和主序數(shù)據(jù)所不具備的性質(zhì),因此作為單變量數(shù)據(jù)的展示還有一些其他方法只適合于數(shù)值型數(shù)據(jù),如直方圖、折線圖、莖葉圖和箱線圖。1)分組數(shù)據(jù)——直方圖和折線圖直方圖(histogram)是借助于矩形的寬度和高度來表達(dá)分組數(shù)據(jù)各組區(qū)間及其頻數(shù)的一種統(tǒng)計圖。具體而言,直方圖表現(xiàn)為以數(shù)據(jù)分組對應(yīng)的變量為橫軸、以頻數(shù)或頻率為縱軸的平面直角坐標(biāo)系中的一個個相連接的矩形構(gòu)成。根據(jù)直方圖可以畫出相應(yīng)的折線圖,以反映數(shù)據(jù)的分布特征,通常頻數(shù)分布有對稱分布和不對稱分布兩類,不對稱分布又包括左偏分布和右偏分布兩種。1)分組數(shù)據(jù)——直方圖和折線圖直方圖(histogram)是借助于矩形的寬度和高度來表達(dá)分組數(shù)據(jù)各組區(qū)間及其頻數(shù)的一種統(tǒng)計圖。具體而言,直方圖表現(xiàn)為以數(shù)據(jù)分組對應(yīng)的變量為橫軸、以頻數(shù)或頻率為縱軸的平面直角坐標(biāo)系中的一個個相連接的矩形構(gòu)成。根據(jù)直方圖可以畫出相應(yīng)的折線圖,以反映數(shù)據(jù)的分布特征,通常頻數(shù)分布有對稱分布和不對稱分布兩類,不對稱分布又包括左偏分布和右偏分布兩種。直方圖與條形圖的區(qū)別:首先,最主要的區(qū)別是兩者適用的數(shù)據(jù)類型不同,條形圖適用于各類數(shù)據(jù),包括定類、定序和數(shù)值型數(shù)據(jù),而直方圖只適合于數(shù)值型數(shù)據(jù),且主要適用于連續(xù)性數(shù)據(jù)。第二,條形圖是用條形的長度表示各類別頻數(shù)的多少,其寬度沒有長短之別,只是表示類別,所以是固定的;而直方圖的高度與寬度都有實際意義,其高度表示每一組的頻數(shù)或頻率,寬度則表示各組的組距,其面積的大小表示各組頻數(shù)的多少。最后,兩者的條形彼此間的距離不同。直方圖各矩形通常是連續(xù)排列,這是由分組數(shù)據(jù)具有連續(xù)性決定的,而條形圖則是分開排列,因為它們代表的是不同類別。2)未分組數(shù)據(jù)——莖葉圖和箱線圖莖葉圖(stem-and-leafdisplay)是將數(shù)值型數(shù)據(jù)區(qū)分為“莖(stem)”和“葉(leaf)”兩部分來進(jìn)行展示的統(tǒng)計圖,主要適用于原始數(shù)據(jù)的頻數(shù)分布。繪制莖葉圖的關(guān)鍵是設(shè)計好樹莖。通常只是區(qū)分?jǐn)?shù)據(jù)中構(gòu)成數(shù)字的前后位置,將除最后一個數(shù)字以外的高位數(shù)值作為“莖”,最后一個數(shù)字作為“葉”。制作莖葉圖時,把具有相同“莖”的數(shù)歸為一類,這一類數(shù)的全部“葉”按從小到大的順序依次排列,“葉”的數(shù)字個數(shù)實質(zhì)上反映了對應(yīng)“莖”的數(shù)值的頻數(shù)。箱線圖(boxplot)也是一種適用于反映數(shù)值型原始數(shù)據(jù)分布特征的統(tǒng)計圖。箱線圖是由一組數(shù)據(jù)的最大值(maximum)、最小值(minimum)、中位數(shù)(median)、上下四分位數(shù)(quartiles)等五個特征值繪制而成的,其中,中位數(shù)是一組數(shù)據(jù)按由大到小或由小到大排序后處于中間位置上的變量值,用Me表示;四分位數(shù)是一組數(shù)據(jù)排序后處在25%位置和75%位置上的兩個數(shù)據(jù),用Q_L表示下四分位數(shù),Q_U表示上四分位數(shù)。箱線圖的繪制方法是:先找出一組數(shù)據(jù)的最大值、最小值、中位數(shù)和兩個四分位數(shù);然后,連接兩個四分位數(shù)畫出箱子;再將最大值和最小值與箱子相連接,中位數(shù)在箱子中間。3.多變量數(shù)據(jù)的圖示(1)散點圖散點圖(scatterdiagram)是以點的分布反映變量之間相關(guān)關(guān)系的可視化方法,最常用的是在二維坐標(biāo)系中展示兩個變量之間是否存在某種關(guān)系。手工作圖方法為:將兩個變量X與Y分別表示為坐標(biāo)系的橫軸和縱軸,將變量X和Y的每對觀測數(shù)據(jù)(x,y)在坐標(biāo)系中描點,即可得散點圖。利用SPSS繪制散點圖的步驟參見汽泡圖的繪制步驟。(2)汽泡圖氣泡圖(bubblechart)與散點圖類似,但它可以借助于(x,y)點的大小展示與之相關(guān)的第三個變量z的值。氣泡圖適用展示三個變量之間的關(guān)系。手工繪制方法為:將一個變量x放在橫軸,另一個變量y放在縱軸,第三個變量z則在對應(yīng)變量(x,y)位置上用氣泡的大小來表示。實踐中,要根據(jù)具體項目中變量的關(guān)系確定這三個變量之間的相關(guān)或因果關(guān)系。(3)雷達(dá)圖雷達(dá)圖(radarchart),形似蜘蛛,故也稱為蜘蛛圖(spiderchart),比較適用于具有多個相同變量的不同對象之間的比較展示。設(shè)有n組樣本S_1,S_2,…,Sn,每個樣本測得p個變量X_1,X_2,…,X_p。(4)廓圖當(dāng)多個研究對象或樣本單位具有相同的多元變量,且多元變量的計量單位相同時,可以將每個研究對象或樣本單位的多元變量值以折線的方式表示在平面中,這些折線就形成了輪廓圖。輪廓圖比較適用于多個對象的比較研究。15.2數(shù)據(jù)的描述性統(tǒng)計15.2.1集中趨勢的度量
2.定序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù)和分位數(shù)將數(shù)據(jù)按某種方式排列后位于中間的數(shù)和某個分位上的數(shù)。分位數(shù)通常有中位數(shù)(median)、四分位數(shù)(quartile)、十分位數(shù)(decile)和百分位數(shù)(percentile)等,它們分別是將排序后的數(shù)據(jù)用1個點、3個點、9個點和99個點等分為2分、4分、10分和100分后各分位點上的數(shù)。這些分位數(shù)的特點是不受極端值的影響。比較常用的分位數(shù)是中位數(shù)和四分位數(shù)。中位數(shù)的具體確定方法有兩種情況,一是未分組數(shù)據(jù),二是已分組數(shù)據(jù)。3.數(shù)值型數(shù)據(jù):平均數(shù)由于數(shù)值型數(shù)據(jù)還可以進(jìn)行加減運算,因此可以用全部數(shù)據(jù)之和除以其個數(shù)得到的結(jié)果作為集中趨勢的代表,這就是最常見的平均數(shù)(mean)。平均數(shù)利用了全部數(shù)據(jù)的信息,是應(yīng)用最廣泛的集中趨勢度量值。由于數(shù)據(jù)的具體含義不同,因而平均數(shù)的計算方法會有所不同,常見的平均數(shù)有算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等。4.三種集中趨勢度量的比較首先要弄清楚三種集中趨勢度量的適用條件,理解最主要的區(qū)別在于所要分析的數(shù)據(jù)類型。表5-11眾數(shù)、中位數(shù)和平均數(shù)適用數(shù)據(jù)類型比較數(shù)據(jù)類型所能進(jìn)行運算集中趨勢度量
類別區(qū)分(=,≠)次序區(qū)分(≤,≥)距離區(qū)分(+,‐)眾數(shù)中位數(shù)平均數(shù)定類數(shù)據(jù)
定序數(shù)據(jù)
數(shù)值型數(shù)據(jù)
另外,從分布角度看,眾數(shù)始終是一組數(shù)據(jù)的最高峰值,中位數(shù)居于中間位置,平均數(shù)是全部數(shù)據(jù)的算術(shù)平均。對于具有單峰分布的數(shù)據(jù)來說,有三種情形:對稱分布、右偏分布和左偏分布。15.2.2離散程度的度量表15-12離散程度度量與集中趨勢度量之間的關(guān)系集中趨勢度量離散程度度量方法眾數(shù)異眾比率中位數(shù)極差、四分位差平均數(shù)標(biāo)準(zhǔn)差、方差、變異系數(shù)15.2.3偏態(tài)和峰態(tài)的度量偏態(tài)和峰態(tài)是對數(shù)據(jù)分布形狀的測度。偏態(tài)(skewness)是對數(shù)據(jù)分布對稱性的測度,偏態(tài)系數(shù)(coefficientofskewness,簡記為SK)表示峰態(tài)(kurtosis)是對數(shù)據(jù)分布平坦或尖峭程度的測度,峰態(tài)系數(shù)(coefficientofkurtosis,簡記為K重點說明一下如何使用這兩個系數(shù)及如何解釋和判斷。對偏態(tài)系數(shù)SK的解釋:根據(jù)SK是否為零判斷數(shù)據(jù)分布的對稱性,如果SK=0則表明是對稱分布,如果SK>0則說明是右偏分布,如果SK<0則說明是左偏分布;SK的絕對值越大,說明偏斜的程度越大。對峰態(tài)系數(shù)K的解釋:通常以正態(tài)分布的峰態(tài)系數(shù)為0來確定K的計算公式,所以可以根據(jù)K的正負(fù)性來判斷數(shù)據(jù)分布是尖峰還是扁平。K>0說明是尖峰分布,表明數(shù)據(jù)的分布比較集中;K<0說明是扁平分布,數(shù)據(jù)分布比較分散。15.2.4數(shù)據(jù)的相對程度分析
15.2.5數(shù)據(jù)的動態(tài)分析
15.2.6數(shù)據(jù)概括性度量的軟件操作數(shù)據(jù)的概括性度量是數(shù)據(jù)分析最基本的分析內(nèi)容之一,因此在統(tǒng)計軟件中都有相關(guān)的功能:如excel中可以通過“數(shù)據(jù)分析”工具中的“描述統(tǒng)計”命令得到結(jié)果。在SPSS中可能通過“分析”工具中的“描述統(tǒng)計”
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GAT 1352-2018視頻監(jiān)控鏡頭》專題研究報告
- 2026 年初中英語《情景交際》專項練習(xí)與答案 (100 題)
- 2026年深圳中考語文培優(yōu)補(bǔ)差綜合試卷(附答案可下載)
- 2026年深圳中考英語二模仿真模擬試卷(附答案可下載)
- 2026年深圳中考物理考綱解讀精練試卷(附答案可下載)
- 廣東省江門市新會區(qū)2026年九年級上學(xué)期期末物理試題附答案
- 2026年大學(xué)大二(建筑學(xué))建筑方案設(shè)計基礎(chǔ)測試題及答案
- 2026年深圳中考數(shù)學(xué)數(shù)據(jù)的分析專項試卷(附答案可下載)
- 2026年深圳中考生物進(jìn)階提分綜合試卷(附答案可下載)
- 創(chuàng)文辦人員培訓(xùn)課件
- 《砂漿、混凝土用低碳劑》
- 2025年社區(qū)工作總結(jié)及2026年工作計劃
- 南昌地鐵培訓(xùn)課件
- GB/T 30104.104-2025數(shù)字可尋址照明接口第104部分:一般要求無線和其他有線系統(tǒng)組件
- 三年級上冊數(shù)學(xué)第三單元題型專項訓(xùn)練-判斷題(解題策略專項秀場)人教版(含答案)
- GB/T 45629.1-2025信息技術(shù)數(shù)據(jù)中心設(shè)備和基礎(chǔ)設(shè)施第1部分:通用概念
- 2025年中考?xì)v史開卷考查范圍重大考點全突破(完整版)
- 學(xué)術(shù)誠信與學(xué)術(shù)規(guī)范研究-深度研究
- 《ETF相關(guān)知識培訓(xùn)》課件
- DB15-T 3677-2024 大興安嶺林區(qū)白樺樹汁采集技術(shù)規(guī)程
- 2024年《13464電腦動畫》自考復(fù)習(xí)題庫(含答案)
評論
0/150
提交評論