版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三章:數(shù)據(jù)的圖表展示,(基本問題)數(shù)據(jù)的整理與顯示,要弄清所面對(duì)的數(shù)據(jù)類型 不同類型的數(shù)據(jù),采取不同的處理方式和方法 對(duì)分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理 對(duì)數(shù)值型數(shù)據(jù)則主要是作分組整理 適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù),分類數(shù)據(jù)的整理與圖示,(基本過程)分類數(shù)據(jù)的整理,1.列出各類別,3. 制作頻數(shù)分布表 4. 用圖形顯示數(shù)據(jù),(可計(jì)算的統(tǒng)計(jì)量)分類數(shù)據(jù)的整理,頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個(gè)數(shù) 比例(proportion) :某一類別數(shù)據(jù)個(gè)數(shù)占全部數(shù)據(jù)個(gè)數(shù)的比值 百分比(percentage)
2、 :將對(duì)比的基數(shù)作為100而計(jì)算的比值 比率(ratio) :不同類別數(shù)值個(gè)數(shù)的比值,(例題分析)分類數(shù)據(jù)整理頻數(shù)分布表,【例】:根據(jù)飲料文摘,“古典可樂”(Coke Classic)、健怡可樂(Diet Coke)、彭伯碳酸飲料(Dr.Pepper)、百事可樂(Pepsi-Cola)、以及雪碧(Sprite)是銷售量居前五位的軟飲料(華爾街日?qǐng)?bào),1998),下表是所選擇的購買50次的軟飲料的樣本,(例題分析)分類數(shù)據(jù)整理頻數(shù)分布表,(例題分析)分類數(shù)據(jù)整理頻數(shù)分布表,品質(zhì)標(biāo)志,頻數(shù),相對(duì)頻數(shù),分類數(shù)據(jù)頻數(shù)分布表,分類數(shù)據(jù)的圖示條形圖,用寬度相同的條形的高度或長(zhǎng)短來表示各類別數(shù)據(jù)的圖形 有單式
3、條形圖、復(fù)式條形圖等形式 主要用于反映分類數(shù)據(jù)的頻數(shù)分布 繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(column chart),分類數(shù)據(jù)的圖示條形圖,分類數(shù)據(jù)的圖示對(duì)比條形圖,分類變量在不同時(shí)間或不同空間上有多個(gè)取值 對(duì)比分類變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢(shì),分類數(shù)據(jù)的圖示對(duì)比條形圖,分類數(shù)據(jù)的圖示帕累托圖,按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖 主要用于展示分類數(shù)據(jù)的分布,分類數(shù)據(jù)的圖示餅圖,也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形 主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題 繪制圓形圖時(shí),樣本或總體中各部
4、分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比乘以3600確定,分類數(shù)據(jù)的圖示餅圖,順序數(shù)據(jù)的整理與圖示,(可計(jì)算的統(tǒng)計(jì)量)順序數(shù)據(jù)的整理,1. 累積頻數(shù)(cumulative frequencies):各類別頻數(shù)的逐級(jí)累加 2. 累積頻率(cumulative percentages):各類別頻率(百分比)的逐級(jí)累加,(例題分析)順序數(shù)據(jù)的頻數(shù)分布表,【例】在一項(xiàng)城市住房問題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問題是:“您對(duì)您家庭目前的住房狀況是否滿意?” 1非常不滿意;2不滿意;3一般;4滿意;5非常滿意。,(例題分析)順序數(shù)據(jù)的頻
5、數(shù)分布表,順序數(shù)據(jù)的圖示累計(jì)頻數(shù)分布圖 (例題分析),甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布,數(shù)值型數(shù)據(jù)的整理與展示,數(shù)據(jù)分組 數(shù)值型數(shù)據(jù)的圖,數(shù)據(jù)分組,組距分組 (要點(diǎn)),將變量值的一個(gè)區(qū)間作為一組 適合于連續(xù)變量 適合于變量值較多的情況 需要遵循“不重不漏”的原則 可采用等距分組,也可采用不等距分組,確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。 在實(shí)際分組時(shí),組數(shù)一般為5K 15。 原則上組內(nèi)頻數(shù)不少于5個(gè),兩端除外 兩個(gè)參考公式:,組距分組(步驟),組距分組(步驟),確定組距:組距(Class Width)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組
6、數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù) 組距一般取為正數(shù),多為5,10及其倍數(shù) 統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表,組距分組(幾個(gè)概念),1. 下限(lower limit) :一個(gè)組的最小值 上限(upper limit) :一個(gè)組的最大值 a, b). a 代表下限,b 代表上限 規(guī)定重疊的數(shù)值歸于后一組的下限 2. 組距(class width) :上限與下限之差 3. 組中值(class midpoint) :下限與上限之間的中點(diǎn)值,組距分組(幾個(gè)概念),4.缺上限或缺下限稱為開口組 缺上(下)限開口組組中值=上(下)限 -(+)相鄰組組距/2,頻數(shù)分布表的編制(例題分析),
7、【例】某電腦公司2005年前四個(gè)月各天的銷售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組,等距分組表(上下組限重疊),等距分組表(上下組限間斷),等距分組表(使用開口組),分組數(shù)據(jù)直方圖和折線圖,數(shù)值型數(shù)據(jù)的圖示,分組數(shù)據(jù)直方圖(histogram),用于展示分組數(shù)據(jù)分布的一種圖形 用矩形的寬度和高度來表示頻數(shù)分布 本質(zhì)上是用矩形的面積來表示頻數(shù)分布 在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖,分組數(shù)據(jù)的圖示(直方圖的繪制),某電腦公司銷售量分布的直方圖,我一眼就看出來了,銷售量在170180之間的天數(shù)最多!,條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類
8、別頻數(shù)的多少,其寬度(表示類別)則是固定的 直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義 直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列 條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù),分組數(shù)據(jù)直方圖(直方圖與條形圖的區(qū)別),數(shù)值型數(shù)據(jù)的圖示,STATISTICA,未分組數(shù)據(jù)莖葉圖和箱線圖,未分組數(shù)據(jù)莖葉圖(stem-and-leaf display),用于顯示未分組的原始數(shù)據(jù)的分布 由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的 以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉 樹葉上只保留最后一位數(shù)字 5. 莖葉
9、圖類似于橫置的直方圖,但又有區(qū)別 直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息 直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù),未分組數(shù)據(jù)莖葉圖(例題分析),某電腦公司銷售量分布的莖葉圖,未分組數(shù)據(jù)箱線圖(box plot),用于顯示未分組的原始數(shù)據(jù)的分布 由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成 繪制方法 首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU) 連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接 該箱線圖也稱為Median
10、/Quart./Range箱線圖,未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成),中位數(shù),4,6,8,10,12,Median/Quart./Range箱線圖,未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析),分布的形狀與箱線圖,不同分布的箱線圖,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析),【例】 從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績(jī)的批比較箱線圖,并分析各科考試成績(jī)的分布特征,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖(例題分析Median/Quart./Range),8門課程考試成績(jī)的Median/Quart./Range箱線圖,11名學(xué)生8門課程考試
11、成績(jī)的Median/Quart./Range箱線圖,未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析Median/Quart./Range),數(shù)值型數(shù)據(jù)的圖示,時(shí)間序列數(shù)據(jù)線圖,時(shí)間序列數(shù)據(jù)線圖(line plot),表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形 時(shí)間一般繪在橫軸,數(shù)據(jù)繪在縱軸 圖形的長(zhǎng)寬比例大致為10 : 7 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時(shí),可以采取折斷的符號(hào)將縱軸折斷,時(shí)間序列數(shù)據(jù)線圖 (例題分析),【例】我國(guó)19912003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖,時(shí)間序列數(shù)據(jù)線圖 (例題分析),數(shù)值型數(shù)據(jù)的圖示,多變量數(shù)據(jù)的圖示,兩個(gè)變量間的關(guān)系
12、二維散點(diǎn)圖(2D Scatterplots),展示兩個(gè)變量之間的關(guān)系 用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi , yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個(gè)點(diǎn)稱為散點(diǎn),由坐標(biāo)及其散點(diǎn)形成的二維數(shù)據(jù)圖,兩個(gè)變量間的關(guān)系二維散點(diǎn)圖(2D Scatterplots),三個(gè)變量間的關(guān)系氣泡圖(bubble chart),顯示三個(gè)變量之間的關(guān)系 圖中數(shù)據(jù)點(diǎn)的大小依賴于第三個(gè)變量,也稱為蜘蛛圖(spider chart) 顯示多個(gè)變量的圖示方法 在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用 假定各變量的取值具有相同的正負(fù)號(hào),總的絕對(duì)值與圖形所圍成的區(qū)域成正比 可用于研究多個(gè)樣本之間的相
13、似程度,多變量數(shù)據(jù)雷達(dá)圖(radar chart), 設(shè)有n組樣本S1,S2, , Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2 , , XP,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是,多變量數(shù)據(jù)雷達(dá)圖(雷達(dá)圖的制作),先做一個(gè)圓,然后將圓P等分,得到P個(gè)點(diǎn),令這P個(gè)點(diǎn)分別對(duì)應(yīng)P個(gè)變量,在將這P個(gè)點(diǎn)與圓心連線,得到P個(gè)幅射狀的半徑,這P個(gè)半徑分別作為P個(gè)變量的坐標(biāo)軸,每個(gè)變量值的大小由半徑上的點(diǎn)到圓心的距離表示 將同一樣本的值在P個(gè)坐標(biāo)上的點(diǎn)連線。這樣,n個(gè)樣本形成的n個(gè)多邊形就是一個(gè)雷達(dá)圖,多變量數(shù)據(jù)雷達(dá)圖 (例題分析),【例】2003年我國(guó)城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖,今天的主食是面包,多變量數(shù)據(jù)雷達(dá)圖 (例題分析),數(shù)據(jù)類型及圖示 (小結(jié)),合理使用圖表,鑒別圖形優(yōu)劣的準(zhǔn)則 統(tǒng)計(jì)表的設(shè)計(jì),一張好的圖表應(yīng)包括以下基本特征 顯示數(shù)據(jù) 讓讀者把注意力集中在圖表的內(nèi)容上,而不是制作圖表的程序上 避免歪曲 強(qiáng)調(diào)數(shù)據(jù)之間的比較 服務(wù)于一個(gè)明確的目的 有對(duì)圖表的統(tǒng)計(jì)描述和文字說明 5種鑒別圖表優(yōu)劣的準(zhǔn)則:一張好的圖表應(yīng)當(dāng) 精心設(shè)計(jì)、有助于洞察問題的實(shí)質(zhì) 使復(fù)雜的觀點(diǎn)得到簡(jiǎn)明、確切、高效的闡述 能在最短的時(shí)間內(nèi)以最少的筆墨給讀者提供最大量的信息 是多維的 表述數(shù)據(jù)的真實(shí)情況,鑒別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年理解春節(jié)的團(tuán)圓與情感共鳴
- 2026年保險(xiǎn)產(chǎn)品精準(zhǔn)營(yíng)銷策略培訓(xùn)
- 2025年山東省事業(yè)編四月底筆試及答案
- 2025年廣東護(hù)理事業(yè)編考試試題及答案
- 2025年陜西省渭南市人事考試及答案
- 2026年小兔的春節(jié)家庭聚會(huì)
- 2025年思明幼教筆試及答案
- 2025年老八校建筑學(xué)復(fù)試筆試題及答案
- 2025年物聯(lián)網(wǎng)面試筆試題及答案
- 2025年生物初中教資筆試及答案
- 電線選型課件
- 2025年海南省公務(wù)員考試真題試卷含答案
- 獸醫(yī)技能培訓(xùn)計(jì)劃
- 焊接球網(wǎng)架施工焊接工藝方案
- JJF(鄂) 175-2025 氣壓測(cè)試箱校準(zhǔn)規(guī)范
- 小學(xué)英語分層作業(yè)設(shè)計(jì)策略
- 廣元中核職業(yè)技術(shù)學(xué)院《高等數(shù)學(xué)(3)》2025 - 2026學(xué)年第一學(xué)期期末試卷(A卷)
- 醫(yī)務(wù)人員醫(yī)院感染防護(hù)措施
- TCESA1249.32023服務(wù)器及存儲(chǔ)設(shè)備用液冷裝置技術(shù)規(guī)范第3部分冷量分配單元
- 床上運(yùn)動(dòng)及轉(zhuǎn)移技術(shù)課件
- 實(shí)例要素式行政起訴狀(工傷保險(xiǎn)資格或者待遇認(rèn)定)
評(píng)論
0/150
提交評(píng)論