版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
《應(yīng)用統(tǒng)計(jì)學(xué)》(02)第2章用圖表和統(tǒng)計(jì)量看數(shù)據(jù)*統(tǒng)計(jì)應(yīng)用
一種測量的平均數(shù)比單個(gè)的測量更可靠
即使用一種很準(zhǔn)確、很可靠的儀器對同一物體進(jìn)行重復(fù)測量,由于一些無法控制的因素的影響,每次得到的結(jié)果也不見得一樣(美國)國家標(biāo)準(zhǔn)與技術(shù)協(xié)會(huì)(NIST—NationalInstituteofStandardsandTechnology)的原子鐘非常準(zhǔn)確,它的準(zhǔn)確程度是每600萬年誤差1秒,但也并不是百分之百準(zhǔn)確世界標(biāo)準(zhǔn)時(shí)間是世界協(xié)調(diào)時(shí)間(UniversalCoordinatedTime),它是由位于法國的塞夫爾的國際計(jì)量局(BIPM)所“編輯”的。BIPM并沒有比NIST更好的鐘,它給出的時(shí)間是根據(jù)世界各地200個(gè)原子鐘的平均時(shí)間得來的*統(tǒng)計(jì)應(yīng)用
把數(shù)據(jù)畫圖之后,要用用腦袋沃德(AbrahamWald)和許多統(tǒng)計(jì)學(xué)家一樣,在第二次世界大戰(zhàn)時(shí)也處理了戰(zhàn)爭與相關(guān)的問題。他發(fā)明的一些統(tǒng)計(jì)方法在戰(zhàn)時(shí)被視為軍事機(jī)密。以下是他提出的概念中較簡單的一種沃德被咨詢飛機(jī)上什么部位應(yīng)該加強(qiáng)鋼板時(shí),開始研究從戰(zhàn)役中返航的軍機(jī)上受敵軍創(chuàng)傷的彈孔位置。他畫了飛機(jī)的輪廓,并且標(biāo)識(shí)出彈孔的位置。資料累積一段時(shí)間后,幾乎把機(jī)身各部位都填滿了。于是沃德建議,把剩下少數(shù)幾個(gè)沒有彈孔的部位補(bǔ)強(qiáng)。因?yàn)檫@些部位被擊中的飛機(jī)都沒有返航資料來源:DavidS.Mroore著《統(tǒng)計(jì)學(xué)世界》第2章用圖表和統(tǒng)計(jì)量看數(shù)據(jù)2.1
用圖表描述數(shù)據(jù)2.2用統(tǒng)計(jì)量描述數(shù)據(jù)2.1用圖表描述數(shù)據(jù)
2.1.1用圖表展示定性數(shù)據(jù)
2.1.2用圖表展示定量數(shù)據(jù)第2章用圖表和統(tǒng)計(jì)量看數(shù)據(jù)2.1.1用圖表展示定性數(shù)據(jù)2.1用圖表描述數(shù)據(jù)*用Excel生成頻數(shù)分布表
(例題分析)【例】一家市場調(diào)查公司為研究不同類型飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行調(diào)查。調(diào)查員在某天對50名顧客購買飲料的類型進(jìn)行了記錄,如果一個(gè)顧客購買某一類型的飲料,就將這一類型的飲料記錄一次。右邊就是記錄的原始數(shù)據(jù)用Excel制作頻數(shù)分布表綠色健康飲品*使用Excel數(shù)據(jù)透視表數(shù)計(jì)數(shù)
(pivottable)第1步:選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第2步:確定數(shù)據(jù)源區(qū)域第3步:在【向?qū)А?步驟之3】中選擇數(shù)據(jù)透視表的輸出位置。然后選擇【布局】第4步:在【向?qū)А季帧繉υ捒蛑?,依次將“分類變量?這是飲料品牌)連續(xù)拖放兩次:一次拖至左邊的“行”區(qū)域,一次拖至“數(shù)據(jù)”區(qū)域第5步:然后單擊【確定】,自動(dòng)返回【向?qū)А?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表用數(shù)據(jù)透視表產(chǎn)生分類數(shù)據(jù)的頻數(shù)分布*使用Excel計(jì)數(shù)函數(shù)
(COUNTIF)如果只需要計(jì)算某一類別的數(shù)據(jù)個(gè)數(shù),可以使用Excel中的統(tǒng)計(jì)函數(shù)【COUNTIF】。在對話框【Range】后輸入數(shù)據(jù)區(qū)域,在【Criteria】后輸入數(shù)字、表達(dá)式、字符串等,計(jì)數(shù)單元格必須符合的條件,即可得出結(jié)果例如,我們要計(jì)算出碳酸飲料出現(xiàn)的頻數(shù),在【Rang】后輸入數(shù)據(jù)所在的區(qū)域,在【Criteria】后輸入“碳酸飲料”,結(jié)果為15。如果數(shù)據(jù)區(qū)域是數(shù)值型數(shù)據(jù),計(jì)算符合特定條件的數(shù)據(jù)個(gè)數(shù),則可在【Criteria】后輸入“>某一數(shù)值”、“<某一數(shù)值”、“=某一數(shù)值”,等等統(tǒng)計(jì)函數(shù)—COUNTIF*定性數(shù)據(jù)的圖示—條形圖
(例題分析)*定性數(shù)據(jù)的圖示—條形圖
(barChart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(columnchart)*定性數(shù)據(jù)的圖示—餅圖
(pieChart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題繪制圓形圖時(shí),樣本或總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比乘以3600確定*定性數(shù)據(jù)的圖示—餅圖
(例題分析)*定性數(shù)據(jù)的圖示—環(huán)形圖
(doughnutchart)環(huán)形圖中間有一個(gè)“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,每一個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)用于結(jié)構(gòu)比較研究*定性數(shù)據(jù)的圖示—環(huán)形圖
(例題分析)【例】在一項(xiàng)城市住房問題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問題是:“您對您家庭目前的住房狀況是否滿意?”
1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。*定性數(shù)據(jù)的圖示—環(huán)形圖
(例題分析)8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
甲乙兩城市家庭對住房狀況的評價(jià)2.1.2用圖表展示定量數(shù)據(jù)2.1用圖表描述數(shù)據(jù)*生成頻數(shù)分布表
(分組)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),組數(shù)一般為5K15確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)~~~~~*生成頻數(shù)分布表
(例題分析)【例】某電腦公司2008年前4個(gè)月每天的銷售額數(shù)據(jù)。用Excel生成頻數(shù)分布表
用Excel制作頻數(shù)分布表
*使用Excel頻數(shù)函數(shù)
(FREQUENCY)Excel的【直方圖】工具的缺陷是:頻數(shù)分布及直方圖沒有與數(shù)據(jù)鏈接,當(dāng)改變?nèi)魏我粋€(gè)數(shù)據(jù)時(shí),頻數(shù)分布表和直方圖不會(huì)跟著改變使用統(tǒng)計(jì)函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖可解決這一問題。具體步驟是選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計(jì)函數(shù)中的【FREQUENCY】函數(shù)在對話框【Date-array】后輸入數(shù)據(jù)區(qū)域,在【Bins-array】后輸入接受區(qū)域同時(shí)按下“ctrl-shift-Enter”組合鍵,即得到頻數(shù)分布統(tǒng)計(jì)函數(shù)—FREQUENCY*分組數(shù)據(jù)—直方圖
(histogram)用于展示分組數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1
用Excel制作直方圖
*用SPSS繪制直方圖第1步:選擇【Graphs】下拉菜單,并選擇
【histogram】選項(xiàng)進(jìn)入主對話框第2步:在主對話框中將變量選入【Variables】
,點(diǎn)擊【OK】
用SPSS繪制直方圖
*分組數(shù)據(jù)—直方圖
(SPSS繪制的直方圖)*分組數(shù)據(jù)—直方圖
(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)*原始數(shù)據(jù)—莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)*用SPSS繪制莖葉圖和箱線圖
(包括直方圖)第1步:選擇【Analyze】下拉菜單,并選擇
【Descriptivestatistics-Explore】
選項(xiàng)進(jìn)入主對話框第2步:在主對話框中將變量選入【Variables】,點(diǎn)擊【Plots】,在對話框中選擇【Stem-and-leaf】(根據(jù)需要可選【Histogram】以給出直方圖)。點(diǎn)擊【Continue】回到主對話框。點(diǎn)擊【OK】
用SPSS繪制莖葉圖*原始數(shù)據(jù)—莖葉圖
(例題分析)某電腦公司銷售額分布的莖葉圖*原始數(shù)據(jù)—箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接該箱線圖也稱為Median/Quart./Range箱線圖
*原始數(shù)據(jù)—簡單箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖*原始數(shù)據(jù)—簡單箱線圖
(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售額數(shù)據(jù)的Median/Quart./Rang箱線圖*分布的形狀與箱線圖不同分布的箱線圖對稱分布Bell-shapeddistributionLeft-skeweddistribution左偏分布右偏分布Right-skeweddistribution*原始數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177*用SPSS繪制多批數(shù)據(jù)箱線圖第1步:選擇【Graphs】下拉菜單,并選擇
【Boxplot】第2步:在出現(xiàn)的對話框中選擇【Simple】,在
【DatainChatAre】中選擇【Summariesofseparatevariables】,點(diǎn)擊【Define】
返回主對話框第3步:在主對話框?qū)⑺凶兞?這里是11個(gè)學(xué)生)選入
【Boxes
Represent】,將“課程名稱”選入
【LabelCasesby】。點(diǎn)擊【OK】
用SPSS繪制箱線圖*11名學(xué)生8門課程考試成績的Median/Quart./Range箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11原始數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析—Median/Quart./Range)*11名學(xué)生8門課程考試成績的Median/Quart./Range箱線圖原始數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(SPSS繪制的箱線圖)*原始數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析—Median/Quart./Range)8門課程考試成績的Median/Quart./Range箱線圖*兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖
(2DScatterplots)展示兩個(gè)變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi
,yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個(gè)點(diǎn)稱為散點(diǎn),由坐標(biāo)及其散點(diǎn)形成的二維數(shù)據(jù)圖溫度/0C降雨量/mm產(chǎn)量/kg/hm262522508403450105845001368575014110580016987500211208250*兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖
(2DScatterplots)*用SPSS繪制散點(diǎn)圖矩陣
(MatrixScatter)第1步:選擇【Graphs】下拉菜單,并選擇
【Scatter/Dot】第2步:在出現(xiàn)的對話框中選擇【MatrixScatter】(要繪制三維散點(diǎn)圖,點(diǎn)擊
【3DScatter】,并定義各坐標(biāo)軸),點(diǎn)擊
【Define】,中將所有變量選【Matrixvariables】,點(diǎn)擊【OK】
用SPSS繪制散點(diǎn)圖*兩個(gè)變量間的關(guān)系—散點(diǎn)圖矩陣
(MatrixScatter—SPSS)溫度降雨量產(chǎn)量*兩個(gè)變量間的關(guān)系—散點(diǎn)圖矩陣
(MatrixScatter—STATISTICA)溫度降雨量產(chǎn)量*三個(gè)變量間的關(guān)系—三維散點(diǎn)圖
(3DScatterplots—SPSS)*三個(gè)變量間的關(guān)系—三維散點(diǎn)圖
(3DScatterplots—STATISTICA)*三個(gè)變量間的關(guān)系—?dú)馀輬D
(bubblechart)顯示三個(gè)變量之間的關(guān)系圖中數(shù)據(jù)點(diǎn)的大小依賴于第三個(gè)變量*也稱為蜘蛛圖(spiderchart)顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用假定各變量的取值具有相同的正負(fù)號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個(gè)樣本之間的相似程度比較多個(gè)樣本的相似性—雷達(dá)圖
(radarchart)*比較多個(gè)樣本的相似性—雷達(dá)圖
(例題分析)【例】2010年我國按收入等級分城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出數(shù)據(jù)如表。試?yán)L制雷達(dá)圖今天的主食是面包*比較多個(gè)樣本的相似性—雷達(dá)圖
(例題分析)2.2用統(tǒng)計(jì)量描述數(shù)據(jù)
2.2.1用一個(gè)值概括一組數(shù)據(jù)
2.2.2找出數(shù)據(jù)彼此之間的差別
2.2.3數(shù)據(jù)分布的形狀第2章用圖表和統(tǒng)計(jì)量看數(shù)據(jù)2.2.1用一個(gè)值概括一組數(shù)據(jù)2.2用統(tǒng)計(jì)量描述數(shù)據(jù)*xx一組數(shù)據(jù)的平均數(shù)是多少
(mean)也稱為均值,常用的統(tǒng)計(jì)量之一消除了觀測值的隨機(jī)波動(dòng)易受極端值的影響根據(jù)總體數(shù)據(jù)計(jì)算的,稱為平均數(shù),記為;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為x*平均數(shù)
(mean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn(總體數(shù)據(jù)xN)樣本平均數(shù)總體平均數(shù)*中間的值是多少—中位數(shù)
(median)Me50%50%不受極端值的影響排序后在中間的值*中間的值是多少—中位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:7507808509601080
1250
150016302000位置:123456789中位數(shù)
1080*中間的值是多少—中位數(shù)
(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:1234
5678910
統(tǒng)計(jì)函數(shù)—MEDIAN*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(quartile)排序后處于25%和75%位置上的值不受極端值的影響QLQMQU25%25%25%25%*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(位置的確定)方法2:較準(zhǔn)確算法方法1:定義算法*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(位置的確定)方法3:
其中[]表示中位數(shù)的位置取整。這樣計(jì)算出的四分位數(shù)的位置,要么是整數(shù),要么在兩個(gè)數(shù)之間0.5的位置上方法4:
Excel給出的四分位數(shù)位置的確定方法
如果位置不是整數(shù),則按比例分?jǐn)偽恢脙蓚?cè)數(shù)值的差值*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)(4種方法計(jì)算)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:1234
5
6
7
89方法1*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:1234
5
6789方法2*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:
12
34
5
6
7
89方法3*用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)—四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:12
3
4
5
67
89方法4
統(tǒng)計(jì)函數(shù)—QUARTILE*哪個(gè)數(shù)據(jù)出現(xiàn)的最多—眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)mo*用哪個(gè)值代表這組數(shù)據(jù)?平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時(shí)應(yīng)用中位數(shù)不受極端值影響,具有穩(wěn)健性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用2.2.2找出數(shù)據(jù)彼此之間的差別2.2用統(tǒng)計(jì)量描述數(shù)據(jù)*最大的和最小的相差多少—極差
(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布計(jì)算公式為
R=max(xi)-min(xi)*四分位差
(quartiledeviation)也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差
Qd=QU
–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性*與平均數(shù)相比平均差多少—平均差
(meandeviation)各變量值與其平均數(shù)離差絕對值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為
統(tǒng)計(jì)函數(shù)—AVEDEV*與平均數(shù)相比平均差多少—方差和標(biāo)準(zhǔn)差
(varianceandStandarddeviation)標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差樣本方差和標(biāo)準(zhǔn)差總體方差和標(biāo)準(zhǔn)差方差注意:樣本方差用自由度n-1去除!統(tǒng)計(jì)函數(shù)—STDEV*自由度
(degreeoffreedom)自由度是指數(shù)據(jù)個(gè)數(shù)與附加給獨(dú)立的觀測值的約束或限制的個(gè)數(shù)之差從字面涵義來看,自由度是指一組數(shù)據(jù)中可以自由取值的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本平均數(shù)確定后,則附加給n個(gè)觀測值的約束個(gè)數(shù)就是1個(gè),因此只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值按著這一邏輯,如果對n個(gè)觀測值附加的約束個(gè)數(shù)為k個(gè),自由度則為n-k*某個(gè)數(shù)據(jù)離平均數(shù)有多遠(yuǎn)—標(biāo)準(zhǔn)分?jǐn)?shù)
(standardscore)1.也稱標(biāo)準(zhǔn)化值2. 對某一個(gè)值在一組數(shù)據(jù)中相對位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)4. 用于對變量的標(biāo)準(zhǔn)化處理5.計(jì)算公式為*標(biāo)準(zhǔn)分?jǐn)?shù)
(例題分析)9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表家庭編號人均月收入(元)標(biāo)準(zhǔn)化值z
123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996*經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)*切比雪夫不等式
(Chebyshev’sinequality)如果一組數(shù)據(jù)不是對稱分布,經(jīng)驗(yàn)法則就不再適用,這時(shí)可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有1-1/k2的數(shù)據(jù)落在平均數(shù)加減k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)*切比雪夫不等式
(Chebyshev’sinequality)對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)*比較幾組數(shù)據(jù)的離散程度—離散系數(shù)
(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為*離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GB-T 36841-2018桃叢簇花葉病毒檢疫鑒定方法》專題研究報(bào)告
- 《GBT 29607-2013橡膠制品 鎘含量的測定 原子吸收光譜法》專題研究報(bào)告
- 《GB-T 2909-2014橡膠工業(yè)用棉本色帆布》專題研究報(bào)告
- 《AQ 1059-2008煤礦安全檢查工安全技術(shù)培訓(xùn)大綱及考核標(biāo)準(zhǔn)》專題研究報(bào)告
- 2026年哈爾濱城市職業(yè)學(xué)院單招綜合素質(zhì)考試題庫附答案詳解
- 企業(yè) ESG 信息披露咨詢服務(wù)合同
- 中式面點(diǎn)師考試試卷與答案
- 助聽器驗(yàn)配師技師(中級)考試試卷及答案
- 單位2025年應(yīng)急管理工作情況報(bào)告
- 2025年(超)短波數(shù)字話音保密機(jī)項(xiàng)目合作計(jì)劃書
- 美容管理營銷課程培訓(xùn)
- 高層建筑火災(zāi)風(fēng)險(xiǎn)評估與管理策略研究
- 綜合管線探挖安全專項(xiàng)施工方案
- GB/T 37507-2025項(xiàng)目、項(xiàng)目群和項(xiàng)目組合管理項(xiàng)目管理指南
- 華為管理手冊-新員工培訓(xùn)
- 社保補(bǔ)繳差額協(xié)議書
- 2025成人有創(chuàng)機(jī)械通氣氣道內(nèi)吸引技術(shù)操作
- 2025年江蘇省職業(yè)院校技能大賽高職組(人力資源服務(wù))參考試題庫資料及答案
- 東北農(nóng)業(yè)大學(xué)教案課程肉品科學(xué)與技術(shù)
- 成都市金牛區(qū)2025屆初三一診(同期末考試)語文試卷
- 如何應(yīng)對網(wǎng)絡(luò)暴力和欺凌行為
評論
0/150
提交評論