版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章數(shù)據(jù)的描述性分析本章學(xué)習(xí)目標(biāo)1、能夠根據(jù)統(tǒng)計(jì)數(shù)據(jù)的類型,選擇恰當(dāng)?shù)募汹厔?shì)度量的指標(biāo);2、能夠計(jì)算集中趨勢(shì)的度量指標(biāo):眾數(shù)、中位數(shù)與分位數(shù)、平均數(shù);
3、能夠根據(jù)統(tǒng)計(jì)數(shù)據(jù)的類型,選擇恰當(dāng)?shù)碾x散程度的度量指標(biāo);4、能夠計(jì)算離散程度的度量指標(biāo):異眾比率、全距、四分位差、平均差、方差與標(biāo)準(zhǔn)差離散系數(shù),標(biāo)準(zhǔn)分?jǐn)?shù),離散系數(shù);5、能夠判斷所給數(shù)據(jù)的分布形態(tài)。2、本章重點(diǎn)與難點(diǎn)1、集中趨勢(shì)指標(biāo)的選擇與計(jì)算2、離散程度指標(biāo)的選擇與計(jì)算【引例】我院某班大二學(xué)生在大一第一學(xué)期《微積分1》考試成績(jī)?nèi)缦拢?5,85,60,84,87,85,83,62,60,55,83,76,93,81,60,92,72,72,85,63,69,73,61,51,71,60,68,91,76,75,69,23,78,60,81,54,86,60,81,70,65,68,84,91,50,70,77,63,78,28,69,72,78,33,71,76,76,85,47,63,74,78,60,72,85,52,60,61,37,62,80,95,60,60,46,60,64,75,60,83,68,71,74,60,60,47,80,62,60,77,75,62,54,85,81,68,74,49.問(wèn)題:那個(gè)數(shù)據(jù)可以看作這個(gè)班《微積分1》考試成績(jī)的代表?或者說(shuō)是一般水平?回答:平均成績(jī)69分問(wèn)題延伸:這組數(shù)據(jù)的穩(wěn)定性如何?或者說(shuō)以69分作為這個(gè)班考試成績(jī)的代表,代表性如何?離散程度的度量離中趨勢(shì)數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值問(wèn)題:眾數(shù)、中位數(shù)、平均數(shù)是我們經(jīng)常選用的數(shù)據(jù)集中趨勢(shì)度量的指標(biāo),在相應(yīng)的離散趨勢(shì)的度量中選擇那些指標(biāo)對(duì)上述指標(biāo)的“代表性”進(jìn)行刻畫?問(wèn)題延伸:分類數(shù)據(jù),順序數(shù)據(jù),數(shù)值型數(shù)據(jù)離散趨勢(shì)的度量習(xí)慣上選擇那些標(biāo)志變異指標(biāo)來(lái)度量?分類數(shù)據(jù):異眾比率異眾比率
(variationratio)1. 對(duì)分類數(shù)據(jù)離散程度的測(cè)度2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比例3. 計(jì)算公式為4.用于衡量眾數(shù)的代表性異眾比率
(例題分析)解:
在所調(diào)查的50人當(dāng)中,購(gòu)買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“碳酸飲料”代表消費(fèi)者購(gòu)買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布
飲料品牌頻數(shù)比例百分比(%)
果汁礦泉水綠茶其他碳酸飲料610118150.120.200.220.160.301220221630合計(jì)501100順序數(shù)據(jù):四分位差四分位差
(quartiledeviation)對(duì)順序數(shù)據(jù)離散程度的測(cè)度也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差
Qd=QU
–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性四分位差
(例題分析)解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5
。已知
QL
=不滿意=2
QU
=一般=3四分位差為
Qd
=QU
-
QL
=3–2
=1甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差極差
(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布R
=max(xi)-min(xi)計(jì)算公式為【注意】1、在實(shí)際工作中,極差可以用于檢查產(chǎn)品質(zhì)量的穩(wěn)定性和進(jìn)行質(zhì)量控制。在正常生產(chǎn)的條件下,產(chǎn)品質(zhì)量穩(wěn)定,極差在一定范圍內(nèi)波動(dòng),若極差超過(guò)給定的范圍,就說(shuō)明有不正常情況產(chǎn)傷。2、極差受到極端值的影響,不能反映中間數(shù)據(jù)的分散狀況因此測(cè)定結(jié)果往往不能反映數(shù)據(jù)的實(shí)際離散程度。四分位差?1、四分位差是對(duì)極差的一種改進(jìn)。與極差相比,四分位差因不受極值的影響,在反映數(shù)據(jù)的離散程度方面比極差準(zhǔn)確,具有較高的穩(wěn)定性;同時(shí),對(duì)于存在開口的組距數(shù)列,不能計(jì)算極差,但可以計(jì)算四分位差。四分位差與極差相比較:2、四分位差和極差一樣,不能充分利用數(shù)據(jù)的全部信息,也無(wú)法反映標(biāo)志值的一般變動(dòng)。【練習(xí)】計(jì)算下列數(shù)據(jù)的極差1,6,6,6,6,6,101,3,4,7,8,9,10問(wèn)題:那一組數(shù)據(jù)數(shù)據(jù)的差異大一些?如何判斷?平均差
(meandeviation)各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差
(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—2040平均差
(例題分析)
含義:每一天的銷售量平均數(shù)相比,平均相差17臺(tái)
優(yōu)點(diǎn):能較好地區(qū)別出不同組數(shù)據(jù)的分散情況或程度;缺點(diǎn):是絕對(duì)值不適合作進(jìn)一步方差和標(biāo)準(zhǔn)差
(varianceandstandarddeviation)數(shù)據(jù)離散程度的最常用測(cè)度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為
2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)總體方差和標(biāo)準(zhǔn)差
(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差
(samplevarianceandstandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!問(wèn)題:樣本方差的計(jì)算公式中分母位置為什么為”n-1”?自由度
(degreeoffreedom)自由度是指數(shù)據(jù)個(gè)數(shù)與附加給獨(dú)立的觀測(cè)值的約束或限制的個(gè)數(shù)之差從字面涵義來(lái)看,自由度是指一組數(shù)據(jù)中可以自由取值的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本平均數(shù)確定后,則附加給n個(gè)觀測(cè)值的約束個(gè)數(shù)就是1個(gè),因此只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值按著這一邏輯,如果對(duì)n個(gè)觀測(cè)值附加的約束個(gè)數(shù)為k個(gè),自由度則為n-k自由度
(degreeoffreedom)樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則
x=5。當(dāng)
x
=5
確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值為什么樣本方差的自由度為什么是n-1呢?因?yàn)樵谟?jì)算離差平方和時(shí),必須先求出樣本均值
x
,而
x則是附件給離差平方和的一個(gè)約束,因此,計(jì)算離差平方和時(shí)只有n-1個(gè)獨(dú)立的觀測(cè)值,而不是n個(gè)樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差s2去估計(jì)總體方差σ2時(shí),它是σ2的無(wú)偏估計(jì)量【例】在某地區(qū)抽取的
120家企業(yè)按利潤(rùn)額進(jìn)行分組,結(jié)果如表所示.計(jì)算標(biāo)準(zhǔn)差。
某地區(qū)120家企業(yè)的利潤(rùn)額分組相對(duì)位置的度量:標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)
(standardscore)1.也稱標(biāo)準(zhǔn)化值2. 對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)4. 用于對(duì)變量的標(biāo)準(zhǔn)化處理5.計(jì)算公式為【練習(xí)】假定某班學(xué)生先后兩次進(jìn)行了難度不同的大學(xué)英語(yǔ)綜合考試,第一次考試成績(jī)的均值和標(biāo)準(zhǔn)差分別為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年青島港灣職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年云南工程職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫(kù)含詳細(xì)答案解析
- 2026年天津工藝美術(shù)職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026貴州省國(guó)有資產(chǎn)監(jiān)督管理研究和服務(wù)中心招聘2人考試重點(diǎn)題庫(kù)及答案解析
- 2026吉林延邊州安圖縣面向委培生、定向生招聘員額經(jīng)費(fèi)管理人員7人參考考試試題及答案解析
- 2026年山西警官職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試模擬試題含詳細(xì)答案解析
- 2026廣東廣州南沙人力資源發(fā)展有限公司招聘編外醫(yī)護(hù)人員3人考試參考試題及答案解析
- 2026年湘潭醫(yī)衛(wèi)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫(kù)含詳細(xì)答案解析
- 2026年西安航空職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026年湖南含色金屬職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 2026 年初中英語(yǔ)《狀語(yǔ)從句》專項(xiàng)練習(xí)與答案 (100 題)
- 2026年遼寧省盤錦市高職單招語(yǔ)文真題及參考答案
- 農(nóng)投集團(tuán)安全生產(chǎn)制度
- 近五年貴州中考物理真題及答案2025
- 2025年黑龍江省大慶市中考數(shù)學(xué)試卷
- 山東煙草2026年招聘(197人)考試備考試題及答案解析
- 二級(jí)醫(yī)院的DRGs培訓(xùn)課件
- 空芯光纖行業(yè)分析報(bào)告
- 置業(yè)顧問(wèn)崗位招聘考試試卷及答案
- 大眾試駕協(xié)議書
- 初中體育《正確跑姿勢(shì)》教學(xué)課件
評(píng)論
0/150
提交評(píng)論