總體集中趨勢(shì)的估計(jì)_第1頁(yè)
總體集中趨勢(shì)的估計(jì)_第2頁(yè)
總體集中趨勢(shì)的估計(jì)_第3頁(yè)
總體集中趨勢(shì)的估計(jì)_第4頁(yè)
總體集中趨勢(shì)的估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

9.2.3總體集中趨勢(shì)的估計(jì)

用數(shù)據(jù)透視世界,以統(tǒng)計(jì)智構(gòu)人生汕頭市新溪第一中學(xué)

李庭洲引

入為了了解總體的情況,前面我們研究了如何通過(guò)樣本的分布規(guī)律估計(jì)總體的分布規(guī)律。但在實(shí)際問(wèn)題中,我們有時(shí)更關(guān)注總體的某一方面特征,而非整個(gè)分布規(guī)律。例如,在2025年全國(guó)兩會(huì)中,大家更關(guān)注經(jīng)濟(jì)發(fā)展、民生改善等主要指標(biāo)的改善情況,而非所有細(xì)節(jié)數(shù)據(jù)的分布;對(duì)于直播帶貨,我們更關(guān)注帶貨主播的中位數(shù)銷(xiāo)售額或平均銷(xiāo)售額,而不是銷(xiāo)售額的分布。對(duì)于電影《哪吒2》,我們可能更關(guān)注其總票房或平均每場(chǎng)的票房,而不是票房的分布。在中美貿(mào)易中,我們更關(guān)注關(guān)稅調(diào)整對(duì)主要商品價(jià)格的影響,而不是所有商品價(jià)格的分布。

指標(biāo)《哪吒2》《慶余年2》票房(億)豆瓣評(píng)分討論量(萬(wàn))思考:如何用一個(gè)數(shù)值衡量影視作品的熱度差異?1588.6235.6108.9187.2商品類(lèi)別基礎(chǔ)稅率加征關(guān)稅綜合稅率市場(chǎng)影響汽車(chē)整車(chē)15%125%140%特斯拉

Cybertruck終端價(jià)格上漲59萬(wàn)元(以100萬(wàn)元基礎(chǔ)車(chē)價(jià)計(jì)算)

半導(dǎo)體設(shè)備0%豁免0%倒逼國(guó)產(chǎn)替代加速,中微公司

5nm刻蝕機(jī)實(shí)現(xiàn)量產(chǎn)3醫(yī)療器械(CT)3%34%37%聯(lián)影醫(yī)療市場(chǎng)份額提升至

28%,國(guó)產(chǎn)替代率突破60%3大豆3%125%128%巴西、阿根廷進(jìn)口量占比升至

85%,美國(guó)對(duì)華出口同比下降42%3(2)中位數(shù):(1)眾數(shù):(3)平均數(shù):下面我們通過(guò)具體實(shí)例進(jìn)一步了解這些量的意義,探究它們之間的聯(lián)系與區(qū)別,并根據(jù)樣本的集中趨勢(shì)估計(jì)總體的集中趨勢(shì).一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).一組數(shù)據(jù)按大小依次排列后處在最中間位置的數(shù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù)).

一組數(shù)據(jù)的算術(shù)平均數(shù).

1.概念講解平均數(shù)、中位數(shù)、眾數(shù)——數(shù)據(jù)的“集中代言人”例:《哪吒2》首周7天票房(億元):23.5,18.2,15.7,12.3,10.8,9.6,8.4時(shí)間票房123.5218.2315.7412.3510.869.678.4平均值提問(wèn):如果第8天票房為50億,平均數(shù)會(huì)如何變化?說(shuō)明平均數(shù)受極端值影響大14.07平均數(shù)—最“全面”的代言人美國(guó)對(duì)華關(guān)稅鋼鐵電子紡織機(jī)械化工

關(guān)稅稅率(%)1215182225中國(guó)反制關(guān)稅農(nóng)產(chǎn)品汽車(chē)醫(yī)療器械能源科技產(chǎn)品消費(fèi)品關(guān)稅稅率(%)101215182022中位數(shù)18中位數(shù)16.5中位數(shù)是數(shù)據(jù)排序后的中間值提問(wèn):若美國(guó)對(duì)華關(guān)稅加入數(shù)據(jù)30到奇數(shù)序列,中位數(shù)如何變化?序列變?yōu)閇12,15,18,22,25,30],中位數(shù)變?yōu)椋?0中位數(shù)—最“穩(wěn)健”的代言人思考:若36歲以上觀眾人數(shù)變?yōu)?5,眾數(shù)如何變化?問(wèn)題:隨機(jī)抽100人調(diào)查觀看《哪吒2》觀眾年齡分布(人數(shù))如下:12歲以下:15

13-18歲:32

19-25歲:28

26-35歲:18

36歲以上:7眾數(shù)—最“受歡迎”的代言人平均數(shù)、中位數(shù)、眾數(shù)刻畫(huà)一組數(shù)據(jù)的集中趨勢(shì)的特點(diǎn)平均數(shù)vs中位數(shù):直播數(shù)據(jù)中的“異常訂單”陷阱為什么平臺(tái)“平均銷(xiāo)售額”可能誤導(dǎo)商家?【思考】某直播帶貨紅人“七七”統(tǒng)計(jì)了近期5場(chǎng)直播的銷(xiāo)售額(單位:元),但在錄入數(shù)據(jù)時(shí),誤將第三場(chǎng)銷(xiāo)售額

7000元

錄成了

70000元。已知真實(shí)數(shù)據(jù)的平均為

7000元,中位數(shù)為

7000元。請(qǐng)回答以下問(wèn)題:數(shù)據(jù)表格場(chǎng)次真實(shí)數(shù)據(jù)錯(cuò)誤數(shù)據(jù)15000500026000600037000480008000590009000(1)計(jì)算錯(cuò)誤錄入后的平均數(shù)和中位數(shù)。(2)與真實(shí)數(shù)據(jù)(平均數(shù)7000元,中位數(shù)7000元)對(duì)比,說(shuō)明哪個(gè)統(tǒng)計(jì)量的值變化更大?平均數(shù):700019800

中位數(shù):70008000(+12800元)(僅+1000元)與中位數(shù)比較,平均數(shù)反映出樣本數(shù)據(jù)中的更多信息,對(duì)樣本中的極端值更加敏感?!叭サ粢粋€(gè)最高分和一個(gè)最低分”的原因?“我們企業(yè)員工的年平均收入為20萬(wàn)元”可信嗎?70000統(tǒng)計(jì)量的選擇:平均數(shù):適用于數(shù)據(jù)分布均勻、無(wú)極端值的情況。中位數(shù):對(duì)異常值不敏感,適用于偏態(tài)分布。眾數(shù):反映數(shù)據(jù)集中趨勢(shì),適用于分類(lèi)數(shù)據(jù)或明顯峰值的數(shù)據(jù)。數(shù)據(jù)清洗:處理異常值(如截尾平均數(shù))可提高結(jié)果的代表性。數(shù)據(jù)解讀:需結(jié)合多個(gè)統(tǒng)計(jì)量和分布特征,避免單一指標(biāo)誤導(dǎo)結(jié)論。去掉極端值是為減少異常值干擾,提高評(píng)分公平性;僅憑平均數(shù)20萬(wàn)元不可信,需結(jié)合中位數(shù)、分布形態(tài)等進(jìn)一步分析。直播平臺(tái)中,若存在異常高銷(xiāo)售額(如誤錄或刷單),平均數(shù)會(huì)嚴(yán)重虛高,而中位數(shù)更能反映常態(tài)水平。企業(yè)評(píng)估主播表現(xiàn)時(shí),應(yīng)結(jié)合中位數(shù)或剔除極端值,避免誤導(dǎo)決策。結(jié)論:既要會(huì)用數(shù)據(jù)說(shuō)話,又要防止被數(shù)據(jù)誤導(dǎo)針對(duì)練習(xí)練習(xí)1:在統(tǒng)計(jì)5種進(jìn)口商品的加征關(guān)稅時(shí),錯(cuò)把某商品加征關(guān)稅25%輸成52%,已知原來(lái)5種商品加征關(guān)稅的平均數(shù)為30%,那么由此求出的平均數(shù)與實(shí)際平均數(shù)的差為多少?變式:統(tǒng)計(jì)8部影視作品的豆瓣評(píng)分時(shí),錯(cuò)將其中一部作品的評(píng)分8.0輸入為80(假設(shè)評(píng)分范圍合理擴(kuò)大),已知原來(lái)8部作品的平均評(píng)分為7.5,那么由此求出的平均數(shù)與實(shí)際平均數(shù)的差是多少?平均數(shù)和中位數(shù)都描述了數(shù)據(jù)的集中趨勢(shì),它們的大小關(guān)系和數(shù)據(jù)分布的形態(tài)有關(guān)(如下圖),平均數(shù)和中位數(shù)的大小存在什么關(guān)系?(1)直方圖形狀對(duì)稱(chēng):平均數(shù)和中位數(shù)應(yīng)該大體上差不多;(2)直方圖右邊“拖尾”:平均數(shù)大于中位數(shù);(3)直方圖左邊“拖尾”:平均數(shù)小于中位數(shù).與中位數(shù)相比,平均數(shù)總在直方圖的“長(zhǎng)尾巴”那邊平均數(shù)、中位數(shù)的大小與數(shù)據(jù)分布形態(tài)如果一組數(shù)據(jù)的平均數(shù)和中位數(shù)相差較大,那么可以推斷這組數(shù)據(jù)一定是不對(duì)稱(chēng)的.如果樣本平均數(shù)大于樣本中位數(shù),說(shuō)明數(shù)據(jù)中存在較大的極端值;反之,說(shuō)明數(shù)據(jù)中不存在較大的極端值.平均數(shù)、中位數(shù)的大小與數(shù)據(jù)分布形態(tài)例5.我校要了解高一年級(jí)學(xué)生對(duì)不同類(lèi)型課外活動(dòng)的喜好情況,以便更好地組織相關(guān)活動(dòng)。學(xué)生根據(jù)自己的興趣愛(ài)好選擇喜歡的課外活動(dòng)類(lèi)型。統(tǒng)計(jì)樣本發(fā)現(xiàn),高一(3)班的學(xué)生對(duì)不同課外活動(dòng)類(lèi)型喜好的頻數(shù)如下表所示。音樂(lè)類(lèi)型搖滾古典流行民謠其他合計(jì)頻數(shù)22353850如果用一個(gè)量來(lái)代表該校高一年級(jí)學(xué)生喜歡的音樂(lè)類(lèi)型,在中位數(shù)、平均數(shù)和眾數(shù)中,哪個(gè)量比較合適?試討論用表中的數(shù)據(jù)估計(jì)全國(guó)高一年級(jí)學(xué)生喜歡音樂(lè)類(lèi)型的合理性。解:為更直觀地觀察數(shù)據(jù)特征,可用條形圖表示上述數(shù)據(jù)。從表中可發(fā)現(xiàn),喜歡“流行”音樂(lè)類(lèi)型的學(xué)生頻數(shù)最高。因此,用眾數(shù)“流行”作為我校高一(3)班學(xué)生喜歡音樂(lè)類(lèi)型的代表比較合適。然而,由于高一年級(jí)學(xué)生的喜好存在地域、文化等多方面差異,僅用一個(gè)班級(jí)的數(shù)據(jù)來(lái)估計(jì)全高一年級(jí)學(xué)生喜歡的音樂(lè)類(lèi)型是不合理的,樣本缺乏廣泛代表性。分析:音樂(lè)類(lèi)型屬于分類(lèi)數(shù)據(jù),雖然以文字形式呈現(xiàn),但本質(zhì)是不同類(lèi)別。對(duì)于這類(lèi)分類(lèi)數(shù)據(jù),眾數(shù)更適合作為數(shù)據(jù)代表。眾數(shù)只利用了出現(xiàn)次數(shù)最多的那個(gè)值的信息.眾數(shù)只能告訴我們它比其他值出現(xiàn)的次數(shù)多,但并未告訴我們它比別的數(shù)值多的程度.因此,眾數(shù)只能傳遞數(shù)據(jù)中的信息的很少的一部分,對(duì)極端值也不敏感.對(duì)數(shù)值型數(shù)據(jù)(如用水量、身高、收入、產(chǎn)量等)集中趨勢(shì)的描述,可以用平均數(shù)、中位數(shù);對(duì)分類(lèi)型數(shù)據(jù)(如校服規(guī)格、性別、產(chǎn)品質(zhì)量等級(jí)等)集中趨勢(shì)的描述,可以用眾數(shù).【小結(jié)】眾數(shù)的特點(diǎn)在頻率分布直方圖中,我們無(wú)法知道每個(gè)組內(nèi)的數(shù)據(jù)是如何分布的.此時(shí),通常假設(shè)它們?cè)诮M內(nèi)均勻分布.探究2樣本的平均數(shù)、中位數(shù)和眾數(shù)可以分別作為總體的平均數(shù)、中位數(shù)和眾數(shù)的估計(jì),但在某些情況下我們無(wú)法獲知原始的樣本數(shù)據(jù).

如何由頻率分布直方圖估計(jì)樣本的平均數(shù)、中位數(shù)和眾數(shù)?

你能以圖9.2-1中頻率分布直方圖提供的信息為例,給出估計(jì)方法嗎?由頻率分布直方圖估計(jì)平均數(shù)、中位數(shù)、眾數(shù)眾數(shù)常用在描述分類(lèi)型數(shù)據(jù)中,眾數(shù)5.7讓我們知道月均用水量在區(qū)間[4.2,7.2)的居民用戶(hù)最多.

這個(gè)信息具有實(shí)際意義.在頻率分布直方圖中,月均用水量在區(qū)間[4.2,7.2)內(nèi)的居民最多,可以將這個(gè)區(qū)間的中點(diǎn)5.7作為眾數(shù)的估計(jì)值.——最高矩形的中點(diǎn)①估計(jì)眾數(shù)1.根據(jù)頻率分布直方圖計(jì)算樣本平均數(shù):②估計(jì)平均數(shù)假設(shè)數(shù)據(jù)在組內(nèi)均勻分布.分組小矩形底邊中點(diǎn)的橫坐標(biāo)頻率(小矩形面積)頻數(shù)…………↑小矩形面積↓小矩形底邊中點(diǎn)橫坐標(biāo)于是平均數(shù)的近似值為這個(gè)結(jié)果與根據(jù)原始數(shù)據(jù)計(jì)算的樣本平均數(shù)8.79相差不大.——每個(gè)小矩形底邊中點(diǎn)的橫坐標(biāo)與小矩形的面積的乘積之和↑小矩形面積↓小矩形底邊中點(diǎn)橫坐標(biāo)②估計(jì)平均數(shù)

根據(jù)中位數(shù)的意義,在樣本中,有50%的個(gè)體小于或等于中位數(shù),也有50%的個(gè)體大于或等于中位數(shù).因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等.∴中位數(shù)落在區(qū)間[4.2,7.2)內(nèi)設(shè)中位數(shù)是x,則這個(gè)結(jié)果與根據(jù)原始數(shù)據(jù)求得的中位數(shù)6.8相差不大.——中位數(shù)左邊的直方圖面積和右邊的直方圖面積相等x-4.2③估計(jì)中位數(shù)表格中是我班學(xué)生在國(guó)家中小學(xué)智慧平臺(tái)調(diào)查問(wèn)卷的結(jié)果,根據(jù)問(wèn)卷數(shù)據(jù),計(jì)算使用手機(jī)時(shí)間的平均數(shù)、眾數(shù)、平均數(shù),并對(duì)數(shù)據(jù)進(jìn)行分析。(提示:可以將每個(gè)選項(xiàng)的中心值作為代表值,如A.選項(xiàng)的中心值為0小時(shí),B選項(xiàng)的中心值為0.5小時(shí),C選項(xiàng)的中心值為2小時(shí),D選項(xiàng)的中心值為4小時(shí),)實(shí)例分析你平常玩游戲(手機(jī))的時(shí)間選項(xiàng)小計(jì)比例A.平常不玩游戲36.38%B.0—1小時(shí)817.02%C.1—3小時(shí)2553.19%D.3小時(shí)以上1123.40%結(jié)果分析:平均數(shù)為2.09小時(shí),表明平均每個(gè)人玩游戲的時(shí)間略超過(guò)2小時(shí)。中位數(shù)為2小時(shí),說(shuō)明一半的人玩游戲時(shí)間少于2小時(shí),一半的人多于2小時(shí)。眾數(shù)為1—3小時(shí),表明大多數(shù)人每天玩游戲的時(shí)間集中在1到3小時(shí)之間。眾數(shù)=2——找眾數(shù)、中位數(shù)、平均數(shù)

眾數(shù):最高矩形的中點(diǎn)由頻率分布直方圖估計(jì)總體的集中趨勢(shì)中位數(shù):中位數(shù)左邊的直方圖面積和右邊的直方圖面積相等平均數(shù):每個(gè)小矩形底邊中點(diǎn)的橫坐標(biāo)與小矩形的面積的乘積之和【小結(jié)】辯論:中美貿(mào)易戰(zhàn)對(duì)民眾生活的影響正方觀點(diǎn):從大數(shù)據(jù)總體趨勢(shì)來(lái)看,貿(mào)易戰(zhàn)對(duì)民眾生活影響顯著反方觀點(diǎn):從大數(shù)據(jù)總體趨勢(shì)來(lái)看,貿(mào)易戰(zhàn)對(duì)民眾生活影響有限王詩(shī)涵林炘妤紀(jì)麗瑩謝鍶婷謝創(chuàng)杰卓建謝梓帆謝沛暄對(duì)不隊(duì)炸天幫__________課堂小結(jié)平均數(shù)、中位數(shù)、眾數(shù)各自的含義、特點(diǎn)及優(yōu)缺點(diǎn):平均數(shù)中位數(shù)眾數(shù)在頻率分布直方圖中的含義特點(diǎn)優(yōu)點(diǎn)缺點(diǎn)每個(gè)小矩形面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和與每一個(gè)數(shù)據(jù)有關(guān),任何一個(gè)數(shù)的改變都會(huì)引起它的改變把頻率分布直方圖劃分左右兩個(gè)面積相等的分界線與x軸交點(diǎn)的橫坐標(biāo)只利用了樣本數(shù)據(jù)中間位置的一個(gè)或兩個(gè)值,并未利用其他數(shù)據(jù)最高矩形底邊中點(diǎn)的橫坐標(biāo)只利用了出現(xiàn)次數(shù)最多的那個(gè)值的信息受極端數(shù)據(jù)的影響較大.代表了樣本數(shù)據(jù)更多的信息.只能表達(dá)樣本數(shù)據(jù)中的少量信息.容易計(jì)算,不受少數(shù)幾個(gè)極端值的影響.求一組n個(gè)數(shù)據(jù)的平均數(shù)的方法1.算術(shù)平均數(shù):2.加權(quán)平均數(shù):4.組中值法(由頻率分布直方圖求平均數(shù))推論:3.分層抽樣的樣本平均數(shù):攜數(shù)據(jù)浪潮,逐熱點(diǎn)之光

是人生電影的唯一主角爾由頻率分布直方圖估計(jì)平均數(shù)、中位數(shù)、眾數(shù)[練習(xí)2]已知200輛汽車(chē)通過(guò)某一段公路時(shí)的時(shí)速的頻率分布直方圖,如圖所示,該圖的眾數(shù)為_(kāi)___,平均數(shù)為_(kāi)___,中位數(shù)為_(kāi)____.

656262.5平均數(shù)為45×0.1+55×0.3+65×0.4+75×0.2=62設(shè)中位數(shù)為m,則0.1+0.3+(m-60)×0.04=0.5,解得m=62.5由頻率分布直方圖估計(jì)平均數(shù)、中位數(shù)、眾數(shù)[練習(xí)3]某城市交通部門(mén)為了對(duì)該城市共享單車(chē)加強(qiáng)監(jiān)管,隨機(jī)選取了100人就該城市共享單車(chē)的推行情況進(jìn)行問(wèn)卷調(diào)查,并將問(wèn)卷中的這100人根據(jù)其滿意度評(píng)分值(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論