數(shù)學(xué)-統(tǒng)計背景下的新定義問題(四大題型)(原卷版)_第1頁
數(shù)學(xué)-統(tǒng)計背景下的新定義問題(四大題型)(原卷版)_第2頁
數(shù)學(xué)-統(tǒng)計背景下的新定義問題(四大題型)(原卷版)_第3頁
數(shù)學(xué)-統(tǒng)計背景下的新定義問題(四大題型)(原卷版)_第4頁
數(shù)學(xué)-統(tǒng)計背景下的新定義問題(四大題型)(原卷版)_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計背景下的新定義問題目錄TOC\o"1-2"\h\z\u01方法技巧與總結(jié) 202題型歸納與總結(jié) 3題型一:新定義統(tǒng)計量或指標(biāo) 3題型二:新定義的統(tǒng)計方法或技術(shù) 5題型三:新定義的數(shù)據(jù)可視化方法 6題型四:綜合應(yīng)用題 1003過關(guān)測試 13

針對高中數(shù)學(xué)統(tǒng)計背景下的新定義問題,解題方法的總結(jié)可以從以下幾個方面進(jìn)行:一、理解新定義的本質(zhì)首先,需要明確題目中的新定義是針對統(tǒng)計中的某一概念、方法或運(yùn)算的拓展或創(chuàng)新。理解這一新定義的本質(zhì)屬性、條件、結(jié)論以及適用范圍是解題的第一步。這要求學(xué)生具備較強(qiáng)的閱讀理解能力和抽象思維能力,能夠快速準(zhǔn)確地把握新定義的核心內(nèi)容。二、聯(lián)系已學(xué)知識新定義問題往往不是孤立存在的,它們往往與已學(xué)的統(tǒng)計知識有著緊密的聯(lián)系。因此,在理解新定義的基礎(chǔ)上,學(xué)生需要將其與已學(xué)的統(tǒng)計概念、方法或運(yùn)算進(jìn)行聯(lián)系,找到它們之間的共同點和不同點。這樣不僅可以幫助學(xué)生更好地理解新定義,還可以為后續(xù)的解題提供思路和方法。三、構(gòu)建解題模型對于統(tǒng)計背景下的新定義問題,構(gòu)建解題模型是解決問題的關(guān)鍵。學(xué)生需要根據(jù)題目的具體要求和已學(xué)知識,構(gòu)建出適合解決該問題的統(tǒng)計模型。這個模型可以是基于某種統(tǒng)計分布的假設(shè)檢驗?zāi)P停部梢允腔跀?shù)據(jù)特征的描述統(tǒng)計模型。在構(gòu)建模型的過程中,學(xué)生需要充分考慮新定義的條件和結(jié)論,確保模型的準(zhǔn)確性和有效性。四、運(yùn)用統(tǒng)計方法進(jìn)行計算和分析在構(gòu)建好解題模型之后,學(xué)生需要運(yùn)用統(tǒng)計方法進(jìn)行計算和分析。這包括數(shù)據(jù)的收集、整理、描述、推斷等各個方面。在計算和分析的過程中,學(xué)生需要嚴(yán)格按照統(tǒng)計方法的步驟和要求進(jìn)行操作,確保結(jié)果的準(zhǔn)確性和可靠性。同時,學(xué)生還需要注意對新定義條件的應(yīng)用和理解,確保計算和分析過程符合題目要求。五、總結(jié)歸納最后,學(xué)生需要對解題過程進(jìn)行總結(jié)歸納。這包括對新定義的理解和應(yīng)用情況的反思、對解題思路和方法的總結(jié)以及對統(tǒng)計知識的鞏固和拓展等方面。通過總結(jié)歸納,學(xué)生可以更好地掌握新定義問題的解題方法,提高自己的統(tǒng)計素養(yǎng)和解題能力。具體解題步驟建議仔細(xì)閱讀題目:理解題目中的新定義及其條件、結(jié)論等要素。聯(lián)系已學(xué)知識:將新定義與已學(xué)的統(tǒng)計知識進(jìn)行聯(lián)系和對比,找到它們之間的共同點和不同點。構(gòu)建解題模型:根據(jù)題目要求和已學(xué)知識構(gòu)建解題模型,明確模型的假設(shè)條件、計算步驟和分析方法。進(jìn)行計算和分析:按照統(tǒng)計方法的步驟和要求進(jìn)行計算和分析,確保結(jié)果的準(zhǔn)確性和可靠性??偨Y(jié)歸納:對解題過程進(jìn)行總結(jié)歸納,反思解題過程中的得失和體會,鞏固和拓展自己的統(tǒng)計知識。題型一:新定義統(tǒng)計量或指標(biāo)【典例1-1】設(shè),,…,是總體數(shù)據(jù)中抽取的樣本,k為正整數(shù),則稱為樣本k階中心矩,其中為樣本均值.統(tǒng)計學(xué)中,當(dāng)我們遇到數(shù)據(jù)分布形狀不對稱時,常用樣本中心矩的函數(shù)——樣本偏度來刻畫偏離方向與程度.若將樣本數(shù)據(jù),,…,繪制柱形圖如圖所示,則(

)2A. B.C. D.與0的大小關(guān)系不能確定【典例1-2】定義空間直角坐標(biāo)系中的任意點的“數(shù)”為:在點的坐標(biāo)中不同數(shù)字的個數(shù),如:,點的坐標(biāo),則所有這些點的“數(shù)”的均值與最小值之差為.【變式1-1】(2024·河北·模擬預(yù)測)機(jī)器模型預(yù)測常常用于只有正確與錯誤兩種結(jié)果的問題.表1為根據(jù)模型預(yù)測結(jié)果與真實情況的差距的情形表格,定義真正例率,假正例率.概率閾值為自行設(shè)定的用于判別正(反)例的值,若分類器(分類模型)對該樣例的預(yù)測正例概率大于等于設(shè)定的概率閾值,則記分類器預(yù)測為正例,反之預(yù)測為反例.總例預(yù)測結(jié)果正例反例真實情況正例真正例假反例反例假正例真反例表1分類結(jié)果樣例劃分利用這些指標(biāo)繪制出的ROC曲線可衡量模型的評價效果:將各樣例的預(yù)測正例概率與從大到小排序并依次作為概率閾值,分別計算相應(yīng)概率閾值下的與.以為橫坐標(biāo),為縱坐標(biāo),得到標(biāo)記點.依次連接各標(biāo)記點得到的折線就是ROC曲線.圖1為甲分類器對于8個樣例的ROC曲線,表2為甲,乙分類器對于相同8個樣例的預(yù)測數(shù)據(jù).樣例數(shù)據(jù)甲分類器乙分類器樣例標(biāo)號樣例屬性預(yù)測正例概率預(yù)測正例概率1正例0.230.342正例0.580.533反例0.150.134反例0.620.395正例0.470.876反例0.470.537反例0.330.118正例0.770.63表2甲,乙分類器對于相同8個樣例的預(yù)測數(shù)據(jù)

(1)當(dāng)概率閾值為0.47時,求甲分類器的ROC曲線中的對應(yīng)點;(2)在圖2中繪制乙分類器對應(yīng)的ROC曲線(無需說明繪圖過程),并直接寫出甲,乙兩分類器的ROC曲線與軸,直線所圍封閉圖形的面積;(3)按照上述思路,比較甲,乙兩分類器的預(yù)測效果,并直接寫出理想分類器的ROC曲線與軸,直線所圍封閉圖形的面積為1的充要條件.題型二:新定義的統(tǒng)計方法或技術(shù)【典例2-1】(2024·河北衡水·一模)為檢測出新冠肺炎的感染者,醫(yī)學(xué)上可采用“二分檢測法”,假設(shè)待檢測的總?cè)藬?shù)是,將個人的樣本混合在一起做第1輪檢測(檢測一次),如果檢測結(jié)果為陰性,可確定這批人未感染;如果檢測結(jié)果為陽性,可確定其中有感染者,則將這批人平均分為兩組,每組人的樣本混合在一起做第2輪檢測,每組檢測1次,如此類推,每輪檢測后,排除結(jié)果為陰性的那組人,而將每輪檢測后結(jié)果為陽性的組再平均分成兩組,做下一輪檢測,直到檢測出所有感染者(感染者必須通過檢測來確定),若待檢測的總?cè)藬?shù)為8,采用“二分檢測法”構(gòu)測,經(jīng)過4輪共7次檢測后確定了所有感染者,則感染者人數(shù)的所有可能值為人.若待檢測的總?cè)藬?shù)為,且假設(shè)其中有2名感染者,采用“二分檢測法”所需檢測總次數(shù)記為n,則n的最大值為.【典例2-2】已知數(shù)據(jù)的平均數(shù)為,設(shè)為該組數(shù)據(jù)的“階方差”,若,則與的大小關(guān)系為(

)A. B. C. D.與奇偶性有關(guān)【變式2-1】已知樣本的平均數(shù)為,設(shè)為該樣本的“階方差”,則(

)A.B.對任意恒成立C.當(dāng)為奇數(shù)時,不可能為負(fù)數(shù)D.若,則【變式2-2】(多選題)(2024·高三·湖北·期中)基于小汽車的“車均擁堵指數(shù)”,其取值范圍是,值越大表明擁堵程度越強(qiáng)烈.在這個公式中,為路段上統(tǒng)計時間間隔內(nèi)車輛平均行駛速度,為路段上自由流狀態(tài)下車輛行駛速度,且結(jié)合地圖匹配算法可得到,其中表示浮動車的速度.下列說法正確的是(

)A.的值越大,的值越小B.若,則去掉后得到的的值變小C.若,則去掉后得到的的值不變D.若,則樣本的方差小于樣本的方差【變式2-3】(多選題)(2024·河北邯鄲·三模)為了估計一批產(chǎn)品的不合格品率,現(xiàn)從這批產(chǎn)品中隨機(jī)抽取一個樣本容量為的樣本,定義,于是,,,記(其中或1,),稱表示為參數(shù)的似然函數(shù).極大似然估計法是建立在極大似然原理基礎(chǔ)上的一個統(tǒng)計方法,極大似然原理的直觀想法是:一個隨機(jī)試驗如有若干個可能的結(jié)果A,B,C,…,若在一次試驗中,結(jié)果A出現(xiàn),則一般認(rèn)為試驗條件對A出現(xiàn)有利,也即A出現(xiàn)的概率很大.極大似然估計是一種用給定觀察數(shù)據(jù)來評估模型參數(shù)的統(tǒng)計方法,即“模型已定,參數(shù)未知”,通過若干次試驗,觀察其結(jié)果,利用試驗結(jié)果得到某個參數(shù)值能夠使樣本出現(xiàn)的概率為最大.根據(jù)以上原理,下面說法正確的是(

)A.有外形完全相同的兩個箱子,甲箱有99個白球1個黑球,乙箱有1個白球99個黑球.今隨機(jī)地抽取一箱,再從取出的一箱中抽取一球,結(jié)果取得白球,那么該球一定是從甲箱子中抽出的B.一個池塘里面有鯉魚和草魚,打撈了100條魚,其中鯉魚80條,草魚20條,那么推測鯉魚和草魚的比例為4:1時,出現(xiàn)80條鯉魚、20條草魚的概率是最大的C.D.達(dá)到極大值時,參數(shù)的極大似然估計值為題型三:新定義的數(shù)據(jù)可視化方法【典例3-1】2021年,小李老師的親戚準(zhǔn)備購買一輛新的卡車用來跑運(yùn)輸,可選的車型主要有種.分別為,,,,現(xiàn)在有個指標(biāo):維修期限,百升汽油里數(shù),最大載重噸數(shù),價格,可能性,靈敏性來衡量,其中可靠性和靈敏性為評分,如下表.為了統(tǒng)一標(biāo)準(zhǔn)用來分析比較,小李老師將數(shù)據(jù)做了以下處理:.(表示第行第列的原始數(shù)據(jù),表示第行第列的原始數(shù)據(jù)處理后的數(shù)據(jù),表示第列的原始數(shù)據(jù))如果用綜合指標(biāo)來做標(biāo)準(zhǔn),則的綜合指標(biāo)為(

)A. B. C. D.【典例3-2】(2024·四川涼山·二模)高三模擬考試常常劃定的總分各批次分?jǐn)?shù)線,通過一定的數(shù)學(xué)模型,確定不同學(xué)科在一本、二本等各批次“學(xué)科上線有雙分”的分?jǐn)?shù)線.考生總成績達(dá)到總分各批次分?jǐn)?shù)線的稱為總分上線;考生某一單科成績達(dá)到及學(xué)科上線有雙分的稱為單科上線.學(xué)科對總分的貢獻(xiàn)或匹配程度評價有很大的意義.利用“學(xué)科對總分上線貢獻(xiàn)率”和“學(xué)科有效分上線命中率”這兩項評價指標(biāo),來反映各學(xué)科的單科成績對考生總分上線的貢獻(xiàn)與匹配程度,這對有效安排備考復(fù)習(xí)計劃具有十分重要的意義.某州一診考試劃定總分一本線為465分,數(shù)學(xué)一本線為104分,某班一小組的總分和數(shù)學(xué)成績?nèi)绫恚瑒t該小組“數(shù)學(xué)學(xué)科對總分上線貢獻(xiàn)率、有效分上線命中率”分別是(

)(結(jié)果保留到小數(shù)點后一位有效數(shù)字)學(xué)生編號1234567891011121314151617181920數(shù)學(xué)成績120117122101100112991111021008998928494113971048585總分成績495494493485483483482480479475471470463457454453448448441440A.41.7%,71.4% B.60%,71.4%C.41.7%,35% D.60%,35%【變式3-1】某省新高考中選考科目采用賦分制,具體轉(zhuǎn)換規(guī)則和步驟如下:第一步,按照考生原始分從高到低按成績比例劃定、、、、共五個等級(見下表).第二步,將至五個等級內(nèi)的考生原始分,依照等比例轉(zhuǎn)換法則,分別對應(yīng)轉(zhuǎn)換到100~86、85~71、70~56、55~41和40~30五個分?jǐn)?shù)段,從而將考生的等級轉(zhuǎn)換成了等級分.等級比例15%35%35%13%2%賦分區(qū)間100-8685-7170-5655-4140-30賦分公式:,計算出來的經(jīng)過四舍五人后即為賦分成績.某次考試,化學(xué)成績等級的原始最高分為98分,最低分為63分.學(xué)生甲化學(xué)原始成績?yōu)?6分,則該學(xué)生的化學(xué)賦分分?jǐn)?shù)為(

)A.85 B.88 C.91 D.95【變式3-2】某公司有甲乙兩條生產(chǎn)線生產(chǎn)同一種產(chǎn)品,為了解產(chǎn)品的質(zhì)量情況,對兩條生產(chǎn)線生產(chǎn)的產(chǎn)品進(jìn)行簡單隨機(jī)抽樣,經(jīng)檢測得到了A、B的兩項質(zhì)量指標(biāo)值,記為,定義產(chǎn)品的指標(biāo)偏差,數(shù)據(jù)如下表:甲生產(chǎn)線抽樣產(chǎn)品編號指標(biāo)123456789100.980.961.071.020.990.930.920.961.111.022.011.971.962.032.041.981.951.992.072.020.030.070.110.050.050.090.130.050.180.04乙生產(chǎn)線抽樣產(chǎn)品編號指標(biāo)123456781.020.970.950.941.130.980.971.012.012.032.151.932.012.022.192.040.030.060.200.130.140.040.220.05假設(shè)用頻率估計概率,且每件產(chǎn)品的質(zhì)量相互獨(dú)立.(1)從甲生產(chǎn)線上隨機(jī)抽取一件產(chǎn)品,估計該產(chǎn)品滿足且的概率;(2)從甲乙兩條生產(chǎn)線上各隨機(jī)抽取一件產(chǎn)品,設(shè)表示這兩件產(chǎn)品中滿足的產(chǎn)品數(shù),求的分布列和數(shù)學(xué)期望;(3)已知的值越小則該產(chǎn)品質(zhì)量越好.如果甲乙兩條生產(chǎn)線各生產(chǎn)一件產(chǎn)品,根據(jù)現(xiàn)有數(shù)據(jù)判斷哪條生產(chǎn)線上的產(chǎn)品質(zhì)量更好?并說明理由.【變式3-3】定義:為不超過的最大整數(shù)部分,如,.甲、乙兩個學(xué)生高二的6次數(shù)學(xué)測試成績(測試時間為90分鐘,滿分100分)如下表所示:高二成績第1次考試第2次考試第3次考試第4次考試第5次考試第6次考試甲687477848895乙717582848694進(jìn)入高三后,由于改進(jìn)了學(xué)習(xí)方法,甲、乙這兩個學(xué)生的數(shù)學(xué)測試成績預(yù)計有了大的提升.設(shè)甲或乙高二的數(shù)學(xué)測試成績?yōu)?,若,則甲或乙高三的數(shù)學(xué)測試成績預(yù)計為;若,則甲或乙高三的數(shù)學(xué)測試成績預(yù)計為100.(1)試預(yù)測:在將要進(jìn)行的高三6次數(shù)學(xué)測試成績(測試時間為90分鐘,滿分100分)中,甲、乙兩個學(xué)生的成績(填入下列表格內(nèi));高三成績第1次考試第2次考試第3次考試第4次考試第5次考試第6次考試甲乙(2)記高三任意一次數(shù)學(xué)測試成績估計值為,規(guī)定:,記為轉(zhuǎn)換分為3分;,記為轉(zhuǎn)換分為4分;,記為轉(zhuǎn)換分為5分.現(xiàn)從乙的6次數(shù)學(xué)測試成績中任意抽取2次,求這2次成績的轉(zhuǎn)換分之和為8分的概率.題型四:綜合應(yīng)用題【典例4-1】(2024·高三·浙江·開學(xué)考試)一般地,元有序?qū)崝?shù)對稱為維向量.對于兩個維向量,定義:兩點間距離,利用維向量的運(yùn)算可以解決許多統(tǒng)計學(xué)問題.其中,依據(jù)“距離”分類是一種常用的分類方法:計算向量與每個標(biāo)準(zhǔn)點的距離,與哪個標(biāo)準(zhǔn)點的距離最近就歸為哪類.某公司對應(yīng)聘員工的不同方面能力進(jìn)行測試,得到業(yè)務(wù)能力分值?管理能力分值?計算機(jī)能力分值?溝通能力分值(分值代表要求度,1分最低,5分最高)并形成測試報告.不同崗位的具體要求見下表:崗位業(yè)務(wù)能力分值管理能力分值計算機(jī)能力分值溝通能力分值合計分值會計(1)215412業(yè)務(wù)員(2)523515后勤(3)235313管理員(4)454417對應(yīng)聘者的能力報告進(jìn)行四維距離計算,可得到其最適合的崗位.設(shè)四種能力分值分別對應(yīng)四維向量的四個坐標(biāo).(1)將這四個崗位合計分值從小到大排列得到一組數(shù)據(jù),直接寫出這組數(shù)據(jù)的第三四分位數(shù);(2)小剛與小明到該公司應(yīng)聘,已知:只有四個崗位的擬合距離的平方均小于20的應(yīng)聘者才能被招錄.(i)小剛測試報告上的四種能力分值為,將這組數(shù)據(jù)看成四維向量中的一個點,將四種職業(yè)的分值要求看成樣本點,分析小剛最適合哪個崗位;(ii)小明已經(jīng)被該公司招錄,其測試報告經(jīng)公司計算得到四種職業(yè)的推薦率分別為,試求小明的各項能力分值.【典例4-2】設(shè)離散型隨機(jī)變量X和Y有相同的可能取值,它們的分布列分別為,,,,.指標(biāo)可用來刻畫X和Y的相似程度,其定義為.設(shè).(1)若,求;(2)若,求的最小值;(3)對任意與有相同可能取值的隨機(jī)變量,證明:,并指出取等號的充要條件【變式4-1】給定兩組數(shù)據(jù)與,稱為這兩組數(shù)據(jù)之間的“差異量”.鑒寶類的節(jié)目是當(dāng)下非常流行的綜藝節(jié)目.現(xiàn)有個古董,它們的價值各不相同,最值錢的古董記為1號,第二值錢的古董記為2號,以此類推,則古董價值的真實排序為.現(xiàn)在某專家在不知道古董真實排序的前提下,根據(jù)自己的經(jīng)驗對這個古董的價值從高到低依次進(jìn)行重新排序為,其中為該專家給真實價值排第位古董的位次編號,記,那么與的差異量可以有效反映一個專家的水平,該差異量越小說明專家的鑒寶能力越強(qiáng).(1)當(dāng)時,求的所有可能取值;(2)當(dāng)時,求滿足的的個數(shù);(3)現(xiàn)在有兩個專家甲、乙同時進(jìn)行鑒寶,已知專家甲的鑒定結(jié)果與真實價值的差異量為,專家甲與專家乙的鑒定結(jié)果的差異量為4,那么專家乙的鑒定結(jié)果與真實價值的差異量是否可能為?請說明理由.(注:實數(shù)滿足:,當(dāng)且僅當(dāng)時取“”號)【變式4-2】將2024表示成7個正整數(shù)之和,得到方程①,稱七元有序數(shù)組為方程①的解,對于上述的七元有序數(shù)組,當(dāng)時,若),則稱是密集的一組解.(1)方程①是否存在一組解,使得等于同一常數(shù)?若存在,請求出該常數(shù),若不存在,請說明理由;(2)方程①的解中共有多少組是密集的?(3)記,問S是否存在最小值?若存在,請求出S的最小值:若不存在,請說明理由.【變式4-3】已知數(shù)據(jù),,…,的平均數(shù)為,方差為,數(shù)據(jù),,…,的平均數(shù)為,方差為.類似平面向量,定義n維向量,的模,,數(shù)量積.若向量與所成角為,有恒等式,其中,.(1)當(dāng)時,若向量,,求與所成角的余弦值;(2)當(dāng)時,證明:①;②;(3)當(dāng),時,探究與的大小關(guān)系,并證明.1.(2024·高三·北京豐臺·期末)市場占有率指在一定時期內(nèi),企業(yè)所生產(chǎn)的產(chǎn)品在其市場的銷售量(或銷售額)占同類產(chǎn)品銷售量(或銷售額)的比重.一般來說,市場占有率會隨著市場的顧客流動而發(fā)生變化,如果市場的顧客流動趨向長期穩(wěn)定,那么經(jīng)過一段時期以后的市場占有率將會出現(xiàn)穩(wěn)定的平衡狀態(tài)(即顧客的流動,不會影響市場占有率),此時的市場占有率稱為“穩(wěn)定市場占有率”.有A,B,C三個企業(yè)都生產(chǎn)某產(chǎn)品,2022年第一季度它們的市場占有率分別為:40%,40%,20%.經(jīng)調(diào)查,2022年第二季度A,B,C三個企業(yè)之間的市場占有率轉(zhuǎn)移情況如圖所示,若該產(chǎn)品以后每個季度的市場占有率轉(zhuǎn)移情況均與2022年第二季度相同,則當(dāng)市場出現(xiàn)穩(wěn)定的平衡狀態(tài),最終達(dá)到“穩(wěn)定市場占有率”時,A企業(yè)該產(chǎn)品的“穩(wěn)定市場占有率”為(

A.45% B.48% C.50% D.52%2.(多選題)為了解決傳統(tǒng)的3D人臉識別方法中存在的不精確問題,科學(xué)家提出了一種基于視頻分塊聚類的格拉斯曼流形自動識別系統(tǒng).規(guī)定:某區(qū)域內(nèi)的m個點的深度的均值,標(biāo)準(zhǔn)偏差為,深度的點視為孤立點,下表給出了某區(qū)域內(nèi)的8個點的數(shù)據(jù),則(

)15.115.215.315.415.515.415.413.415.114.214.314.414.515.414.415.42012131516141218A. B. C.不是孤立點 D.和是孤立點3.(2024·北京西城·二模)為研究中國工業(yè)機(jī)器人產(chǎn)量和銷量的變化規(guī)律,收集得到了年工業(yè)機(jī)器人的產(chǎn)量和銷量數(shù)據(jù),如下表所示.年份產(chǎn)量萬臺銷量萬臺記年工業(yè)機(jī)器人產(chǎn)量的中位數(shù)為,銷量的中位數(shù)為.定義產(chǎn)銷率為“”.(1)從年中隨機(jī)取年,求工業(yè)機(jī)器人的產(chǎn)銷率大于的概率;(2)從年這年中隨機(jī)取年,這年中有年工業(yè)機(jī)器人的產(chǎn)量不小于,有年工業(yè)機(jī)器人的銷量不小于.記,求的分布列和數(shù)學(xué)期望;(3)從哪年開始的連續(xù)年中隨機(jī)取年,工業(yè)機(jī)器人的產(chǎn)銷率超過的概率最?。Y(jié)論不要求證明4.(2024·福建泉州·模擬預(yù)測)定義兩組數(shù)據(jù),的“斯皮爾曼系數(shù)”為變量在該組數(shù)據(jù)中的排名和變量在該組數(shù)據(jù)中的排名的樣本相關(guān)系數(shù),記為,其中.某校15名學(xué)生的數(shù)學(xué)成績的排名與知識競賽成績的排名如下表:123456789101112131415153498761021214131115(1)試求這15名學(xué)生的數(shù)學(xué)成績與知識競賽成績的“斯皮爾曼系數(shù)”;(2)已知在這15名學(xué)生中有10人數(shù)學(xué)成績優(yōu)秀,現(xiàn)從這15人中隨機(jī)抽取3人,抽到數(shù)學(xué)成績優(yōu)秀的學(xué)生有人,試求的分布列和數(shù)學(xué)期望.5.(2024·安徽蕪湖·模擬預(yù)測)安徽省從2024年起實施高考綜合改革,實行高考科目“”模式.“2”指考生從政法、地理、化學(xué)、生物四門學(xué)科中“再選”兩門學(xué)科,以等級分計入高考成績.按照方案,再選學(xué)科的等級分賦分規(guī)則如下,將考生原始成績從高到低劃分為A,B,C,D,E五個等級,各等級人數(shù)所占比例及賦分區(qū)間如表1:表1等級ABCDE人數(shù)比例賦分區(qū)間將各等級內(nèi)考生的原始分依照等比例轉(zhuǎn)換法分別轉(zhuǎn)換到賦分區(qū)間內(nèi),得到等級分,轉(zhuǎn)換公式為,其中分別表示原始分區(qū)間的最低分和最高分,分別表示等級賦分區(qū)間的最低分和最高分,Y表示考生的原始分,T表示考生的等級賦分,計算結(jié)果四舍五入取整.若甲同學(xué)在五月全市模考中某選考科目成績信息如表2(本次考試成績均為自然數(shù))表2原始分成績等級原始分區(qū)間等級分區(qū)間75分A等級(1)求甲同學(xué)該科目的等級分;(2)理論上當(dāng)原始分區(qū)間的極差越大時,該區(qū)間中得分越低的同學(xué)賦分后等級分比原始分增加越多.比如某同學(xué)僅該科目較為薄弱,如果賦分后能比原始分增加9.5分以上(包含9.5分),那么六科總分排名相對于原始分排名就會有大幅提升,此時賦分制對于該同學(xué)就是有利的.經(jīng)過統(tǒng)計數(shù)據(jù),五月全市模擬考試該學(xué)科A等級的成績分布如表3.則如果從A等級的學(xué)生中隨機(jī)選出100名,X表示其中獲益于賦分政策的人數(shù),求的值.表3分?jǐn)?shù)段人數(shù)比例6.多樣性指數(shù)是生物群落中種類與個體數(shù)的比值.在某個物種數(shù)目為的群落中,辛普森多樣性指數(shù),其中為第種生物的個體數(shù),為總個體數(shù).當(dāng)越大時,表明該群落的多樣性越高.已知兩個實驗水塘的構(gòu)成如下:綠藻衣藻水綿藍(lán)藻硅藻66666124365(1)若從中分別抽取一個生物個體,求兩個生物個體為同一物種的概率;(2)(i)比較的多樣性大小;(ii)根據(jù)(i)的計算結(jié)果,分析可能影響群落多樣性的因素.7.從2021年秋季學(xué)期起,黑龍江省啟動實施高考綜合改革,實行高考科目“3+1+2”模式.“3”指語文、數(shù)學(xué)、外語三門統(tǒng)考學(xué)科,以原始分?jǐn)?shù)計入高考成績;“1”指考生從物理、歷史兩門學(xué)科中“首選”一門學(xué)科,以原始分?jǐn)?shù)計入高考成績;“2”指考生從政治、地理、化學(xué)、生物四門學(xué)科中“再選”兩門學(xué)科,以等級分計入高考成績.按照方案,再選學(xué)科的等級分賦分規(guī)則如下,將考生原始成績從高到低劃分為A,B,C,D,E五個等級,各等級人數(shù)所占比例及賦分區(qū)間如下表:等級ABCDE人數(shù)比例賦分區(qū)間將各等級內(nèi)考生的原始分依照等比例轉(zhuǎn)換法分別轉(zhuǎn)換到賦分區(qū)間內(nèi),得到等級分,轉(zhuǎn)換公式為,其中分別表示原始分區(qū)間的最低分和最高分,分別表示等級賦分區(qū)間的最低分和最高分,表示考生的原始分,表示考生的等級分,規(guī)定原始分為時,等級分為.某次化學(xué)考試的原始分最低分為50,最高分為98,呈連續(xù)整數(shù)分布,其頻率分布直方圖如下:(1)根據(jù)頻率分布直方圖,求,并估計此次化學(xué)考試原始分的平均值;(2)按照等級分賦分規(guī)則,估計此次考試化學(xué)成績A等級的原始分區(qū)間;(3)用估計的結(jié)果近似代替原始分區(qū)間,若某學(xué)生化學(xué)成績的原始分為88,試計算其等級分(計算結(jié)果四舍五入取整).8.(2024·全國·模擬預(yù)測)某校20名學(xué)生的數(shù)學(xué)成績和知識競賽成績?nèi)缦卤恚簩W(xué)生編號12345678910數(shù)學(xué)成績100999693908885838077知識競賽成績29016022020065709010060270學(xué)生編號11121314151617181920數(shù)學(xué)成績75747270686660503935知識競賽成績4535405025302015105計算可得數(shù)學(xué)成績的平均值是,知識競賽成績的平均值是,并且,,.(1)求這組學(xué)生的數(shù)學(xué)成績和知識競賽成績的樣本相關(guān)系數(shù)(精確到).(2)設(shè),變量和變量的一組樣本數(shù)據(jù)為,其中兩兩不相同,兩兩不相同.記在中的排名是第位,在中的排名是第位,.定義變量和變量的“斯皮爾曼相關(guān)系數(shù)”(記為)為變量的排名和變量的排名的樣本相關(guān)系數(shù).(i)記,.證明:.(ii)用(i)的公式求這組學(xué)生的數(shù)學(xué)成績和知識競賽成績的“斯皮爾曼相關(guān)系數(shù)”(精確到).(3)比較(1)和(2)(ii)的計算結(jié)果,簡述“斯皮爾曼相關(guān)系數(shù)”在分析線性相關(guān)性時的優(yōu)勢.注:參考公式與參考數(shù)據(jù).;;.9.某種人臉識別方法,采用了視頻分塊聚類的自動識別系統(tǒng).規(guī)定:某區(qū)域內(nèi)的個點的深度的均值為,標(biāo)準(zhǔn)差為,深度的點視為孤立點.下表給出某區(qū)域內(nèi)8個點的數(shù)據(jù):15.115.215.315.415.515.415.413.815.114.214.314.414.515.414.415.42012131516141218(1)根據(jù)以上數(shù)據(jù),計算的值;(2)判斷表中各點是否為孤立點.10.(2024·江西吉安·一模)黨的二十大報告提出,要推進(jìn)健康中國建設(shè),把保障人民健康放在優(yōu)先發(fā)展的戰(zhàn)略位置,完善人民健康促進(jìn)政策.《國務(wù)院關(guān)于印發(fā)全民健身計劃(—年)的通知》中指出,深入實施健康中國戰(zhàn)略和全民健身國家戰(zhàn)略,加快體育強(qiáng)國建設(shè),構(gòu)建更高水平的全民健身公共服務(wù)體系,充分發(fā)揮全民健身在提高人民健康水平?促進(jìn)人的全面發(fā)展?推動經(jīng)濟(jì)社會發(fā)展?展示國家文化軟實力等方面的綜合價值與多元功能.如圖為年~年(年的年份序號為)我國健身人數(shù)(百萬人)變化情況的折線圖:統(tǒng)計學(xué)中的樣本點具有二重性,樣本是可以觀測的隨機(jī)變量,本題將和視為兩個隨機(jī)變量且以上數(shù)據(jù)圖中的每個樣本點的產(chǎn)生的概率都是,已知,其中表示的平均數(shù).參考數(shù)據(jù)及公式:.和兩個隨機(jī)變量之間的皮爾遜相關(guān)系數(shù)為,線性回歸方程中,.(1)求回歸方程的皮爾遜相關(guān)系數(shù)(保留位有效數(shù)字);(2)求關(guān)于的回歸方程.11.(2024·湖南郴州·三模)chatGPT是由OpenAI開發(fā)的一款人工智能機(jī)器人程序,一經(jīng)推出就火遍全球.chatGPT的開發(fā)主要采用RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),訓(xùn)練分為以下三個階段.第一階段:訓(xùn)練監(jiān)督策略模型.對抽取的prompt數(shù)據(jù),人工進(jìn)行高質(zhì)量的回答,獲取<prompt,answer>數(shù)據(jù)對,幫助數(shù)學(xué)模型GPT-3.5更好地理解指令.第二階段:訓(xùn)練獎勵模型.用上一階段訓(xùn)練好的數(shù)學(xué)模型,生成個不同的回答,人工標(biāo)注排名,通過獎勵模型給出不同的數(shù)值,獎勵數(shù)值越高越好.獎勵數(shù)值可以通過最小化下面的交叉熵?fù)p失函數(shù)得到:,其中,且.第三階段:實驗與強(qiáng)化模型和算法.通過調(diào)整模型的參數(shù),使模型得到最大的獎勵以符合人工的選擇取向.參考數(shù)據(jù):(1)若已知某單個樣本,其真實分布,其預(yù)測近似分布,計算該單個樣本的交叉熵?fù)p失函數(shù)Loss值.(2)絕對值誤差MAE也是一種比較常見的損失函數(shù),現(xiàn)已知某階變量的絕對值誤差,,其中,表示變量的階.若已知某個樣本是一個三階變量的數(shù)陣,其真實分布是,現(xiàn)已知其預(yù)測分布為,求證:該變量的絕對值誤差為定值.(3)在測試chatGPT時,如果輸入問題沒有語法錯誤chatGPT的回答被采納的概率為,當(dāng)出現(xiàn)語法錯誤時,chatGPT的回答被采納的概率為.現(xiàn)已知輸入的問題中出現(xiàn)語法錯誤的概率為,現(xiàn)已知chatGPT的回答被采納,求該問題的輸入語法沒有錯誤的概率.12.某抽獎系統(tǒng)中,抽得的物品可分為星,星和星,其中一種抽獎種類中的抽獎系統(tǒng)的概率和相關(guān)保底機(jī)制如下:物品類別星星星基礎(chǔ)概率基礎(chǔ)概率:在沒有任何其他機(jī)制的影響下,單次抽獎抽中指定類別獎品的概率.保底機(jī)制:現(xiàn)假定玩家從未進(jìn)行過抽獎,則玩家抽取星(或星)的概率會隨者未抽中星(或星)的次數(shù)增加而改變,相關(guān)機(jī)制如下表所示:連續(xù)未抽中星的次數(shù)下一次抽中星的概率連續(xù)未抽中星的次數(shù)下一次抽中星的概率注:①表示,中的最小值:②抽中星的概率和抽中星的概率的增加值從抽中星的概率中等量扣除;③若發(fā)現(xiàn)下一次抽獎中,抽中星的概率和抽中星的概率的和大于,則下一次抽獎抽中星的概率等于表中的值(記為),而抽中星的概率為.現(xiàn)記玩家獲得個星物品所需要的最大抽獎次數(shù)為;統(tǒng)計名玩家抽到第一個五星的總次數(shù)和中途抽到四星的次數(shù)如下表所示:玩家序號總次數(shù)四星個數(shù)計算得:,,,,已知與之間存在很強(qiáng)的線性相關(guān)關(guān)系,求出其線性回歸方程,并求出使得最小的(回歸方程中的和取兩位小數(shù))參考公式:回歸直線方程斜率和截距的最小二乘估計公式分別為:,.13.(2024·山西太原·三模)在學(xué)業(yè)測試中,客觀題難度的計算公式為,其中為第i題的難度,為答對該題的人數(shù),N為參加測試的總?cè)藬?shù).現(xiàn)對某校高三年級240名學(xué)生進(jìn)行一次測試,共5道

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論