廣東石油化工學院《大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)》2023-2024學年第二學期期末試卷_第1頁
廣東石油化工學院《大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)》2023-2024學年第二學期期末試卷_第2頁
廣東石油化工學院《大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)》2023-2024學年第二學期期末試卷_第3頁
廣東石油化工學院《大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)》2023-2024學年第二學期期末試卷_第4頁
廣東石油化工學院《大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)》2023-2024學年第二學期期末試卷_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

自覺遵守考場紀律如考試作弊此答卷無效密自覺遵守考場紀律如考試作弊此答卷無效密封線第1頁,共3頁廣東石油化工學院

《大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)》2023-2024學年第二學期期末試卷院(系)_______班級_______學號_______姓名_______題號一二三四總分得分一、單選題(本大題共15個小題,每小題1分,共15分.在每小題給出的四個選項中,只有一項是符合題目要求的.)1、某工廠為了控制產(chǎn)品質(zhì)量,對生產(chǎn)過程中的溫度進行監(jiān)控。每天記錄的溫度數(shù)據(jù)屬于()A.截面數(shù)據(jù)B.時間序列數(shù)據(jù)C.面板數(shù)據(jù)D.以上都不是2、已知兩個變量X和Y的相關(guān)系數(shù)為0.8,X的方差為25,Y的方差為16。那么X和Y的協(xié)方差是多少?()A.8B.10C.12D.163、某工廠生產(chǎn)的一批燈泡,其使用壽命服從正態(tài)分布,均值為1500小時,標準差為200小時。從這批燈泡中隨機抽取一個,其使用壽命超過1800小時的概率大約是多少?()A.0.0228B.0.1587C.0.0668D.0.00134、已知某變量的取值范圍為0到100,將其分為5個組,組距為20。第一組的下限為0,上限為20。則第二組的下限和上限分別為()A.20,40B.21,40C.20,41D.21,415、已知一組數(shù)據(jù)的均值為50,標準差為10?,F(xiàn)將每個數(shù)據(jù)都加上10,則新數(shù)據(jù)的均值和標準差分別為()A.60,10B.60,20C.50,10D.50,206、在研究某種疾病的發(fā)病率與環(huán)境因素的關(guān)系時,由于無法確定環(huán)境因素對發(fā)病率的具體函數(shù)形式,應(yīng)采用哪種回歸方法?()A.線性回歸B.非線性回歸C.邏輯回歸D.以上都不對7、已知一組數(shù)據(jù)的偏態(tài)系數(shù)為-0.8,峰態(tài)系數(shù)為2.5,說明這組數(shù)據(jù)的分布形態(tài)是?()A.左偏且尖峰B.右偏且尖峰C.左偏且平峰D.右偏且平峰8、在一次關(guān)于大學生就業(yè)意向的調(diào)查中,共發(fā)放問卷1000份,回收有效問卷800份。在有效問卷中,有400人表示希望畢業(yè)后進入國有企業(yè)工作。以95%的置信水平估計大學生中希望畢業(yè)后進入國有企業(yè)工作的比例的置信區(qū)間為()A.(0.45,0.55)B.(0.47,0.53)C.(0.48,0.52)D.(0.49,0.51)9、在對時間序列進行預測時,如果數(shù)據(jù)呈現(xiàn)出明顯的線性趨勢,適合使用的預測方法是()A.移動平均法B.指數(shù)平滑法C.線性回歸法D.季節(jié)指數(shù)法10、在一項醫(yī)學研究中,比較了兩種藥物治療某種疾病的效果。記錄了患者的治療時間、康復情況等指標。若要綜合評價這兩種藥物的療效,以下哪種方法較為合適?()A.綜合評分法B.秩和檢驗C.主成分分析D.因子分析11、對一組數(shù)據(jù)進行排序后,處于中間位置的數(shù)值被稱為中位數(shù)。如果數(shù)據(jù)個數(shù)為偶數(shù),中位數(shù)應(yīng)如何計算?()A.中間兩個數(shù)的平均值B.中間兩個數(shù)中的較大值C.中間兩個數(shù)中的較小值D.無法確定12、在一個調(diào)查中,要了解不同年齡段人群對某種新科技產(chǎn)品的接受程度。應(yīng)該采用哪種抽樣方法?()A.簡單隨機抽樣B.分層抽樣C.系統(tǒng)抽樣D.整群抽樣13、在一項醫(yī)學研究中,觀察了某種藥物對患者癥狀的改善情況,將患者分為輕度、中度和重度癥狀組。若要檢驗藥物效果在不同癥狀組間是否有差異,應(yīng)選擇哪種統(tǒng)計方法?()A.方差分析B.秩和檢驗C.獨立性檢驗D.配對t檢驗14、為比較三種不同生產(chǎn)工藝對產(chǎn)品質(zhì)量的影響,隨機抽取了若干個產(chǎn)品進行檢測。如果要檢驗三種工藝下產(chǎn)品質(zhì)量的均值是否相等,應(yīng)該使用哪種方差分析?()A.單因素方差分析B.雙因素方差分析C.多因素方差分析D.協(xié)方差分析15、已知某時間序列具有明顯的季節(jié)性變動,現(xiàn)采用移動平均法進行預測。如果移動平均的項數(shù)選擇不當,可能會導致()A.預測值偏高B.預測值偏低C.消除季節(jié)性變動D.不能消除季節(jié)性變動二、簡答題(本大題共4個小題,共20分)1、(本題5分)在進行聚類分析時,常見的聚類方法有哪些?請闡述這些方法的基本原理和適用情況,并舉例說明。2、(本題5分)解釋什么是自助法,它在統(tǒng)計推斷中的應(yīng)用有哪些?3、(本題5分)解釋什么是傾向得分匹配(PropensityScoreMatching),說明傾向得分匹配在觀察性研究中的作用和應(yīng)用步驟。4、(本題5分)在進行一項關(guān)于消費者對某品牌新產(chǎn)品滿意度的調(diào)查中,樣本量的大小如何確定?需要考慮哪些因素?并說明其對調(diào)查結(jié)果準確性的影響。三、計算題(本大題共5個小題,共25分)1、(本題5分)一項關(guān)于某種新型藥物療效的臨床試驗中,將患者隨機分為兩組,一組使用新藥,另一組使用傳統(tǒng)藥物。使用新藥的患者中有80人病情得到改善,使用傳統(tǒng)藥物的患者中有60人病情得到改善。已知使用新藥和傳統(tǒng)藥物的患者人數(shù)分別為100人和80人。試檢驗新藥的療效是否顯著優(yōu)于傳統(tǒng)藥物(α=0.05)。2、(本題5分)某學校對學生的課外活動參與情況進行調(diào)查,隨機抽取了250名學生。其中,參加體育活動的有120人,參加文藝活動的有80人,參加科技活動的有50人。求參加不同課外活動的學生比例,并構(gòu)建90%置信區(qū)間。3、(本題5分)某工廠的生產(chǎn)設(shè)備運行時間和維修費用的數(shù)據(jù)如下:運行時間(小時)分別為500、600、700、800、900,對應(yīng)的維修費用(元)分別為500、650、800、950、1100。請建立維修費用關(guān)于運行時間的線性回歸方程,并預測運行時間為1000小時的維修費用。4、(本題5分)某研究機構(gòu)對兩種農(nóng)作物的產(chǎn)量進行了比較。農(nóng)作物A的產(chǎn)量均值為800公斤/畝,標準差為100公斤/畝;農(nóng)作物B的產(chǎn)量均值為750公斤/畝,標準差為80公斤/畝。隨機抽取了60塊農(nóng)田分別種植兩種農(nóng)作物,在95%置信水平下檢驗兩種農(nóng)作物的平均產(chǎn)量是否存在顯著差異。5、(本題5分)某公司有兩個生產(chǎn)車間,分別生產(chǎn)同一種產(chǎn)品。從車間A隨機抽取50件產(chǎn)品進行檢驗,平均質(zhì)量為10千克,標準差為1千克;從車間B隨機抽取60件產(chǎn)品進行檢驗,平均質(zhì)量為9.5千克,標準差為0.8千克。求兩個車間產(chǎn)品質(zhì)量總體均值之差的95%置信區(qū)間。四、案例分析題(本大題共4個小題,共40分)1、(本題10分)某電商平臺對不同商品類別的搜索關(guān)鍵詞和轉(zhuǎn)化率數(shù)據(jù)進行分析,包括熱門搜索詞、精準匹配度、商品展示效果等。請優(yōu)化搜索算法,提高轉(zhuǎn)化率。2、(本題10分)某互聯(lián)網(wǎng)金融公司收集了不同信用評

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論