社會工作與管理(本)專業(yè)《社會統(tǒng)計學》試卷_第1頁
社會工作與管理(本)專業(yè)《社會統(tǒng)計學》試卷_第2頁
社會工作與管理(本)專業(yè)《社會統(tǒng)計學》試卷_第3頁
社會工作與管理(本)專業(yè)《社會統(tǒng)計學》試卷_第4頁
社會工作與管理(本)專業(yè)《社會統(tǒng)計學》試卷_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

社會統(tǒng)計學試卷社會工作與管理(本)專業(yè)一、單項選擇題(每小題1分,共15分)1.在下列兩兩組合的平均指標中,哪一組的兩個平均數完全不受極端數值的影響?【】A.算術平均數和調和平均數B.幾何平均數和眾數C.調和平均數和眾數D.眾數和中位數2.抽樣推斷的目的是【】A.以樣本指標推斷總體指標B.取得樣本指標C.以總體指標估計樣本指標D.以樣本的某一指標推斷另一指標3.下列哪兩個變量之間的相關程度高【】A.商品銷售額和商品銷售量的相關系數是0.9;B.商品銷售額與商業(yè)利潤率的相關系數是0.84;C.平均流通費用率與商業(yè)利潤率的相關系數是-0.94;D.商品銷售價格與銷售量的相關系數是-0.91。4. 在抽樣推斷中,可以計算和控制的誤差是【】A.抽樣實際誤差B.抽樣標準誤差C.非隨機誤差D.系統(tǒng)性誤差5.不重復抽樣的抽樣標準誤公式比重復抽樣多了一個系數【】A.B.C.D.6.估計標準誤說明回歸直線的代表性,因此【】A.估計標準誤數值越大,說明回歸直線的代表性越大;B.估計標準誤數值越大,說明回歸直線的代表性越??;C.估計標準誤數值越小,說明回歸直線的代表性越??;D.估計標準誤數值越小,說明回歸直線的實用價值越小。7.平均差與標準差的主要區(qū)別是【】A.意義有本質的不同B.適用條件不同C.對離差的數學處理方法不同D.反映的變異程度不同8.“統(tǒng)計”一詞的含義可以包括的是【】A.統(tǒng)計工作、統(tǒng)計資料、統(tǒng)計學B.統(tǒng)計工作、統(tǒng)計資料、統(tǒng)計方法C.統(tǒng)計資料、統(tǒng)計學、統(tǒng)計方法D.統(tǒng)計工作、統(tǒng)計學、統(tǒng)計方法9.已知甲數列的算術平均數為100,標準差為20;乙數列的算術平均數為50,標準差為9。由此可以認為【】A.甲數列算術平均數的代表性好于乙數列B.乙數列算術平均數的代表性好于甲數列C.兩數列算術平均數的代表性相同D.兩數列算術平均數的代表性無法比較10.變量x與y之間的負相關是指【】A.x數值增大時y也隨之增大B.x數值減少時y也隨之減少C.x數值增大時y隨之減少D.y的取值幾乎不受x取值的影響11.次數數列各組變量值都增加2倍,每組次數減少2倍,中位數【】A.減少2倍B.增加2倍C.減少1倍D.不變12.第一類錯誤是在下列條件下發(fā)生論【】A.原假設為真B.原假設為假C.顯著性水平較小D.顯著性水平較大13.設,,其中、為常數,且,則【】A.B.C.D.14.設隨機變量,則隨增大,【】A.單調增大B.單調減小C.保持不變D.增減不定15.設隨機變量相互獨立,,,則【】A.B.C.D.二、填空題(每空1分,共10分)1.社會調查資料有、統(tǒng)計規(guī)律性的特點。2.在分布之下,眾數>中位數。3.對某一班級50名學生的體育達標情況進行測評,發(fā)現有35名同學達到合格標準,則達標率的均值是。4.參數優(yōu)良估計的三個標準是、有效性、一致性。5.抽樣誤差是由于抽樣的隨機性而產生的誤差,這種誤差不可避免,但可以。6.抽樣推斷運用的方法對總體的數量特征進行估計。7.一個回歸方程只能作一種推算,即給出自變量的數值,估計_________的可能值。8.袋中有4個白球,7個黑球,從中任意取一個球.則取出白球的概率為。9.設X1,X2,…,X10是來自總體XN(0,s2)的樣本,則服從分布。10.三次獨立的試驗中,成功的概率相同,已知至少成功一次的概率為,則每次試驗成功的概率為。三、簡答題(每小題9分,共18分)1.試解釋隨機抽樣的隨機原則?2.試列出三個以上的離散趨勢測度方法。五、計算題(共45分)4.(13分)檢查五位同學《會計學》的學習時間與成績分數如下表所示。學習時數(小時)學習成績(分)44066075010701390根據資料:(1)由此計算出學習時數與學習成績之間的相關系數;(2)建立學習成績()依學習時間()的直線回歸方程。答案一、單項選擇題(每小題1分,共15分)1.D2.A3.C4. B5.C6.B7.C8.A9.B10.C 11.B12.A13.D14.C15.B二、填空題(每空1分,共10分)1.隨機性2.左偏或負偏3.70%4.無偏性5.控制6.概率估計7.因變量8.4/119.自由度為10的分布10.1/3三、簡答題(每小題9分,共18分)1.答:所謂隨機原則是指在抽選調查對象時,規(guī)定了一定的程序(3分),以保證每一個單位都有同等入選的機會(3分),從而避免了主觀因素的影響(3分)。2.答:異動比率;極差;四分互差;方差與標準差。(各答對一項給3分)五、計算題(共45分)3.解:假設(3分)由已知條件,,,,,(4分)(2分)接受,即現在生產之鐵水平均含碳量仍為4.55。(1分)4.解:設學習時間為自變量,學習成績?yōu)橐蜃兞?,所需合計數如下:?)計算相關系數=0.956(5分)(2)(2分)編制直線回歸方程:(3分)經計算求得:(3分)回歸方程為:無答案。。社會統(tǒng)計學復習題一、名詞解釋1、社會統(tǒng)計學2、中位數3、眾數4、點估計:所謂點估計,就是根據樣本數據算出一個單一的估計值,用它來估計總體的參數值。5、區(qū)間估計:所謂區(qū)間估計,就是計算抽樣平均誤差,指出估計的可信程度,進而在點估計的基礎上,確定總體參數的所在范圍或區(qū)間。6、置信區(qū)間:置信區(qū)間就是我們?yōu)榱嗽黾訁当还烙嫷降男判亩邳c估計兩邊設置的估計區(qū)間。7、消減誤差比例:變量間的相關程度,可以用不知Y與X有關系時預測Y的誤差,減去知道Y與X有關系時預測Y的誤差,再將其化為比例來度量。將削減誤差比例記為PRE。8、因果關系:變量之間的關系滿足三個條件,才能斷定是因果關系。1)連個變量有共變關系,即一個變量的變化會伴隨著另一個變量的變化;2)兩個變量之間的關系不是由其他因素形成的,即因變量的變化是由自變量的變化引起的;3)兩個變量的產生和變化有明確的時間順序,即一個在前,另一個在后,前者稱為自變量,后者稱為因變量。9、正相關與負相關:正相關是指一個變量的值增加時,另一變量的值也增加;負相關是指一個變量的值增加時,另一變量的值卻減少。10、散點圖:將相關表所示的各個有對應關系的數據在直角坐標系上畫出來,以直觀地觀察X與Y的相互關系,即得相關圖,又稱散點圖。11、同序對:在觀察X序列時,如果看到,在Y中看到的是,則稱這一配對是同序對。12、異序對:在觀察X序列時,如果看到,在Y中看到的是,則稱這一配對是異序對。13、大數定理:當我們的觀察次數n趨向無限時,隨機事件可能轉換為不可能事件或必然事件。即,在大量觀察的前提下,觀察結果具有穩(wěn)定性。二、選擇題6.下面能進行除法運算的測量尺度是()A定比尺度B定類尺度C定距尺度D定序尺度7.教育程度是()的測量。A定比尺度B定類尺度C定距尺度D定序尺度8.智商是()的測量。A定比尺度B定類尺度C定距尺度D定序尺度9.籍貫是()的測量A定比尺度B定類尺度C定距尺度D定序尺度10.在社會統(tǒng)計學中,()是反映集中趨勢最常用、最基本的平均指標。A中位數B算術平均數C眾數D幾何平均數11.關于學生t分布,下面哪種說法不正確(B)。A要求隨機樣本B適用于任何形式的總體分布C可用于小樣本D可用樣本標準差S代替總體標準差12.在統(tǒng)計檢驗中,那些不大可能的結果稱為(D)。如果這類結果真的發(fā)生了,我們將否定假設。A檢驗統(tǒng)計量B顯著性水平C零假設D否定域13.在用樣本指標推斷總體指標時,把握程度越高則(B)。A誤差范圍越小B誤差范圍越大C抽樣平均誤差越小D抽樣平均誤差越大14.當x按一定數額增加時,y也近似地按一定數額隨之增加,那么可以說x與y之間存在(A)關系。A直線正相關B直線負相關C曲線正相關D曲線負相關15.評價直線相關關系的密切程度,當r在0.5~0.8之間時,表示(C)。A無相關B低度相關C中等相關D高度相關17.關于相關系數,下面不正確的描述是(B)。A當01時,表示兩變量不完全相關;B當r=0時,表示兩變量間無相關;C兩變量之間的相關關系是單相關;D如果自變量增長引起因變量的相應增長,就形成正相關關系。18.欲以圖形顯示兩變量X和Y的關系,最好創(chuàng)建(D)。A直方圖B圓形圖C柱形圖D散點圖19.兩變量X和Y的相關系數為0.8,則其回歸直線的判定系數為(C)。A0.50B0.80C0.64D0.9020.在完成了構造與評價一個回歸模型后,我們可以(D)。A估計未來所需樣本的容量B計算相關系數和判定系數C以給定的因變量的值估計自變量的值D以給定的自變量的值估計因變量的值21.兩變量的線性相關系數為0,表明兩變量之間(D)。A完全相關B無關系C不完全相關D不存在線性相關23.在相關分析中,對兩個變量的要求是(A)。A都是隨機變量B都不是隨機變量C其中一個是隨機變量,一個是常數D都是常數24.在回歸分析中,兩個變量(D)。A都是隨機變量B都不是隨機變量C自變量是隨機變量D因變量是隨機變量25.一元線性回歸模型和多元線性回歸模型的區(qū)別在于只有一個(B)。A因變量B自變量C相關系數D判定系數26.以下指標恒為正的是(D)。A相關系數rB截距aC斜率bD復相關系數27.下列關系中,屬于正相關關系得是(A)。A身高與體重B產品與單位成本C正常商品的價格和需求量D商品的零售額和流通費率28、下列變量中屬于定序變量的是()A、門牌號B、學生學號C、職稱等級D、身高29、用具有頻數最多的變量值來表示變量的集中值被稱為()A、眾值B、中位值C、均值D、四分位差30、標準差數值越小,則反映變量值()A、越分散,平均數代表性越低 B、越集中,平均數代表性越高C、越分散,平均數代表性越高 D、越集中,平均數代表性越低31、下面不屬于正態(tài)分布圖特征的是()A、有一條對稱軸B、有一條漸近線C、有一個頂點D、有2個單位的面積。32、直方圖具備的特征是()A、高度代表頻次B、寬度代表頻次C、面積代表頻次D、各分段組可以分開33、采用回置法,從一副52張撲克牌里抽取兩次,抽中兩張紅桃的概率為()A、1/52B、1/16C、1/13D、1/434、下列屬于定類層次相關分析法的是()A、斯皮爾曼系數B、Lambda系數C、Gamma系數D、eta系數35、當樣本量n=25時,我們對其進行均值檢驗時,應該選用()方法進行。A、Z檢驗B、F檢驗C、T檢驗D、上述三者都可以36、如果,Xi>Xj,Yi<Yj,那么,就稱被調查者i和j這一配對為()。A、異序對B、同序對C、X的同分對D、Y的同分對37、一般認為:積差系數r值等于0.3為()。A、完全相關B、高度相關C、中等相關D、無相關38、下列變量中不屬于定類變量的是()。A、車牌號B、手機號C、學歷D、性別39、數列2、3、5、1、7、9、2的中位值是()。A、5B、3C、2D、140、兩個正態(tài)分布分別為:N(1,25)和N(5,36),將兩個正態(tài)分布作圖,下列說法錯誤的是()。A、前者圖形的頂端更細小B、前者圖形更靠左C、后者圖形的頂端更細小D、后者圖形更靠右41、直方圖里,頻次由()來表示。A、面積B、高度C、寬度D、組距42、從一副52張的撲克牌中抽一張牌,抽到一張紅桃或者方塊的概率是()。A、1/5B、1/4C、1/3D、1/243、下列屬于定類層次相關分析法的是()A、斯皮爾曼系數B、Lambda系數C、Gamma系數D、eta系數44、從某公司抽取200名員工作為樣本進行調查,進行推論分析時,除了()外,其他三個都是我們采用Z檢驗法的原因。A、樣本容量數符合小樣本要求B、總體符合正態(tài)分布C、滿足大數定理要求D、樣本容量達到大樣本要求。45、如果,Xi>Xj,Yi>Yj,那么,就稱被調查者i和j這一配對為()。A、異序對B、同序對C、X的同分對D、Y的同分對46、區(qū)間估計里,置信區(qū)間內的置信度大小為()。A、αB、βC、1-αD、1-β47、簡單線性回歸分析中,兩變量的層次分別為()A、定類—定類B、定類—定序C、定序—定距D、定距—定距三、填空題1.()和中心極限定理為抽樣推斷提供了主要理論依據。2.抽樣推斷中,判斷一個樣本估計量是否優(yōu)良的標準是(無偏性)、(一致性)、(有效性)。3.在一副撲克牌中單獨抽取一次,抽到一張紅桃或K的概率是(1/4);在一副撲克牌中單獨抽取一次,抽到一張紅桃K的概率是(1/52)。5.不論總體是否服從正態(tài)分布,只要樣本容量n足夠大,樣本平均數的抽樣分布就趨于(正態(tài))分布。6.統(tǒng)計檢驗時,被我們事先選定的可以犯第一類錯誤的概率,叫做檢驗的(顯著性水平),它決定了否定域的大小。7.假設檢驗中若其他條件不變,顯著性水平的取值越小,接受原假設的可能性越(大),原假設為真而被拒絕的概率越(?。?。8.參數估計,即由樣本的指標數值推斷總體的相應的指標數值,它包括點估計和(區(qū)間估計)。9.變量間的相關程度,可以用不知Y與X有關系時預測Y的全部誤差E1,減去知道Y與X有關系時預測Y的聯系誤差E2,再將其化為比例來度量,這就是(削減誤差比例)。10.依據數理統(tǒng)計原理,在樣本容量較大的情況下,可以作出以下兩個假定:(1)實際觀察值Y圍繞每個估計值是服從();11.根據資料,分析現象之間是否存在相關關系,其表現形式或類型如何,并對具有相關關系的現象之間數量變化的議案關系進行測定,即建立一個相關的數學表達式,稱為(回歸方程),并據以進行估計和預測。這種分析方法,通常又稱為(回歸分析)12、變量層次一般分為、、和。13、統(tǒng)計按其內容主要包括兩個方面:分析和分析。14、定類層次主要的集中趨勢法是,定序層次主要的離散趨勢法是。15、統(tǒng)計推論分為參數估計和,其中參數估計又分為和。16、置信區(qū)間與可信度之間是成關系,即估計的區(qū)間越大,則可信度也就越。17、根據樣本計算出來的一切統(tǒng)計數字特征值被稱為,總體值稱為。18、眾數運用層次變量的集中趨勢分析,中位數用于層次變量的集中趨勢分析,均值用于定距層次變量的分析,標準差用于定距層次變量的分析。19、正態(tài)分布圖的形狀和位置主要由和決定。20、測量兩個變量的相關系數時,首先考慮的是變量的,其次考慮變量間是否對稱,最后最好選用具備意義的相關系數。21、以樣本的統(tǒng)計值來估計總體的參數值,有兩大類做法,一類是,另一類是,二者均要求樣本是以方法抽取的。22、某一孕婦生男生女純屬偶然現象,但全市出生的嬰兒性別比例一直維持在50%左右,這種現象稱為定理。23、假設檢驗時,首先需要做出假設和被擇假設,并以假設為基礎進行數據推導,如果我們的統(tǒng)計檢驗值落在,我們就應該接受被擇假設。三、判斷題1.社會統(tǒng)計描述,即通過部分研究對象的統(tǒng)計資料對研究對象的總體的性質進行推論與歸納。()2.推論統(tǒng)計需要的統(tǒng)計資料相對而言較少,所以在人力、物力及時間等方面比較經濟,研究和應用的范圍也拓寬了許多。()3.無論分布曲線是正偏還是負偏,中位數都居算術平均數和眾數之間。()4.在同樣的顯著性水平的條件下,單側檢驗較之雙側檢驗,可以在犯第一類錯誤的危險不變的情況下,減少犯第二類錯誤的危險。(√)5.統(tǒng)計檢驗可以幫助我們否定一個假設,卻不能幫助我們肯定一個假設。(√)6.檢驗的顯著性水平(用表示)被定義為能允許犯第一類錯誤的概率,它決定了否定域的大小。(√)7.第一類錯誤是,零假設H0實際上是錯的,卻沒有被否定。第二類錯誤則是,零假設H0實際上是正確的,卻被否定了。(×)8.每當方向能被預測的時候,在同樣顯著性水平的條件下,雙側檢驗比單側檢驗更合適。(×)9.進行區(qū)間估計,置信水平總是預先給定的。(√)10.由于削減誤差比例的概念不涉及變量的測量層次,因此它的優(yōu)點很明顯,用它來定義相關程度可適用于變量的各測量層次。(√)11.不管相關關系表現形式如何,當=1時,變量X和變量Y都是完全相關。(√)12.不管相關關系表現形式如何,當=0時,變量X和變量Y都是完全不相關。(×)13.通過列聯表研究定類變量之間的關聯性,這實際上是通過相對頻數條件分布的比較進行的。而如果兩變量間是相關的話,必然存在著Y的相對頻數條件分布相同,且和它的相對頻數邊際分布相同。(×)14.如果眾數頻數集中在條件頻數分布列聯表的同一行中,系數便會等于0,從而無法顯示兩變量之間的相關性。(√)15.從分析層次上講,相關分析更深刻一些。因為相關分析具有推理的性質,而回歸分析從本質上講只是對客觀事物的一種描述,知其然而不知其所以然。(×)16、離散趨勢是測量數據間的差異程度。()17、兩個定類變量間的相關系數范圍在[-1,1]間。()18、相關系數r等于-1,說明變量之間不存在相關關系。()19、標準正態(tài)分布的曲線對稱軸為X=0。()20、當樣本量n>30時,無論n如何增大,樣本的統(tǒng)計值傾向穩(wěn)定。()21、參數估計就是在一定的抽樣誤差內設一個可置信的區(qū)間,然后聯系到這個區(qū)間的精度,將樣本的統(tǒng)計值推斷為總體的參數值。()22、假設檢驗與參數估計最終關心的都是總體的參數狀況。()23、利用樣本對總體進行區(qū)間估計時,置信度越高,則區(qū)間就越窄。()24、假設檢驗過程中,如果統(tǒng)計檢驗值大于臨界值,則拒絕零假設。()25、在積矩相關分析結果r=0,則說明兩變量不呈直線相關。()26、根據研究需要,可以將定距變量降格為定類變量進行分析。()27、某公司員工的月收入標準差為100元,說明該公司員工收入差距大。()28、直方圖用于定類層次的變量作圖。()29、推論統(tǒng)計關注的是樣本的統(tǒng)計值而不是總體的參數值。()30、對大樣本的假設檢驗選用Z檢驗法,主要是因為它滿足正態(tài)分布。()31、兩端假設檢驗中,否定域的大小為α。()32、樣本容量多少與研究容許的誤差大小呈正比。()33、從同一總體中抽出的多個大樣本的均值組成的數列滿足正態(tài)分布。()34、如果兩個變量是呈相關關系,那么它們一定呈因果關系。()35、在積矩相關分析結果r=0,則說明兩變量不相關。()四、計算題1.某工廠50名職工每周工資數分配情況如下表,試求:(1)算術平均;(2)中位數;(3)眾數。工資數(元)人數60-62363-651066-682069-711372-744合計502、某車間職工工資分布情況如下表,求該車間職工的平均工資,職工工資的中位數以及標準差。按月工資分組100-120120-140140-160160-180180-200工人人數1518302163、某單位統(tǒng)計報表顯示,人均月收入為3030元,為了驗證該統(tǒng)計報表的正確性,作了共100人的抽樣調查,樣本人均月收入為3060元,標準差為80元,問能否說明該統(tǒng)計報表顯示的人均收入的數字有誤(取顯著性水平α=0.05)。4、某地區(qū)成人中吸煙者占75%,經過戒煙宣傳之后,進行了抽樣調查,發(fā)現了100名被調查的成人中,有63人是吸煙者,問戒煙宣傳是否收到了成效?(α=0.05)5、從某校隨機地抽取81名女學生,測得平均身高為163厘米,標準差為6.0厘米,試求該校女生平均身高95%的置信區(qū)間。6、對某市市民按老中青進行喜歡民族音樂情況的調查,樣本容量為200人,調查結果示于下表,試把該頻數列聯表:①轉化為相對頻數的聯合分布列聯表②轉化為相對頻數的條件分布列聯表;③指出對于民族音樂的態(tài)度與被調查者的年歲有無關系,并說明理由。對于民族音樂的態(tài)度(Y)年歲(X)Σ老中青喜歡不喜歡383830153346Σ7、以下是婚姻美滿與文化程度的抽樣調查的結果,請計算婚姻美滿與文化程度之Gamma系數。文化程度婚姻美滿大學中學小學美滿9165一般83018不美滿3478、兩變量X、Y之間的關系如下表,X24681012Y14109754(1)求回歸方程;(2)求相關系數?!綴=-0.957X+14.867】【r=0.98】9、試就下表所示資料,計算關于身高和體重的皮爾遜相關系數。N0身高(厘米)體重(千克)123456789101601611651651671701721741761805156596663706973806510、某工廠50名職工每天工資數分配情況如下表,試求:(1)眾數所在的組;(2)中位數;(3)平均數。工資數(元)人數70-79380-89990-9920100-10914110-1194合計5011、下表是對40位員工工作滿意度和企業(yè)歸屬感的調查數據,請求出其Gamma系數,并解釋其意義。歸屬感(Y)工作滿意度(X)Fy低(1)中(2)高(3)低(1)84315中(2)65112高(3)44513Fx181394012、在一個正態(tài)總體中抽取一個容量為25的樣本,其均值等于52,標準差S=12,求置信水平為95%的總體均值的置信區(qū)間。13、一位研究者試圖檢驗某一社會調查所運用的抽樣程序,該項調查是由一些缺乏經驗的訪問員進行的。研究者懷疑屬于干部和知識分子的家庭抽得過多。過去的統(tǒng)計資料表明,該街區(qū)的家庭收入是7500元,標準差是1500元;此次調查共抽取100個家庭,樣本平均收入是7900元。問:該研究人員是否有理由懷疑該樣本有偏估?(選用α=0.05)14、設x為一般正態(tài)分布的變量,請計算:(1),如果=5,S=2;(2),如果=500,S=300;(3),如果=10,S=0.2;(4),如果=10.73,S=0.25。15、為了研究受教育年限和職業(yè)聲望之間的關系,設以下是8名抽樣調查的結果,試求職業(yè)聲望與受教育年限的回歸方程。調查對象X(受教育年限)Y(職業(yè)聲望)XYX211270216803950419865219061065754481275總數(∑)16、為了驗證統(tǒng)計報表的正確性,作了共50人的抽樣調查,人均收入結果有:`X=871元,S=21元,問能否證明統(tǒng)計報表中人均收入m=880元是正確的(顯著性水平a=0.05)。17、已知初婚年齡服從正態(tài)分布,根據9個人的抽樣調查有:x=23.5(歲),s=3(歲)問:是否可以認為該地區(qū)平均初婚年齡已超過20歲(=0.05)。無答案廣西政法管理干部學院學院2012——2013學年第一學期期末考試卷課程:社會統(tǒng)計學班級姓名班級姓名學號就評卷人(簽名)復核人(簽名)題號一二三四合計得分密封線內不要答題密封線內不要答題一、填空題(本大題共10小題,每空1分,共10分)請在每小題的空格中填上正確答案。錯填、不填均無分。1.社會調查資料有、統(tǒng)計規(guī)律性的特點。2.在分布之下,眾數>中位數。3.對某一班級50名學生的體育達標情況進行測評,發(fā)現有35名同學達到合格標準,則達標率的均值是。4.參數優(yōu)良估計的三個標準是、有效性、一致性。5.抽樣誤差是由于抽樣的隨機性而產生的誤差,這種誤差不可避免,但可以。6.抽樣推斷運用的方法對總體的數量特征進行估計。7.一個回歸方程只能作一種推算,即給出自變量的數值,估計________的可能值。8.袋中有4個白球,7個黑球,從中任意取一個球.則取出白球的概率為。9.設X1,X2,…,X10是來自總體XN(0,s2)的樣本,則服從分布。10.三次獨立的試驗中,成功的概率相同,已知至少成功一次的概率為,則每次試驗成功的概率為。二、單項選擇題(本大題共10小題,每小題2分,共20分)1.在下列兩兩組合的平均指標中,哪一組的兩個平均數完全不受極端數值的影響?()A.算術平均數和調和平均數B.幾何平均數和眾數C.調和平均數和眾數D.眾數和中位數2.抽樣推斷的目的是()A.以樣本指標推斷總體指標B.取得樣本指標C.以總體指標估計樣本指標D.以樣本的某一指標推斷另一指標3.下列哪兩個變量之間的相關程度高()A.商品銷售額和商品銷售量的相關系數是0.9;B.商品銷售額與商業(yè)利潤率的相關系數是0.84;C.平均流通費用率與商業(yè)利潤率的相關系數是-0.94;D.商品銷售價格與銷售量的相關系數是-0.91。4. 在抽樣推斷中,可以計算和控制的誤差是()A.抽樣實際誤差B.抽樣標準誤差C.非隨機誤差D.系統(tǒng)性誤差5.不重復抽樣的抽樣標準誤公式比重復抽樣多了一個系數()A.B.C.D.6.估計標準誤說明回歸直線的代表性,因此()A.估計標準誤數值越大,說明回歸直線的代表性越大;B.估計標準誤數值越大,說明回歸直線的代表性越?。籆.估計標準誤數值越小,說明回歸直線的代表性越??;D.估計標準誤數值越小,說明回歸直線的實用價值越小。7.平均差與標準差的主要區(qū)別是()A.意義有本質的不同B.適用條件不同C.對離差的數學處理方法不同D.反映的變異程度不同8.“統(tǒng)計”一詞的含義可以包括的是()A.統(tǒng)計工作、統(tǒng)計資料、統(tǒng)計學B.統(tǒng)計工作、統(tǒng)計資料、統(tǒng)計方法C.統(tǒng)計資料、統(tǒng)計學、統(tǒng)計方法D.統(tǒng)計工作、統(tǒng)計學、統(tǒng)計方法9.已知甲數列的算術平均數為100,標準差為20;乙數列的算術平均數為50,標準差為9。由此可以認為()A.甲數列算術平均數的代表性好于乙數列B.乙數列算術平均數的代表性好于甲數列C.兩數列算術平均數的代表性相同D.兩數列算術平均數的代表性無法比較10.變量x與y之間的負相關是指()A.x數值增大時y也隨之增大B.x數值減少時y也隨之減少C.x數值增大時y隨之減少D.y的取值幾乎不受x取值的影響三、多項選擇題(本大題共5小題,每小題2分,共10分)在每小題列出的五個備選項中有兩或多個是符合題目要求的,請將其代碼填寫在題后的括號內。1.下列變量中屬于定類層次的是()A、教育程度B、專業(yè)C、班級D、考試分數E、學號2.關于頻率和概率,下列說法正確的是()A、頻率的大小在0與1之間B、概率的大小在0與1之間C、就某一隨機事件來講,其發(fā)生的頻率是唯一的D、就某一隨機事件來講,其發(fā)生的概率是唯一的E、頻率分布有對應的頻數分布,概率分布則沒有3.反映某一線性回歸方程y=a+bx好壞的指標有()A、相關系數B、判定系數C、b的大小D、a的大小4.一元線性回歸分析中的回歸系數b可以表示()A、兩個變量之間相關關系的密切程度B、兩個變量之間相關關系的方向C、當自變量增減一個單位時,因變量平均增減的量D、當因變量增減一個單位時,自變量平均增減的量E、回歸模型的擬合優(yōu)度5.統(tǒng)計推論一般可分為兩大類,包括()A、集中趨勢分析B、離散趨勢分析C、參數估計D、假設檢驗答案填空題1、隨機性2、左偏或負偏3、70%4、無偏性5、控制6、概率估計7、因變量8、4/119、自由度為10的10、1/3二、單項選擇題1、D2、A3、C4、B5、C6、B7、C8、A9、B10、C三、多項選擇題1、BCE2、ABDE3、AB4、BC5、CD1.為了解IT行業(yè)從業(yè)者收入水平,某研究機構從全市IT行業(yè)從業(yè)者隨機抽取800人作為樣本進行調查,其中44%回答他們的月收入在6000元以上,30%回答他們每月用于娛樂消費在1000元以上。此處800人是(A.樣本2.在頻數分布表中,將各個有序類別或組的百分比逐級累加起來稱為(C.累積頻率3.離散系數的主要目的是(D.比較多組數據的離散程度4.經驗法則表明,當一組數據正態(tài)分布時,在平均數加減1個標準差的范圍之內大約有B.68%的數據5.在某市隨機抽取10家企業(yè),7月份利潤額(單位:萬元)分別為72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么這10家企業(yè)7月份利潤額均值為(A.39.196.用樣本統(tǒng)計量的值直接作為總體參數的估計值,這種方法稱為(A.點估計7.某單位對該廠第一加工車間殘品率的估計高達10%,而該車間主任認為該比例()偏高。如果要檢驗該說法是否正確,則假設形式應該為(A.:≥0.1;QUOTE:<0.18.下面哪一項不是方差分析中的假定(D.各總體的方差等于09.判斷下列哪一個不可能是相關系數(D.1.210.用于說明回歸方程中擬合優(yōu)度的統(tǒng)計量主要是(D.判定系數11.某地區(qū)政府想了解全市332.1萬戶家庭年均收入水平,從中抽取3000戶家庭進行調查,以推斷所有家庭的年均收入水平。這項研究的總體是(AA.332.1萬戶家庭12.下列變量屬于數值型變量的是(A.工資收入13.如果用一個圖形描述比較兩個或多個樣本或總體的結構性問題時,適合選用哪種圖形(A.環(huán)形圖14.在頻數分布表中,頻率是指(C.各組頻數與總頻數之比15.兩個定類變量之間的相關分析可以使用(A.系數 16.根據一個樣本均值求出的90%的置信區(qū)間表明(C.總體均值有90%的概率會落入該區(qū)間內17.已知某單位職工平均每月工資為3000元,標準差為500元。如果職工的月收入是正態(tài)分布,可以判斷月收入在2500元—3500元之間的職工人數大約占總體的(B.68%18.方差分析的目的是(D.研究各分類自變量對數值型因變量的影響是否顯著19.對于線性回歸,在因變量的總離差平方和中,如果回歸平方和所占比例越大,那么兩個變量之間(A.相關程度越大20.正態(tài)分布中,值越小,則(A.離散趨勢越小21.從含有N個元素的總體中,抽取n個元素作為樣本,同時保證總體中每個元素都有相同的機會入選樣本,這樣的抽樣方式稱為(.簡單隨機抽樣22.某地區(qū)2001-2010年人口總量(單位:萬人)分別為98,102,103,106,108,109,110,111,114,115,下列哪種圖形最適合描述這些數據(D.線圖23.如果一組數據中某一個數值的標準分值為-1.5,這表明該數值(D.比平均數低1.5個標準差24.某班級10名同學期末統(tǒng)計課考試分數分別為76、93、95、80、92、83、88、90、92、72,該班考試成績的中位數是8925.某班級學生期末英語考試平均成績?yōu)?5分,標準差為10分。如果已知這個班學生的考試分數服從正態(tài)分布,可以判斷成績在65-85之間的學生大約占全班學生的(A)A.68%26.已知某單位平均月收入為3500元,離散系數為0.2,那么他們月收入的標準差為(A.70027.在假設檢驗中,不拒絕虛無假設意味著(D.沒有證據證明虛無假設是錯誤的28.在因變量的總離差平方和中,如果回歸平方和所占的比例越大,則兩變量之間(A.相關程度越高29.從兩個總體中各選取了6個觀察值,得到組間平方和為234,組內平方和為484,則組間方差和組內方差為C.234,48.430.在回歸方程中,若回歸系數等于0,這表明(B)B.自變量x對因變量y的影響是不顯著的31.某班級有60名男生,40名女生,為了了解學生購書支出,從男生中抽取12名學生,從女生中抽取8名學生進行調查。這種調查方法屬于(C.分層抽樣32.某企業(yè)職工的月收入水平分為以下五組:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,則3000元及以上這一組的組中值近似為(D)D.3250元33.對于右偏分布,平均數、中位數和眾數之間的關系是(A.平均數>中位數>眾數34.兩組數據的平均數不相等,但是標準差相等。那么(C.平均數大的,離散程度小35.在假設檢驗中,如果所計算出的P值越小,那么檢驗的結果(A)A.越顯著36.如果物價與銷售量之間的線性相關系數為-0.87,而且二者之間具有統(tǒng)計顯著性,那么二者之間存在著A.高度相關37.回歸平方和(SSR)反映了y的總變差中(A.由于x與y之間的線性關系引起的y的變化部分38.根據一個具體的樣本求出的總體均值90%的置信區(qū)間(A.以90%的概率包含總體均值39.在假設檢驗中,虛無假設和備擇假設(C.有且只有一個成立40.在方差分析中,某一水平下樣本數據之間的誤差稱為(A.組內誤差41.學校后勤集團想了解學校22000學生的每月生活費用,從中抽取2200名學生進行調查,以推斷所有學生的每月生活費用水平。這項研究的總體是(A.22000名學生42.從變量分類看,下列變量屬于定序變量的是(C.產品等級43.在頻數分布表中,比率是指(D.不同小組的頻數之比44.某地區(qū)2001-2010年人口總量(單位:萬人)分別為98,102,103,106,108,109,110,111,114,115,下列哪種圖形最適合描述這些數據(D.線圖45.根據一個樣本均值求出的90%的置信區(qū)間表明(C.總體均值有90%的概率會落入該區(qū)間內46.判斷下列哪一個不可能是相關系數(C.1.3247.期中考試中,某班級學生統(tǒng)計學平均成績?yōu)?0分,標準差為4分。如果學生的成績是正太分布,可以判斷成績在72分-88分之間的學生大約占總體的(A.95%48.正態(tài)分布中,值越小,則(A.離散趨勢越小 49.下面哪一項不是方差分析中的假定(D.各總體的方差等于050.對消費的回歸分析中,學歷、年齡、戶口、性別、收入都是因變量,其中收入的回歸系數為0.8,這表明(A)A.收入每增加1元,消費增加0.8元51.先將總體按某標志分為不同的類別或層次,然后在各個類別中采用簡單隨機抽樣或系統(tǒng)抽樣的方式抽取子樣本,最后將所有子樣本合起來作為總樣本,這樣的抽樣方式稱為(D.分層抽樣52.在頻數分布表中,某一小組中數據個數占總數據個數的比例稱為(A.頻率53.某專業(yè)共8名同學,他們的統(tǒng)計課成績分別為86、77、97、94、82、90、83、92,那么該班考試成績的中位數是(D.8854.經驗法則表明,當一組數據正太分布時,在平均數加減2個標準差的范圍之內大約有(C.95%的數據55.殘差平方和(SSE)反映了y的總變差中(B.除了x對y的現有影響之外的其他因素對y變差的影響56.某項研究中欲分析受教育年限每增長一年,收入如何變化,下列哪種方法最合適(A.回歸分析 57.用樣本統(tǒng)計量的值構造一個置信區(qū)間,作為總體參數的估計,這種方法稱為(B.區(qū)間估計58.在假設檢驗中,虛無假設和備擇假設(C.有且只有一個成立59.方差分析的目的是(D.研究各分類自變量對數值型因變量的影響是否顯著60.用于說明回歸方程中擬合優(yōu)度的統(tǒng)計量主要是(D.判定系數61.為了解某地區(qū)的消費,從該地區(qū)隨機抽取5000戶進行調查,其中30%回答他們的月消費在5000元以上,40%回答他們每月用于通訊、網絡的費用在300元以上。此處5000戶是(C.樣本62.當我們用圖形描述甲乙兩地區(qū)的人口年齡結構時,適合選用哪種圖形(A.環(huán)形圖63.如果一組數據中某一個數值的標準分值為1.8,這表明該數值(D.比平均數高出1.8個標準差64.離散系數的主要目的是(D.比較多組數據的離散程度65.某班級學生期末統(tǒng)計學考試平均成績?yōu)?2分,標準差為5分。如果已知這個班學生的考試分數服從正態(tài)分布,可以判斷成績在77-87之間的學生大約占全班學生的(A.68%66.已知某單位平均月收入標準差為700元,離散系數為0.2,那么他們月收入的均值為(C.350067.根據一個具體的樣本求出的總體均值95%的置信區(qū)間(A.以95%的概率包含總體均值68.在因變量的總離差平方和中,如果回歸平方和所占的比例越小,則自變量和因變量之間(B.相關程度越低69.從兩個總體中共選取了8個觀察值,得到組間平方和為432,組內平方和為426組間均方和組內均方分別A.432,7170.對于線性回歸,在因變量的總離差平方和中,如果殘差平方和所占比例越大,那么兩個變量之間(B.相關程度越小71.某班級有100名學生,為了了解學生消費水平,將所有學生按照學習成績排序后,在前十名學生中隨機抽出成績?yōu)榈?名的學生,后面依次選出第13、23、33、43、53、63、73、83、93九名同學進行調查。這種調查方法屬于D.系統(tǒng)抽樣72.某班級學生平均每天上網時間可以分為以下六組:1)1小時及以下;2)1-2小時;3)2-3小時;4)3-4小時;5)4-5小時;6)5小時及以上,則5小時及以上這一組的組中值近似為(C.5.5小時73.對于左偏分布,平均數、中位數和眾數之間的關系是(C.眾數>中位數>平均數74.一班學生的平均體重均為55千克,二班學生的平均體重為52千克,兩個班級學生體重的標準差均為5千克。那么(B)B.二班學生體重的離散程度大75.在假設檢驗中,如果所計算出的P值越大,那么檢驗的結果(A)A.越不顯著76.如果收入與支出之間的線性相關系數為0.92,而且二者之間具有統(tǒng)計顯著性,那么二者之間存在著(A.高度相關77.為了解某行業(yè)12月份利潤狀況,隨機抽取5家企業(yè),12月份利潤額(單位:萬元)分別為65、23、54、45、39,那么這5家企業(yè)12月份利潤額均值為(B.45.278.在假設檢驗中,不拒絕虛無假設意味著(D.沒有證據證明虛無假設是錯誤的79.某單位對該廠第一加工車間殘品率估計高達13%,而該車間主任認為該比例()偏高。如果要檢驗該說法是否正確,則假設形式應該為(A.:≥0.13;QUOTE:<0.1380.下列哪種情況不適合用方差分析(C.年齡對收入的影響四、計算題(每題15分,共30分)1.某校社會學專業(yè)同學統(tǒng)計課成績如下表所示。社會學專業(yè)同學統(tǒng)計課成績表學號成績學號成績學號成績101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)對考試成績按由低到高進行排序,求出眾數、中位數和平均數。(2)對考試成績進行適當分組,編制頻數分布表,并計算累計頻數和累計頻率。答案:(1)考試成績由低到高排序:62,66,68,70,70,75,76,76,76,76,76,77,78,79,80,80,80,81,82,82,83,83,85,86,86,87,87,88,88,90,90,90,91,91,92,93,93,94,95,95,96,97,眾數:76中位數:83平均數:=(62+66+……+96+97)÷42=3490÷42=83.095(2)按成績分組頻數頻率(%)向上累積向下累積頻數頻率(%)頻數頻率(%)60-6937.14337.14342100.00070-791126.1901433.3333992.85780-891535.7142969.0482866.66790-991330.95242100.0001330.9522.為研究某種商品的價格(x)對其銷售量(y)的影響,收集了12個地區(qū)的有關數據。通過分析得到以下結果:方差分析表變差來源SSdfMSFSig.回歸ABCD0.000殘差205158.07EF——總計1642866.6711———要求:(1)計算上面方差分析表中A、B、C、D、E、F處的值。(2)商品銷售量的變差中有多少是由價格的差異引起的?(3)銷售量與價格之間的相關系數是多少?答案:方差分析表:A=1642866.67-205158.07=1437708.60(SS總計-SS殘差)B=1,E=11-1=10(總計-B)C=A/B=1437708.60/1=1437708.60F=205158.07/10=20515.807D=C/F=1437708.60/20515.807=70.078變差來源SSdfMSFSig.回歸1437708.6011437708.6070.0780.000殘差205158.071020515.807——總計1642866.6711———(2)即商品銷售量的變差中有87.51%是由價格引起的。(3) 銷售量與價格之間的相關系數是0.93553.某公司招聘職員時,要求對職員進行兩項基本能力測試。已知,A項測試中平均分數為90分,標準差是12分;B考試中平均分數為200分,標準差為25分。一位應試者在A項測試中得了102分,在B項測試中得了215分。若兩項測試的成績均服從正太分布,該位應試者哪一項測試更理想?答案:該測試者在A項測試中比平均分高出1個標準差,而在B項測試中比平均分高出0.6個標準差。因而,可以說該測試者A項測試比較理想。4.某公司欲了解廣告費用x對銷售量y的影響,收集了20個地區(qū)的數據,并對x、y進行線性回歸分析,得到:方程的截距為364,回歸系數為1.42,回歸平方和SSR=1602708.6,殘差平方和SSE=40158.07。要求:(1)寫出廣告費用y與銷售量程x之間的線性回歸方程。(2)假如廣告費用投入50000元,根據回歸方程估計商品銷售量。(3)計算判定系數,并解釋它的意義。答案:(1)y=364+1.42x(2)當x=50000時,y=364+1.42×50000=71364(3)=1602708.6÷(1602708.6+40158.07)=1602708.6÷1642866.67=0.97556表明在商品銷售量的總變差中,有97.6%可以由回歸方程解釋,說明回歸方程的擬合程度很高。5.為估計每個網絡用戶每天上網的平均時間是多少,抽取了225個網絡用戶的簡單隨機樣本,得到樣本均值為6.5個小時,樣本標準差為2.5個小時。(1)試用95%的置信水平,計算網絡用戶每天平均上網時間的置信區(qū)間。(2)在所調查的225個網絡用戶中,年齡在20歲以下的用戶為90個。以95%的置信水平,計算年齡在20歲以下的網絡用戶比例的置信區(qū)間。注:答案:(1)已知:網絡用戶每天平均上網時間的95%的置信區(qū)間為:即(6.17,6.83)(2)樣本比例:年齡在20歲以下的網絡用戶比例的95%的置信區(qū)間為:即(33.6%,46.4%)6.某企業(yè)使用3種方法組裝一種新的產品,為確定哪種方法生產效率最高,隨機抽取30名工人,并指定每人使用其中的一種方法。通過對每個工人生產的產品數進行分析得到下面的方差分析表。請完成方差分析表。變差來源SSdfMSFSig.組間2100.000組內3836——總計29———答案:變差來源SSdfMSFSig.組間210*2=4203-1=2210210/142.07=

1.4780.000組內383630-3=273836/27=

142.07——總計420+3836=

425629———7.甲單位人均月收入4500元,標準差1200元。乙單位月收入分布如下所示。乙單位月收入分布表按收入分組(元)人數(個)3000分以下1203000~40004204000~50005405000~60004206000以上300合計1800要求:(1)計算乙單位員工月收入的均值和標準差。(2)比較甲單位和乙單位哪個單位員工月收入的離散程度更大?(提示:使用離散系數)答案:(1)乙單位員工月收入均值:=(2500×120+3500×420+4500×540+5500×420+6500×300)/1800=4700方差:=1360000標準差為: (2)根據離散系數公式:,得到:甲單位員工月收入的離散系數: 乙單位員工月收入的離散系數:,所以甲單位員工月收入的離散程度更大8.某汽車生產商欲了解廣告費用(萬元)對銷售量(輛)的影響。收集了過去12年的有關數據,通過分析得到:方程的截距為363,回歸系數為1.42,回歸平方和SSR=1600,殘差平方和SSE=450。要求:(1)寫出銷售量y與廣告費用x之間的線性回歸方程。(2)假如明年計劃投入廣告費用為25萬元,根據回歸方程估計明年汽車銷售量。(3)計算判定系數,并解釋它的意義。答案:線性回歸方程:y=363+1.42x當x=25時,y=363+1.42×25=398.5 =1600÷(1600+450) =0.78表明在商品銷售量的總變差中,有78%可以由回歸方程解釋,說明回歸方程的擬合程度較好。9.某行業(yè)管理局所屬40個企業(yè)2011年產品銷售額數據如下所示。40個企業(yè)2011年產品銷售額企業(yè)編號銷售額企業(yè)編號銷售額企業(yè)編號銷售額企業(yè)編號銷售額115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求:(1)對2011年銷售額按由低到高進行排序,求出眾數、中位數和平均數。(2)如果按照規(guī)定,銷售額在125萬元以上的為先進企業(yè),115萬-125萬之間的為良好企業(yè),105萬-115萬之間的為一般企業(yè),105萬以下的為落后企業(yè),請按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組,編制頻數分布表,并計算累積頻數和累積頻率。答案:銷售額由低到高排序:87,88,91,95,97,100,103,103,104,105,105,107,108,108,110,112,113,115,115,115116,117,117,118,119,119,120,123,124,125,126,127,129,135,136,137,138,142,146,152眾數位:115中位數:(115+116)/2=115.5平均數:=(87+88+91+95+……+146+152)/40=4647/40=116.175頻數分布表如下:按銷售額分組頻數頻率(%)向上累積向下累積頻數頻率(%)頻數頻率(%)105萬元以下922.5%922.5%40100%105-115萬元820%1742.5%3177.5%115-125萬元1230%2972.5%2357.5%125萬元以上1127.5%40100%1127.5%10.某單位為研究其商品的廣告費用(x)對其銷售量(y)的影響,收集了過去12年的有關數據。通過分析得到以下結果:方差分析表變差來源SSdfMSFSig.回歸1602708.6BDF0.000殘差40158.08CE——總計A11———要求:(1)計算上面方差分析表中A、B、C、D、E、F處的值。(2)商品銷售量的變差中有多少是由廣告費用的差異引起的?(3)銷售量與廣告費用之間的相關系數是多少?答案:A=1602708.6+40158.08=1642866.68(SS回歸+SS殘差)B=1,C=11-1=10(總計-B)D=1602708.6/B=1602708.6E=40158.08/C=4015.808F=D/E=1602708.6/4015.808=399.10變差來源SSdfMSFSig.回歸1602708.611602708.6399.100.000殘差40158.08104015.808——總計1642866.6811———(2)商品銷售量的變差中有97.56%是由廣告費用的差異引起的(3) 銷售量與廣告費用之間的相關系數是0.987711.一項關于大學生體重狀況的研究發(fā)現,男生的平均體重為60千克,標準差為5千克;女生的平均體重為50千克,標準差為5千克。請問:(1)是男生體重差異大還是女生體重差異大?為什么?(2)男生中有多少比重的人體重在55千克-65千克之間?(3)女生中有多少比重的人體重在40千克-60千克之間?答案:(1)根據離散系數公式:,得到:男生體重離散系數為:女生體重離散系數為:所以:,即女生體重差異大注:(2)和(3)解答參考P110–“68-95-99.7規(guī)則”(2)男生中有68.26%比重的人體重在55千克-65千克之間?(3)女生中有95.44%比重的人體重在40千克-60千克之間?12.某公司欲了解廣告費用x對銷售量y的影響,收集了16個地區(qū)的數據,并對x、y進行線性回歸分析,得到:方程的截距為280,回歸系數為1.6,回歸平方和SSR=1503000,殘差平方和SSE=38000。要求:(1)寫出廣告費用y與銷售量x之間的線性回歸方程。(2)假如廣告費用投入80000元,根據回歸方程估計商品的銷售量。(3)計算判定系數,并解釋它的意義。答案:線性回歸方程:y=280+1.6x當x=80000時,y=280+1.6×80000=128280判定系數為: =1503000/(1503000+38000) =0.9753判定系數意義:表明在商品銷售量的總變差中,有97.53%可以由回歸方程解釋,說明回歸方程的擬合程度非常好13.為估計某地區(qū)每個家庭日均生活用水量為多少,抽取了450個家庭的簡單隨機樣本,得到樣本均值為200升,樣本標準差為50升。(1)試用95%的置信水平,計算該地區(qū)家庭日均用水量的置信區(qū)間。(2)在所調查的450個家庭中,女性為戶主的為180個。以95%的置信水平,計算女性為戶主的家庭比例的置信區(qū)間。注:答案:(1)已知:該地區(qū)家庭日均用水量的95%的置信區(qū)間為:即置信區(qū)間為:(195.38,204.62)(2)樣本比例:女性為戶主的家庭比例的95%的置信區(qū)間為: 即比例的置信區(qū)間為:(0.355,0.445)14.某農科院使用4種方法培育稻米,為確定哪種方法生產效率最高,隨機劃出40塊試驗田,并指定每塊試驗田使用其中的一種方法。通過對每塊試驗田的產量進行分析得到下面的方差分析表。請完成方差分析表。變差來源SSdfMSFSig.組間3200.000組內6048——總計39———答案:變差來源SSdfMSFSig.組間320*3=9604-1=3320320/168=1.900.000組內604840-4=366048/36=168——總計960+6048=700839———15.某校社會學專業(yè)共有兩個班級。期末考試時,一班同學社會學理論平均成績?yōu)?6分,標準差為12分。二班同學成績如下所示。二班同學社會學理論成績分組數據表按成績分組(分)人數(個)60分以下260~70770~80980~90790~1005合計30要求:(1)計算二班同學考試成績的均值和標準差。(2)比較一班和二班哪個班成績的離散程度更大?(提示:使用離散系數)答案:(1)均值:=(55×2+65×7+75×9+85×7+95×5)÷30=2310÷30=77方差:÷30=4080÷30=136標準差:(2)根據離散系數公式:,得到:一班考試成績的離散系數為:=12÷86=0.1395

二班考試成績的離散系數為:=11.66÷77=0.1515

,所以說二班成績的離散程度大于一班。16.某調查公司研究出租司機每天收入(元)與行駛里程(公里)之間的關系。對30位出租車司機進行調查,并根據每天的收入y、行駛里程x進行回歸,得到:方程的截距為162,回歸系數為0.6,回歸平方和SSR=2600,殘差平方和SSE=513。要求:(1)寫出每天的收入y與行駛里程x之間的線性回歸方程。(2)假如某司機某天行駛了300公里,根據回歸方程估計他該天的收入。(3)計算判定系數,并解釋它的意義。答案:(1)回歸方程為:y=162+0.6x(2)當x=300時,y=162+0.6×300=342(元)(3)判定系數=2600÷(2600+513)=0.8352意義:表明在每天收入的總變差中,有83.52%可以由回歸方程解釋,說明回歸方程的擬合程度非常好?!渡鐣y(tǒng)計學》課程期末復習題一、填空題1、總體單位除了必須具備同質性外,還必須具備1、差異性(或變異性)性,否則就沒有必要對總體進行統(tǒng)計分析研究了,即該性質是對總體進行統(tǒng)計研究的前提條件。2、抽樣調查所遵循的基本原則是2、隨機原則,必須保證總體中的每一個單位都有同等的機會被抽中。3、四分位差數值越小,說明3、中位數;代表性高;異眾比率越小,說明眾數的代表性越高。4、在兩個變量x與y中,如果y是由x獨一無二地確定,這種關系稱為4、函數關系;;如果y不是由x獨一無二地確定,這種關系稱為相關關系。5、在統(tǒng)計誤差中,由于抽樣的偶然因素而產生的5、隨機(或抽樣)誤差是不可避免的,但可以通過科學計算加以控制。6、統(tǒng)計分組按所選擇分組標志的多少不同可以分為6、簡單分組;和復合分組。7、某農貿市場,芹菜的價格分別為:早市每斤1.60元,中市每斤1.00元,晚市每斤0.80元。若甲顧客在早、中、晚三市各買1元芹菜,則應采用7、簡單調和;平均數計算該顧客所購買芹菜的平均價格;而乙顧客在早、中、晚三市各買了12元、10元和5元的芹菜,則應采用加權調和平均數計算該顧客所購買芹菜的平均價格。8、在變量數列編制過程中,組距可以通過8、全距除以組數;來確定。因此,組距的大小和組數的多少成反比關系。9、判定系數值越小,則估計標準誤差值越,從而在簡單線性回歸分析中一元直線回歸方程的精確性越;反之,判定系數值越大,則估計標準誤差值越,從而在簡單線性回歸分析中一元直線回歸方程的精確性越。9、大;低;??;高10、某商場計劃今年4月份銷售成本比3月份降低2%,實際卻降低了3%,則該商場銷售成本計劃完成程度為11、某福利企業(yè)職工先按姓氏筆畫排列,再按照排列順序每隔10人抽取一名職工進行調查,這樣的抽樣組織方式被稱為。11、等距抽樣(系統(tǒng)抽樣或機械抽樣);12、強度相對指標的數值表現形式是或。12、無名數;有名數13、從我國指數編制的實踐來看,數量指標綜合指數的同度量因素固定在,質量指標綜合指數的同度量因素固定在。13、基期;報告期14、對某市所有居民家庭的收入狀況進行調查,則總體是,總體單位是。14、該市全部居民家庭;該市每戶居民家庭15、按相關關系變動的方向不同,商品供應量與價格之間的關系、商品銷售量與售貨員服務態(tài)度之間的關系、家庭的消費支出與工資收入之間的關系均屬于相關,此時相關系數;而商品需求量與價格之間的關系、產品產量和單位成本之間的關系、婦女受教育程度和平均生育子女數之間的關系均屬于相關,此時相關系數。15、正;r>0;負;r<016、按變量取值是否連續(xù)劃分,在校學生人數、企業(yè)個數、企業(yè)的職工人數、企業(yè)擁有的設備臺數屬于變量;糧食產量、職工工資、人體身高、企業(yè)的利潤額屬于變量。16、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論