版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
資料來源:王學仁、王松桂,《實用多元統(tǒng)計分析》,上??茖W技術(shù)出版社,資料來源:王學仁、王松桂,《實用多元統(tǒng)計分析》,上??茖W技術(shù)出版社,123頁。附錄B習題第一章1-1設(shè)20~60歲的男子大腦重量與頭顱長度(Y,cm)服從二元正態(tài)分布.已知X與Y的相關(guān)系數(shù)為;X的均數(shù)和標準差分別為:和。試寫出X與Y的二元正態(tài)分布函數(shù)。并繪制二元正態(tài)分布的正態(tài)曲面。2已知成年女子的胸圍、腰圍和臀圍服從三元正態(tài)分布,均數(shù)分別為:,,,協(xié)方差矩陣為:廠30.530]25.53639.859(19.53220.70327.363丿1-3試寫出相應(yīng)的三元正態(tài)分布函數(shù)。換:證明,iQip),對1-3試寫出相應(yīng)的三元正態(tài)分布函數(shù)。換:證明,iQip),對X1,x2作線性變則z,z亦服從二元正態(tài)分布。并分別求出z,z的均數(shù)、方差及z與z的相關(guān)系數(shù)。1212124就例資料,圖示二元分布的90%參考值范圍。1-51-6設(shè)S和R分別是隨機向量X的方差-協(xié)方差矩陣和相關(guān)系數(shù)矩陣,證明:Is1=Is1=(ss1122s)Rmm第二章2-1對20名健康女性的汗水進行測量和化驗,數(shù)據(jù)如下,其中,X1為排汗量,X2為汗水中鉀的含量,X3為汗水中鈉的含量。試檢驗,樣本是否來自片'=(4,50,10)的總體。試驗者X1X2X3試驗者X1X2X31.2.3.4.5.6.7.8.i9.10.11.12.13.14.15.16.17.18.19.20.
2以兩均向量比較為例,證明,隊數(shù)據(jù)陣作線性變換,不改變假設(shè)檢驗的結(jié)果。2-3驗證:當m=1時,HotellingT2檢驗與t檢驗等價。]4中學男女若干名,測量其身高,體重,胸圍,結(jié)果見下表。試檢驗?zāi)信纳眢w發(fā)育狀況有無差別。男生女生編號編號身高體重胸圍身高體重胸圍11223344556<76879810911101213為了解某溶栓藥對腦梗塞患者血壓的影響,觀察10名患者,分別與療前、溶后5分鐘、10分鐘、20分鐘測定患者的收縮壓(X,mmHg)和舒張壓(Y,mmHg),結(jié)果如下表,問該溶栓藥對血壓有無影響?|ID療前溶后5分鐘溶后10分鐘溶后20分鐘XYXYXYXY&&&&’’75’’5’75’’0’70’’0’70902’3693’3090’3595’35973’4289’3899’3899’42’084’80’00’80’00’80’00’80905’7090’7080’8070’70706’2570’’467’’’64’’2687’40’00’4090’4090’40908’5070’448’’6687’5’9’!9’5098’5098’5098’4383’0’0575’’375’’375’’375資料來源:陳清棠,九五攻關(guān)項目。1999為尋找擠壓塑料膠卷的最優(yōu)工藝條件,在研究中考慮兩個因子:拉力和添加劑的濃度。觀察3個指標,耐力(X]),光澤(X2),不透明度(X3)。結(jié)果如下。問拉力和添加劑的濃度對3個指標有無影響添加劑1%(A1)添加劑%(A2)X’x2x3X’x2x3低拉速(B1)高拉速(B2)資料來源:王學仁、王松佳,《實用多元統(tǒng)計分析》,上海科學技術(shù)出版社,1990,188頁。<—*第三章1證明:在兩樣本均數(shù)的比較,如將分組變量視為自變量,將觀察指標視為因變量,作回歸分析,則所得回歸系數(shù)的t檢驗與兩樣本均數(shù)的t檢驗結(jié)果是等價的。2下列資料是用三種飼料喂大白鼠后得到的肝重比值。將分組變量視為自變量,并用啞變量表示,將觀察指標視為因變量,作回歸分析。驗證,所得回歸方程的F檢驗與三組均數(shù)比較的方差分析的F值是相同的,結(jié)論是等價的;三種飼料喂大白鼠后的肝重比值(%)組別甲乙丙y$均數(shù)3-3
以上兩個練習題說明,通常的方差分析模型是線性回歸模型的特殊情況。找一個區(qū)組設(shè)計的例子,將其用線性模型表示,并比較均數(shù)的方差分析結(jié)果與模型檢驗的結(jié)果。3-4為研究建立年齡(age)、體重(weight)、跑英里所用的時間(runtime)、休息時的脈搏數(shù)(runpluse)及跑步時的最大脈搏數(shù)(maxpluse)與肺活量間的關(guān)系,測量了31人的數(shù)據(jù)。結(jié)age44weightruntime62rstpulse178runpulsemaxpulse182oxy4062185185444515616842401661723855178180475817617640701761804364162170446317417638481701864445168168455618619245511761764747162164545016617049441801855758174176546215616551591861885749148155495618618848521701765253170172資料來源:高惠璇編譯,《SAS系統(tǒng)SAS/STAT軟件使用手冊》,中國統(tǒng)計出版社,1997,148頁。3—5文中所述逐步回歸中的消去變換是從離差陣出發(fā),最后可直接得到偏回歸系數(shù)bi和參差平方和Q。從離差陣出發(fā)進行消去變換有一個缺點,當樣本含量較大時,離差陣中元素可能很大,則其倒數(shù)將很小,此時需要保留足夠的小數(shù)位數(shù),有時保留8位或10位還不夠。此時,可以考慮從相關(guān)矩陣出發(fā)進行消去變換等運算,常保留6位小數(shù)。所得變量的剔選過程是等價的。而最后得到的是相應(yīng)的標準偏回歸系數(shù)b[和標準殘差平方和Q'=1-R2。試驗證之。3—6試證明,R是y與y的Pearson相關(guān)系數(shù)。3-7學校里孩子的體重看成是他們的身高和年齡的函數(shù)模型。從學校里調(diào)查了237個小學
生的性別(f:女性,m:男性)、身咼(英寸)、年齡(月)和體重(磅)。試建立體重與性別、身高、年齡的回歸模型。(性別年齡身咼體重性別年齡身咼體重性別年齡(身咼體重f14385F155105f153108f1615992F191113f171112f18559104F14269f16062f140F139104f178f157124F14993f143>f14589F191107<f150f147115F180114f14185f14081F16458f176112f185101F166104f175%f18059112F210140f146f17090F1625884f149f13996F18695f197121f169>F177143f185118f182*105F173103f166f16895F16962f150*94f184108F139}f147f144F177>112f178f197112F14660109f14559f14775F14584f155107f167F183110f14384f183103F18560106f14877f147112F15460114f15675f144F154f152105f191】114F190140f1406077f148F189114f143f178118F16498f157112f147101F148|5995f17781f17191F172142f190f183112F143117f17963f18657F182133f182[62f14256F165107@f16567f15461123F15074f15566f16384@F14156f14764f21062116F1716384f16761(f18264112F1446192f193【115f14185F164108{f186108f16985F175)86f180}/m16598M157105m144!m15084M150128m》13987m18967128M183111m14779
>m14690M16084m156112m17393M151117m14184m150(59M16495m1536084m206134M250172m176%m17665119M140m18566105m180104M14683m18366m14084M15186m1516181m144}94M160m178(m193133M162119m16495m18666112M14375\m1756492m17568112M175/m17369m170113M17466108m164108m14488M156106m1495792$m14460118M1475784m188112m16962100M17265112《m15084m193128M157)58m16860m140M156m156m15865121M184112m156114|m1445784M17681m168m14981M1425570|m18871140m203117M14284m189112m188151|M20071147m152105\\\\m174120M16684m14591}m143101M163118m166121m18267133M17366112)m155m16260105M177!63111m177112m175114[M1666291m1505998m150@118M188116m16366112m171112M1626391m14185m17463112M14256【m148118m140M160》64116m1446089m206172%M159112m14972m19372150M194135m15297m14655M13955m186\112m16175M153128m19698m1645884M159@99m178112m153M155m178m142[5576M164112m18965114m164140M16762108m151873—8為研究正常少兒的心象面積(y,cm2),與性別(x1,男取1,女取0)、年齡(x2,月)、身高(x3,cm)、體重(x4,kg)、胸圍(x5,cm)之間的關(guān)系,某單位調(diào)查了521名2歲半至15歲的少兒。得各指標均數(shù)、離均差平方和如下:x=0.48,x=10.37,x=124.47,x=24.76,x=60.23,y=61.7512345=130.17,l=1016518,l=218849,l=48820.5,l=29980.8,l=12740222334455yy相關(guān)矩陣如下:1111102102102102(1-0.039603(1-0.039603-0.041057-0.0344470.047992、0.0379690.96579910.9216310.9382340.9082980.9153320.855474.088385710.96686510.8634410.850318丿x1x2x
x4x
y資料來源:史秉璋,楊琦編著,《醫(yī)用多元分析》,人民衛(wèi)生出版社,1990,第80頁。試進行逐步回歸分析。3—9為研究初生兒體重與胎兒的孕齡,頭徑,胸徑,腹徑,股骨長的關(guān)系,以預(yù)測初生兒童的體重,某醫(yī)院用超聲波測得18名胎兒的上述指標,結(jié)果如下。試建立回歸方程。12891011091077339002282{8684836925003270102101100[66340042849896927432005275101100104683100628510194986932007270981039968310082599780816324009285109{1021048838001026810395101733200112801079910776350012267¥112909871350013271100102104?713000142831011061036837001528710210610771390016273103102?613000孕齡(天)頭徑胸徑X1(mm)X2(mm)X3腹徑(mm)X4股骨長X5生兒體重(g)Y172761029899883100~27610610310374365018資料來源:郭祖超主編,《醫(yī)學統(tǒng)計學》,1999,人民軍醫(yī)出版社,201頁。第四章4—1對某夠高中一年級男生38人進行體力測試及運動能力測試,包括:X1一反復橫向跳(次)X2一縱跳(cm),X3一背力(Kg),X4一握力(Kg),X5一臺階試驗(指數(shù)),X6一立定體前驅(qū)(cm),X7一俯臥上體后仰(cm)。運動能力測試的指標為:X8-50米跑(秒)X9一跳遠(cm),X10一投球(m),X11—引體向上(次)X12一耐力跑(秒)試進行主成分分析。序號x1x2x3x4x5x6x7x8序號x1x2x3x4x5x6x7x8x9x10x11x12\14655126517525724892783602525595428118504643053483466910738981874430329386449501054898166036226633154255)9046672684532311391$64861106437825587405)29738974960100499115@607420211037984863122(525617684662823629<45551054876156141524>639610486412038602062)41328739811495210042|536424042364001247!6210034611062427257(407134151101536256073722534091452551254386?562496301035015455294505120653942433991649571104772194574463011337175365112479015【7544630123571847779547729644202544471948601204786126244728<1138120495511341841560739827438721486912842)4820634853073502242(57122465415634002863882354641555171196151133122982453631204257》853430294353254271】1384465175574872993702646661204562226847028736027455691296618[513802653582850601204257857460325348294251126505013573982723833048501154153639)41528631431425214048%56156047027113483248}67105396923604502810{326334974151495420587%50030123303447551134071\1964410297331354974)120535522595003321342<4452110375514574002421布依族布依族181布依族布依族181362937526613047461445384868100/45542370&5052811355522289352資料來源:于秀林、任雪松、《多元統(tǒng)計分析》,中國統(tǒng)計出版社,1999,226頁。4-2求相關(guān)矩陣:‘1pp\p1p<pp1丿的特征根與特征向量。3我國42個10萬人以上的少數(shù)民族80年代末期部分文化、衛(wèi)生、經(jīng)濟指標如下表,是進行主成分評價。C/oo民族出生率標化死亡率生育率人均工資總產(chǎn)12歲以上文盲民族出生率標化死亡率生育率值率人口密度年平均溫度術(shù)C/oo)(C/oo)(C/oo)元/年)盲率(%)(人/Km3)(c)人員(%)滿族朝鮮族蒙古族回族>維吾爾族藏族蠡族白族哈尼族苗族/43331》25023675029>2255412)9215212《@((((侗族208107壯族24886瑤族351土家族27016哈薩克族克組(333382傣族&16黎族東鄉(xiāng)族<345土族926柯爾克孜族313)403佤族32545$15傈僳族375拉祜族308納西族3133939水族)18羌族(畬族}130錫伯族348403景頗族328<65布朗族6018阿昌族28851京族39610222獨龍4x1x2x3*x4x5x6x74-4x1x2x3*x4x5x6x7x8x9x10x11x12x13x14$#裕固族360普米族29032怒族/31225德昂族|33219基諾族&3763520仫佬族92撒拉族143807毛南族81資料來源:錢建明等,《中國少數(shù)民族健康趨勢研究》,成都科學技術(shù)出版社,1999在我國制定服裝標準時,測量了3454名成年女子的14個部位的數(shù)據(jù),得協(xié)方差矩陣如下,是進行主成分分析。上體長x1手臂長x2胸圍x3頸圍x4總肩寬x5前胸寬x6后背寬x7前腰節(jié)高x8后腰節(jié)高x9總體高x10
身高x11下體長¥?x12腰圍$x13臀圍"#x14資料來源:張堯庭方開泰著《多元統(tǒng)計分析方法》,科學出版社,1982,P115AA*VA第五章5-1比較因子分析與主成分分析模型的關(guān)系,說明它們的相似之處和不同點。{5-2對練習4-1資料進行因子分析。3從協(xié)方差矩陣出發(fā),對例4-1資料進行因子分析,比較兩者的結(jié)果。5-4HolzingerKJ(1934)報告了355名小學生12項心理測試項目間的相關(guān)系數(shù)矩陣如下,readingvocabulary試作因子分析。readingvocabularyPerceptionofbrightness1countdots、1straightandcurvedletters1speedinsimplecode1|verbalcompletion>1understandingparagraphs1>3333333311111111generalinformation%%%%1permutation-combinationsmechanicalabilityImechanicalabilityII資料來源:Harry(1960).ModernFactorAnalyses.TheUniversityofChicago頁。1在例中,就下列兩種情況解釋logistic回歸模型中x的系數(shù)的涵義,并導出x的系數(shù),寫出相應(yīng)的logistic回歸方程。⑴暴露時x—O,非暴露時x一1;⑵暴露時x一1,非暴露時x--1。6-2某研究調(diào)查了169名婦女吸煙和使用口服避孕藥對血栓形成的影響,資料如下,試進行分析。病人類別吸煙病人類別吸煙用避孕藥不用避孕藥血栓147對照222不吸煙合計用避孕藥不用避孕藥1225588{841116-3為研究血壓、膽固醇于心臟病的關(guān)系,調(diào)查了1339名冠心病和健康人的血壓和膽固醇結(jié)果如下。試建立logistic回歸方程,并探討自變量的適宜尺度。收縮壓(mmHg)冠心病膽固醇(mg/1000ml)<127、147?166>166127?146<2002334,3203有200?219220?2608116\6>2607121111<200117|4722121無200?219859843201192096843220?260
>260679946>2606799466-4下表列出了100個參加研究的個體之年齡(AGE),有無冠心病(CHD)的明顯癥狀,表中ID為編號,AGEP為年齡分組變量。結(jié)果變量是CHD,CHD=O表示個體無冠心病,CHD一1表示有冠心病。(1)作CHD與AGE的散點圖;⑵對年齡分組變量AGRP分別統(tǒng)計冠心病人數(shù),計算各年齡組冠心病的患病率P;(3)分別作P與AGRP,及l(fā)ogitP與AGRP的散點圖,并與(1)的結(jié)果比較;⑷分別建立CHD與AGE,及CHD與AGRP的logistic回歸,并比較兩個回歸的結(jié)果;⑸建立P與AGRP的logistic曲線,并與(4)的結(jié)果比較。|100個個體的年齡和冠心病(CHD)狀況IDCHDAGEAGRPIDCHDAGEAGRPIDCHDAGEAGRP10201350383680516202313603936905263024]13713937015264025138040471153】65125139140472{15366026140041/473154670261410414740557802814204247515579028143042476155[710029244042477156711030245142<478156712030246<043479156713030A2470434800577143024814348105700700715030249044482157716030250044483157717132251144484157718032252144485157719033253045586058【720033254145587158721034255046|588158722034256146589159723134257047590159724034258047591060¥825034359147592160826035360048】593161827035361@148594162828036)362148595162829136363049596163{830036364049597064831037365149!598164832137366&050699165833037】3671506100169834/3836-5為了解睪丸癌與隱睪癥的關(guān)系.以及兩者是否具有同側(cè)性或異側(cè)性傾向,在某地進行了病例一對照研究,結(jié)果如下:結(jié)果分組無隱癌癥雙側(cè)左側(cè)右側(cè)》658372對照組左側(cè)睪丸癌130812右側(cè)睪丸癌1564143根據(jù)上述結(jié)果擬合多類結(jié)果logistic回歸模型根據(jù)擬合模型,檢驗睪丸癌與隱睪癥是否有同側(cè)性;根據(jù)擬合模型,檢驗睪丸癌與隱睪癥是否有異側(cè)性;\(4)檢驗隱睪癥與同側(cè)睪丸癌的優(yōu)勢比是否與異側(cè)隱睪癥的優(yōu)勢比相同。6-6某醫(yī)科大學外科在腿潰瘍的治療臨床研究中,采用兩種處理treat(Trental—1和Placebo—O),兩種繃帶(bandage4layer一1和Convatec-0),兩種包扎方法(Granuflex—1和Na=O),治療結(jié)果分為3各等級heal(無效一0,有效=1,痊愈一2)。根據(jù)上述結(jié)果擬合累積比數(shù)logistic回歸模型;擬合相鄰比數(shù)logistic回歸模型;對(1)和(2)的結(jié)果進行比較;treatbandagedressinghealFreqtreatbandagedressinghealfreq00001910002100014@1001200022!10024001021101010001131011500122#10121001009¥1100501018$11011001026/1102801101011012@
011110…1117101125(11271(4)該資料是否符合建模的條件6-7hosmer,.給出了1:3配比的低出生體重危險因素研究,結(jié)果如下表。研究中按年齡配比,及年齡相同者配方,match是配比組,obs是配比組中的患者編號,low表示低出生體重變量(low=1,體重出生低于2500g,否則low=0),lwt表示母親最后一次月經(jīng)的體重,smoke表示母親吸煙狀況(吸煙=1不吸煙=0),ptl表示早產(chǎn)史(有=1無=0),表示高血壓(有=1無=0)ui表示子宮過敏危險情況(有=1無=0)時對該資料進行分析。obslowagelwtsmokehtuiptlobslowage¥lwtsmokehtuiptl11161300000302211210012016112000040221690000301613510001123970\0104016950000202313000001]11713010113023)119000020171030(0004023123000{0301712210001<12311010014017}113000020231280\00011171200000302319000002017113000040231100000301711900001124132010(0401711900002\02411500001118》1480000302411500002018100100>402411000000
189010101124[1380000182290(000202490100A11811010013《024133000018[107101040241160000181001000112585001018901010202511810001991101130251250000191381000402512000001918900001125921@000191471000202512000101910200003025\1400000191500000402524101001923511001(125105000119>184110020251550#00019112101《030259510111918200104025130000019950【0001126190100%01913200002/026113100020[150100030261681<000201200010402616000002010510001128(10110100100000010010\1)0(003412341234123412341230000201410{0112028140000#02012010003028250100020%103000040281340]000201270000112895100020170100020281201000201211}011302812000002016900114028130000020(121100011291300】010201200000202915000002120000103029>1350000211081010402913010002112400001130142100121185100020301070\01121100000}13030153000021160000040301370000211101]010113110210012111500002031100001022130101130311501&000228510004031120000022130100011321051000221250002032121000(1000100000010001000]141234123412341234123411211000001303213200002021》160000040321341&0013021110101}011311021001402111500002031*100001011221301A00030311501000202212001004!311200000第七章*7-1驗證,四格表的pearson咒2與咒j等價。7-2對例資料用極大似然法建立可加效應(yīng)的poisson模型(列出詳細步驟)。7-3AlanMorrison作了一項乳腺癌患者3年生存情況調(diào)查.其中慢性炎癥反應(yīng)的程度分為輕炎癥和重炎癥,核的量級分為相對惡性和相對良性,并按診斷中心和年齡分層.結(jié)果如下.使就影響乳腺癌患者3年生存率的有關(guān)因素進行分析.診斷中心年齡存活情況輕炎癥重炎癥惡性良性惡性良性東京50以下死9743活2668259!死99112
50~69活20】4618570以上死2310活1651波士頓50以下死?6760活11244050~69死82032}活18581370以上死918[30活152611格拉摩根50以下死16730活16208150~69死141230活273910470以上死}3730活1211417-4為探的討腫瘤壞死因子(TNF)與干擾素(IFN)的免疫活化能力,各選4個計量,共16個組合,見下表第2,3欄,每種組合下,觀察200個細胞中有多少個分化(y).結(jié)果見下表第一欄?研究的目的是要檢
驗?zāi)[瘤壞死因子(TNF)與干擾素(INF)對細胞的分化作用是獨立的,協(xié)同的還是拮抗的.試對該資料建立logistic回歸,Poisson回歸和負2項回歸,并對它們進行評價.NOyTNF的劑量(U/ml)IFN的劑量(U/ml)11100218043200204390100522106381475212086911009311001068104116910201212810100121021000141711004
1518010020161931001007-5..Weinberg(1988)等報道了Colorado地區(qū)1978-1983年兒童糖尿病按性別、年齡分組的逐月發(fā)病情況,下表是按各組人口數(shù)校正后的發(fā)病人數(shù)。試用Poisson回歸模型分析糖尿病的發(fā)病和年齡、性別之間的關(guān)系,并探討是否有季節(jié)波動。Colorado地區(qū)1978-1983年兒童糖尿病病人數(shù)男女男女年月【0-45-910-170-45-910-17年月0-45-910-170-45-910-17
年齡(age)(0:1—4;1:1—9;2:10—17),性別(sex)(0:女;1:男);時間(month)(月份)第八章8-1設(shè)一組病人的生存分布服從A=0.65的指數(shù)分布。請:[畫出生存函數(shù)曲線;計算平均生存時間,中位生存時間;計算生存大于2個單位時間的概率。8-2設(shè)一組病人的生存分布服從八一,m-3的Weibull分布。請:畫出生存函數(shù)曲線和危險度函數(shù)曲線;估計平均生存時間;、(3)計算生存大于1個單位時間的概率。8-3為了比較藥品6-疏嘌吟(6-MP)與一種安慰劑在緩解血癌患者的痛苦方面的療效,請定義生存時間和死亡事件。如每組分別觀察了21名患者,緩解的時間(周)如下。其中帶星號為截尾。試進行分析和比較。(資料來源:JFLawless(茆詩松等譯)壽命數(shù)據(jù)中的統(tǒng)計模型與方法,P5)6-MP組:6,6,6,6+,7,9“,10,10',11',13,16,17*,19*,20',22,23,25*,32*,32',34*,35*安慰劑:1,1,223,4,4,5,5,8,8,8,8,11,11,12,1A2,15,117,22,238-4在深度的靜脈血栓形成的研究中,20名病人的血凝塊漸退時間(小時)如下(資料來源:ETLee(陳家鼎等諢)生存數(shù)據(jù)的統(tǒng)計方法,P268):2,3,4,5,5,9,13,,,,7,6,,6,14,25,49,,49,28擬合指數(shù)分布;擬合Weibull分布;何種分布模型較好8-5對例資料建立指數(shù)回歸和Weibull回歸,并與Cox回歸模型進行比較。?8-6對例資料用逐步回歸方法建立Cox模型。8-7有33位患腎上腺樣瘤的病人接手化學療法、免疫療法及激素療法的綜合治療。資料如下。試對該資料進行分析。其中,age表示年齡;gender表示性別,F(xiàn)表示女性,M女性男性;tiem0和timel分布表示開始治療和終止治療的時間;response是對治療的反應(yīng),O表示無反應(yīng),1表示完全反應(yīng),2表示部分反應(yīng),3表示穩(wěn)定;其余5個指標是皮膚試驗的反應(yīng)面積,ND表示沒有做agegendertime0responsetime1outcomeMoniliaMumpsPPDPHA53F03/31/77111/01/77\07X723X230X025X261M06/18/760A08/21/76110X1015X200X013X156F02/01/77\310/01/7700X07X70X025X248M201/15/7610X00X00X00X0
12/19/7455M11/10/75001/15/76112X12ND10X108X8#62F10/07/74204/05/75110X105X50X07X757M10/28/74001/06/75115X1515X150X0¥0X053M10/06/75206/18/7710X0ND0X012X145M04/11/77010/01/7706X4<4X40X00X058M08/04/76302/11/77113X1313X1322X2223X261F01/01/77310/01/77/00X08X817X1711X161M07/25/761[10/01/7703X912X120X020X277M\05/08/75009/26/7510X00X00X00X055M04/27/77210/01/7700X00X015X1510X150M04/20/77310/01/7700X014X145X532X342M08/24/76010/01/77011X117X70X0{12X150F01/08/75006/30/7510X00X00X00X066F09/08/76310/01/7709X9&10X106X615X158M02/18/75010/01/770@0X00X00X00X062M05/12/76010/17/76【12X2NDND3X371F10/22/76312/12/76110X106X60X012X144M06/06/77|310/01/77010X1010X100X020X269M(06/21/76010/13/7610X015X1525X2525X256}M06/07/77210/01/7700X07X70X00X0、M11/16/76012/10/76111X115X50X020X2
69M05/10/77007/25/7710X00X00X015X160M06/29/77007/07/7710X00X00X026X260M07/21/75310/01/77011X11)20X2010X1018X172M07/19/75010/18/75110X100X07X710X142F03/03/75004/23/75》10X0ND0X00X057M02/24/772)10/01/7705X58X80X025X166M06/15/77310/01/7700X015X150X010X159M03/04/77004/02/7710X00X00X016X1(第9章9-1選擇何種標準進行聚類分析,要依具體數(shù)據(jù)的實際背景來決定,標準選擇是否得當對于聚類分析效果有直接影響。已知一個二維正態(tài)分布總體有分布:(10.9丫
(10.9丫
"I丿,現(xiàn)在有兩點A=(1,1)和B=(1,一1)若按歐氏距離距離計算,點A與點B到均數(shù)的距離同為^2。若按馬氏距離計算,是否也一樣9-2欲以能耗、糖耗將運動項目分類,以便針對不同能耗、糖耗的運動提供不同膳食,使運動員既能得到能量的補充,又不造成多余的脂肪堆積。某單位對上海劃船隊6名運動員作了能量代謝測定,得13個項目的平均數(shù)如下,試進行分析。運動項目變量名能耗(焦耳/分、M2)糖耗(%)負重下蹲咼力翻提鈴引體向上腰腹轉(zhuǎn)手腳并舉X1X2X3X4X5X6<仰臥蹬腿快挺趴拉臥推俯臥撐曲臂X7X8X9X10X11X12211211211211仰臥起坐X139—3練習4—1的資料進行變量聚類答案:1.1X與Y的二元正態(tài)分布函數(shù):f(x,f(x,y)=:'0.152*7.522*G—0.52罰exp</12G-0.52192(x—1.47\)[0.15丿y—176.55]7.52丿2—2x0.5219x'x—1.47]x(y—176.55、I0.15丿7.52丿TITLE'繪制二元正態(tài)分布曲面';GOPTIONSRESET=GLOBALGUNIT=PCTNOBORDERFTEXT=SWISSBHTITLE=6HTEXT=3;DATAex1_1;S1=**2;s2=**2;r=;pi=3.;DOx=TOBY;DOy=-20TO20BY;z=1/(2*pi*SQRT(s1*s2*(1-r*r)))*EXP(-1/2/(1-r*r)*(x*x/s1+y*y/s2-2*r*x*y/SQRT(s1*s2)));OUTPUT;END;END;RUN;/*title‘BivariableNormalSurface';*/PROCG3D;PLOTx*y=z/ROTATE=135XTICKNUM=9YTICKNUM=11ZMAX=ZTICKNUM=5;RUN;1.2三元正態(tài)分布的密度函數(shù):f(X)=(1xf(X)=(1x—283.39]]「70.26III91.52」兒—1「83.39「、x—II70.26II27.363_一91.52_丿30.53025.53638.85919.53220.70330.530(2?!?2x25.53639.85919.53220.70327.3631.3證明:(叮1乜丿2X=^+AY?N(卩,)(Y?(01))21〔11、?(〔〔A〔11、?\(11、—AY=0+AY?N0,Ao丿2V丿丿X—卩N2(0,丄工〔11N2(0,丄工〔11'1g(丿得證。1.4思路:1-0.58062x與y的90%參考值范圍是下列方程的解:\x—165.8338匕(x—165.8338)(y—53.5694)(y—53.5694匕I—2x0.5806x+4.9155024.9155x4.89214.89212〔〔11?\(11'1〔11'1〔1A其中〔AA二一A'A二—工V匕丿丿匕丿o(g丿gI0丿則z?iii證明:記s,s分別表示變量X的標準差和方差,因X的X的相關(guān)系數(shù)r及協(xié)方差s有ijijiii如下關(guān)系:s二rssijijij則:ssssssrssr11121m1112121m1mS=sssssrssss21222m=2121222m2ms:s:???..s\ssrss:r???..sm1m2…:mmm1m1m2m2…:mms00]rrs00一11111121m1???0s011rrr0s02121222m20???0??s]Lr:*n?????r:0???0??s:mm1m2mmm故得:|S|=(sss)|R1122mm練習Title‘樣本均向量與總體均向量的比較';DATAex2_1;INPUTx1x2x3@@;Y1=x1-4;y2=x2-50;y3=x3-10;Cards;Procanova;Modely1y2y3=/nouni;/Manovah=intercept;Run;練習令A(yù)=(a1,a2,...,am-1,am),B=diag(b1,b2,...bm)對X作線性變換:Z=A+BX則Z=A+BX,V=BVB'V-1=(BVB')-1=(B')-1V-1B-1zXzXXnln2nln2Tz=~1^n2(Z1-Z2)'Vz-1(Z1-Z2)=(BX1-BX2)'(B')-1VX-1B-1(BX1-BX2)=n1n2nln2(X1-X2)'B'(B')-1VX-1B-1B(X1-X2)=時(X1-X2)'VX-1(X1-X2)=TX得證。2-3Title‘hotellingT2檢驗與t檢驗';Dataex2-3;Inputx@@;G=1;If_n_>14theng=2;Cards;Procttest;Varx;|Classg;Run;Procglm;Classg;Modelx=g/nouni;Manovah=g;Run;2-4Title‘多元方差分析:成組分析';DATAex2_4;Inputhwbsex$@@;CARDS;MMFMMF####M;PROCGLM;CLASSsex;MODELhwb=sex/MOUNI;?MANOVAH=sex;RUN;練習TITLE'多元方差分析:區(qū)組設(shè)計';DATAex2_5;INPUTxyab@@;CARDS;175155111751102117011031170904110575110113752101137531011375410];PROCGLM;CLASSab;MODELxy=ab/NOUNI;MANOVAH=ab;RUN;練習TITLE'多元方差分析:析因設(shè)計';DATAex2_6;INPUTx1x2x3ab@@;CARDS;1121PROCGLM;CLASSab;MODELx1x2x3=aba*b;RUN;第三章答案:3-1答:設(shè)兩樣本Y1、Y2,樣本含量分別為nl、n2,均數(shù)分別為Yl、Y2,標準差分別為s1、s2。不妨設(shè)回歸方程為:Y=a+bg則當g=1時,Y1=a+bg=Y1;當g=o時,Y2=a=Y2。故有b=Y2-tl。SY.s:工(Y—SY.s:工(Y—Y)2In—2■'S(Y—Y)2+E(Y—Y)2I112—2'n—2■(n—l)s2+(n—l)s2ll22-n—2聲(g-g)2n(l—g)2+n(0—g)2=,n(l——1\iln+n'l2)2+n(0—2n、1)2n+nl2.nnb
tb.nnb
tb=-
bsbY—Y2l■(n—l)s2+(n—l)s2:+丄21/.得證。均數(shù)3-2答:3-2答:TITLE'回歸方程F檢驗與均數(shù)之方差分析';|DATAex3_2;INPUTygg1g2@@;CARDS;1oo21o3o11oo21o3o11oo21o3o11oo21o3o1PROCREG;MODELy=g1g2;RUN;#PROCANOVA;CLASSg;MODELy=g;
RUN;3-3答:TITLE'方差分析模型與線性回歸模型'DATAex3_3;DOb=1to5;DOa=1to4;INPUTx@@;OUTPUT;END;END;CARDS;PROCANOVA;¥CLASSab;MODELx=ab;RUN;PROCGLM;CLASSab;MODELx=ab;RUN;3-4答:TITLE”篩選自變量的最優(yōu)子集”;DATAex3_4;INPUTageweightruntimerstpulsemaxpulseoxy;CARDS;44621781825253170172PROCREGRSQUAREMSECPAICADJRSQSELECT=2;MODELoxy=ageweightruntimerstpulserunpulsemaxpulse;run;練習>X1X2X3X4YX1X2X3X4Y以(2,2)為主元作消去變換,結(jié)果如下X1X2…X3X1X2(X3X4Y、X4Y以(4,4)為主元作消去變換,結(jié)果如下X1X2X3X1X2$X4]YX3X4以(1,1)為主元作消去變換,結(jié)果如下:X1X1,X2X3X4YX2X3|以(2,2)為主元作消去變換,結(jié)果如下:X1X2X3X4YX4YU=工U=工bl,iyxi故:X1X2X3X4練習因b—y-bx-bxbx122mmr—yyyyyy丫(y-y)(y-y)iii—1—:/-X(y-y)yyii—i丫(y-y)(bi04=1+bxHFbx-y)1i1mimi1X[(y-y)Xb(x-x)]Xb[X(y-y)(x-x)]ijijjjiijji=1j—1—j—i=1機-U.Jl-UlYYYY遲bljyxi—j—^=■l-UYY得證。練習TITLE”小學生的身高、年齡和體重的數(shù)據(jù)”;DATAex3_7;INPUTsex$ageheightweight@@;CARDS;(f143f155f153m164m167m151PROCREGOUTEST=est1OUTSSCP=sscp1;BYsex;EQ1:MODELweight=height;EQ2:MODELweight=heightage;PROCPRINTDATA=sscp1;TITLE2”sscp類型的數(shù)據(jù)集”;*
PROCPRINTDATA=est1;TITLE2”est類型的數(shù)據(jù)集”RUN;練習TITLE'逐步回歸';OPTIONLINESIZE=120;DATAex3_8(TYPE=CORR);_TYPE_=”CORR”;《INPUT_name_$x1x2x3x4x5y;CARDS;TOC\o"1-5"\h\zx11.....x2;1....x3x4x5
y1—...x3x4x5
y1..1."1RUN;PROCSTEPWISE;MODELY=x1x2x3x4x5/SLENTRY=SLSTAY=DETAILS;RUN;¥練習TITLE'所有子集的回歸';DATAex3_9;INPUTx1x2x3x4x5@@;CARDS;28910110910773390026810395101733200285109102104883800276106193103743650;PROCREG;MODELy=x1-x5/SELECTION=RSQUAREADJRSQCPMSEAICBEST=10;RUN;&&練習TITLE'主成分分析';DATAex4-1;INPUTx1-x12;CARDS;46551265125724892783604868100452370522289352RUN;練習九-1-p令|xi-a|=-p九-1-p-pPROCPRINCOMP;-P-P=0,解得:九]=l+2p九-11九=1—p九二1—p23對于九=1+2p有[(1+2p)]I—a]求得其特征向量為R3.3對于九2=1-p(x)1'0、x=02Ix丿<0丿3有[(1-p)]I-A]求得其特征向量為kn+kn(k,11221不同時為0)2其中n1=0~T-—練習4-3TITLE'主成分分析’OPTIONLINESIZE=120;DATAex4-3;INPUTmz$x1-x8;CARDS滿族毛南族PROCPRINCOMPN=4OUT=COMP;RUNPROCSORTDATA=COMP;BYPRIN1RUNPROCPRINTIDmzVARPRIN1PRIN2X1-X8TITLE'用第一主成分對42個少數(shù)民族進行排序RUN;練習TITLE'從方差協(xié)方差矩陣出發(fā)進行主成分分析和因子分析;DATAex4-4(TYPE=COV)OUTPUTa(TYPE=CORR);-TYPE-='COV\INPUT一name-$x1-x14;CARDS;PROCPRINCOMP;RUN;5-1答:主成分分析與因子分析都是研究多個變量間的互依性,但出發(fā)點不同。主成分分析是尋找出能反映原變量信息的綜合指標,是對變量共性的一種提取,主成分的個數(shù)與原變量數(shù)相同,貢獻大的主成分常用于評價,或進一步分析,貢獻小的主成分常用于判斷變量間的關(guān)系因子分析是尋找出能解釋原變量的公共因子,這些公共因子互相獨立代表某一方面的特性它們不能被測量,但對可測量的變量產(chǎn)生影響,或者說通過這些變量體現(xiàn)出來。因子分析的任務(wù)是通過原變量提供的錯綜復雜的關(guān)系,尋找潛在的公共因子,當初始因子不好解釋時常對其作旋轉(zhuǎn)變換。提取公共因子的方法很多,主成分是最常用的提取公共因子的方法之一因此,很多應(yīng)用者將主成分和因子分析看成一回事,這事片面的。5-2TITLE'因子分析';OPTIONLINESIZE=120;%DATAex5_2;INPUTx1-x12;CARDS;46551265125724892783604868100452370522289352;/*從原始數(shù)據(jù)出發(fā),進行因子分析*/PROCFACTORMETHOD=PN=3ROTATE=VARIMAX;RUN;%/*從協(xié)方差矩陣出發(fā),進行因子分析*/PROCFACTORCOVMETHOD=PN=3ROTATE=VARIMAX;RUN;練習TITLE'因子分析與因子旋轉(zhuǎn)';DATAex5_4(TYPE=CORR);_TYPE_=”CORR”;INPUT_name_$x1—x12;1《1《1(1《1《1(CARDS;x1x2x3x4x5x6x7x8x9x10x11x12/*方差最大正交旋轉(zhuǎn)*/PROCFACTORMETHOD=PN=4ROTATE=VARIMAXRES;RUN;/*斜交旋轉(zhuǎn)*/PROCFACTORMETHOD=PN=3ROTATE=PROMAXRES;RUN;6-1解:(1)ln(OR)=In(、p/1-p—00I(1)ln(OR)=In(、p/1-p—00Ip/1-p丿11=logitP—logitP=a—(a+0)=—0010=ln爲可解釋為優(yōu)勢比導數(shù)的對數(shù)值。ORp55對例,當x=0時,logitP=ln—=ln=a,a=1.062901—p1901CQ當x=1時,logitp=Ini—=In=a+B,B=—1.31071-p1641logistic回歸方程為p/1—p11logistic回歸方程為p/1—p11VP/1—p丿—1—1釋為優(yōu)勢比平方根的對數(shù)值。logitP=ln(OR)=ln=logitP=(a+P)—(a—p)=2P-1=lnJOR可解當x=1時,logitp1=山土=lnH=a+P1當x=-1時,logitp-當x=-1時,logitp-1p128=ln-i—=ln=a—P1-p164—1聯(lián)列上面兩式,解得:a=0.4075,p=0.6554所以相應(yīng)的logistic回歸方程為logitP=+6-2解:Title‘logistic回歸';6-2解:Title‘logistic回歸';Dataex6-2;Inputfyx1x2@@;x12=x1*x2;lablex1=”吸煙否”;lablex2=”用藥否”;cards;14112011712201010128Proclogisticdescending;Weightf;?Modely=x1x2x12;Run;Procsort;byx2;Proclogisticdescending;Weightf;Modely=x1;Byx2;Run;6-3】解:Dataex6-3;Doy=0to1;Docho1to4;Dosbp1to4;Inputf@@;Output;End;End;End;|Cards;233432038%1166712111111712147&2285984320119209684367)463399Datatemp;Setex6-3;Y=y-1;s1=0;Ifsbp=2thens1=1;s2=0;Ifsbp=3thens2=1;s3=0;Ifsbp=4thens2=1;》c1=0;Ifcho=2thenc1=1;c2=0;Ifcho=3thenc2=1;c3=0;Ifcho=4thenc2=1;run;Proclogisticdescending;Weightf;Modely=sbpcho;;Run;Proclogisticdescending;Weightf;Modely=s1-s3c1-c3;Test1:tests2-s1=s1;
Test2:tests3-s2=s2-s1;Test3:testc2-c1=c1;Test4:testc3-c2=c2-c1;Run;6-4解:Dataex6-4;Inputidchdageagrp@@;Cards;02035038368}34038Run;Procgplot;Plotchd*age;Run;/*計算條件均數(shù)p*/Procsortout=temp;Byagrp;Procunivariatedata=tempnoprint;Byagrp;Varchd;Outputout=temp2N=nsum=n1mean=p;Run;Procprintdata=temp2;Run;data=temp3;settemp2;logitp=log(p/(1-p));run;Procgplotdata=temp3;Plotchd*agelogitp*agrp;Run;Proclogisticdescendingdataex6-4;Modelchd=age;Run;Proclogisticdescendingdataex6-4;Modelchd=agrp;Run;Procregdata=temp3graphics;Modellogitp=agrp;Run;Outputout=temp4predicted=lp;Plotlogitp*agrp;Run;Datatemp5;Settemp4;Pp=exp(lp)/(1+exp(lp));Procgplotdata=temp5;Plotpp*agrp;Run;6-5解:TITLE'多類結(jié)果的logistic回歸';DATAex6_5;INPUTyx1x2f;y1=2-y;CARDS;0006580103001701121001301108101111122001562104201142113PROCCATMOD;WEIGHTf;DIRECTx1x2;MODELy1=x1x2/FREQONEWAYCOVBCORRB;RUN;檢驗睪丸癌與隱睪癥的同側(cè)性和異側(cè)性,需比較不同變量之間的系數(shù),SAS無法解決,建議使用stata6-6解:Titleex6-6;Inputtreatbangagedressinghealfreq@@;Cards;0000191000000141001
00014001000014001021001130012201009010180102601101001111001125RUN;Proclogisticdescending;1010101011111111111101110001112012012012Freqfreq;Modelheal=treatbangagedressing/clodds=wald;Run;Proccatmod;Weightfreq;Directtreatbandagedressing;Responsealogits;Modelheal=_response_treatbandagedressing;Run;6-7解:TITLE'1:3配對資料條件logistic回歸';DATAex6_7;INPUTmatchobslowagelwtsmokehtuiptl;time=2-low;CARDS;111161300000120161120000130161351000140169500002911321051000292032121000029303213200002940321341001PROCPHREG;MODELtime*low(0)=lwtsmokehtuiptl/TIES=DISCRETE;STRATAage;RUN;2222222222227-1發(fā)病不發(fā)病合計發(fā)病率暴露aBa+bp=a/a+b1非暴露cDc+dp=c/c+d2合計a+cb+dNp=a+c/N(c)(c))V(c)(a-T)2(c-T)2a+c—(a+b)p(1-p)(c+d)p(1-p)(a-T)2(c-T)2a+c(a+b)a+c/Nb+d/N(c+d)a+c/Nb+d/N(a(a-T)2(a+b)(a+b)(a+c)~(a+b)(c+d)
NN(c-T)2(c+d)c(c+d)(a+c)(b+d)(c+d)
NN(a-T)2(T+T廠)(c-T)2(T+T)aa(a-T)2(T+T廠)(c-T)2(T+T)aa—b--+——c—cd-T■TT/abcda+b=T+T;c+d=T+)abcdd)a■&bdac(a-T)2(a+b)+(c-T)2(c+T)T)(c-(c-22++aa■&bac(a-■&(a-T)(b-T)(c-(a-T)(b-T)(c-T)(d-T)■c,得證a-T)(b-T)(c-T)2=(d-T)2)7-2??DATAexp7_2;INPUTyx;CARDS;2-13-160708090101121151;PROCGENMOD;INTERCEPT=MODELy=x/DIST=POISSONLINK=idINITIAL=INTERCEPT=ITPRINT;Run;T7_3解答DATAex7_3;INPUTyqualityyanzhengagecenterf;IFquality=1§yanzhneg=1THENbingsi=1;IFquality=2§yanzhneg=1THENbingsi=2;IFquality=1§yanzhneg=2THENbingsi=3;IFquality=2§yanzhneg=2THENbingsi=4;CARDS;1111191121140213311022331;PROCGENMOD;FREQf;MODELy=bingsiagecenter/LINK=LOGDIST=NORMAL;PROCGENMOD;FREQf;MODELy=bingsiagecenter/LINK=LOGDIST=BINORMIAL;PROCGENMOD;FREQf;MODELy=bingsiagecenter/LINK=LOGDIST=POISSON;RUN;T7-4解答DATAex7_4;INPUTrnx1x2;a1=log(x1+1);a2=log(x2+1);t=a1*a2;CARDS;1120000193200100100;PROCLOGISTIC;MODELr/n=a1a2t;RUN;DATAa;SETex7_4;Ln=log(n);PROCGENMOD;MODELr=a1a2t/DIST=POISSONOFFSET=ln;RUN;負二項回歸SAS不能解決,建議使用stata.例7.5TITLE'Poisson回歸';OPTIONLS=150;DATAEX7_5;INPUTdagesexmonthyear@@;
_pi=6;M1=cos(_pi/6*month);M2=sin(_pi/6*month);Datalines;00117810118142012802201283Procgenmod;Modeld=agesex/DIST=POISSONLINK=LOG;RUN;PROCGENMOD;.MODELd=agesexM1M2/DIST=POISSONLINK=L
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 我國上市公司管理層股權(quán)激勵與企業(yè)績效的實證研究:基于多維度視角的分析
- 我國上市公司環(huán)境會計信息披露與財務(wù)績效的相關(guān)性:理論、實證與啟示
- 我國上市公司換股并購的深度剖析與策略優(yōu)化
- 我國上市公司再融資制度的市場績效:理論、實證與優(yōu)化策略
- 芳香保健師崗前安全風險考核試卷含答案
- 鏈板沖壓工崗前基礎(chǔ)實操考核試卷含答案
- 制漿廢液回收利用工崗前理論評估考核試卷含答案
- 坯布縫接工創(chuàng)新實踐能力考核試卷含答案
- 老年甲狀腺功能減退癥患者用藥依從性方案
- 臨保食品安全管理制度
- 人教版三年級上冊豎式計算練習300題及答案
- GB/T 6974.5-2023起重機術(shù)語第5部分:橋式和門式起重機
- 心臟血管檢查課件
- 運用PDCA循環(huán)管理提高手衛(wèi)生依從性課件
- 二手房定金合同(2023版)正規(guī)范本(通用版)1
- 《高職應(yīng)用數(shù)學》(教案)
- 點因素法崗位評估體系詳解
- 漢堡規(guī)則中英文
- DB63T 1933-2021無人機航空磁測技術(shù)規(guī)范
- GB/T 5231-2022加工銅及銅合金牌號和化學成分
- GB/T 26480-2011閥門的檢驗和試驗
評論
0/150
提交評論