畢業(yè)設(shè)計(論文):廣義線性模型及其在數(shù)據(jù)分析中的應(yīng)用_第1頁
畢業(yè)設(shè)計(論文):廣義線性模型及其在數(shù)據(jù)分析中的應(yīng)用_第2頁
畢業(yè)設(shè)計(論文):廣義線性模型及其在數(shù)據(jù)分析中的應(yīng)用_第3頁
畢業(yè)設(shè)計(論文):廣義線性模型及其在數(shù)據(jù)分析中的應(yīng)用_第4頁
畢業(yè)設(shè)計(論文):廣義線性模型及其在數(shù)據(jù)分析中的應(yīng)用_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

廣義線性模型及其在數(shù)據(jù)分析中的應(yīng)用研究目的及意義廣義線性模型的研究使得廣義線性模型在各個領(lǐng)域得到了越來越多的應(yīng)用。研究現(xiàn)狀近百年來,廣義線性模型在國內(nèi)外均得到了飛速的發(fā)展,模型從廣義模型拓展到了廣義線性混合模型、半?yún)?shù)線性模型、廣義非線性模型等。廣義線性模型和經(jīng)典線性模型經(jīng)典線性模型的表達形式通常為:廣義線性模型的表達形式則為:常見的廣義線性模型泊松回歸模型Probit回歸模型Logistic回歸模型負二項回歸模型廣義線性模型的應(yīng)用醫(yī)學(xué)領(lǐng)域生物學(xué)領(lǐng)域經(jīng)濟領(lǐng)域廣義線性模型新藥臨床試驗中的應(yīng)用影響90分鐘timi分級變量表年齡糖尿病史性別體重指數(shù)過往心絞痛史吸煙史過往高血壓史現(xiàn)在有無吸煙是否高膽固醇白細胞正常與否治療前纖維蛋白發(fā)病到治療間隔的時間變量尺度參數(shù)參照值系數(shù)標(biāo)準(zhǔn)誤差卡方P值過往高血壓史:無0.0864有-0.47240.0233409.89<0.001過往高血壓史:無有-0.47240.273.060.0802是否高膽固醇:否1.3058是-0.2950.41930.490.4817是否高膽固醇:否是-0.2950.32110.840.3583糖尿病史:無0.8844有0.36670.35431.070.3007糖尿病史:無有0.36670.40060.840.36體重指數(shù)0.9295-0.09330.04584.150.0417體重指數(shù)-0.09330.04933.580.0584白細胞:異常0.8577正常0.36420.23222.460.1168白細胞:異常正常0.36420.27071.810.1786纖維蛋白0.8901--0.00010.00010.410.5197纖維蛋白--0.00010.00010.330.5667吸煙史:無0.4475有-0.22430.12613.160.0754吸煙史:無有-0.22430.28180.630.4262現(xiàn)在有無吸煙:無0.3559是0.04010.09610.170.6762現(xiàn)在有無吸煙:無0.04010.09610.020.8818考慮其他因素交互的單變量分析變量尺度參數(shù)參照值系數(shù)標(biāo)準(zhǔn)誤差卡方P值過往高血壓史:無0.9696有-0.50770.27143.50.0614年齡--0.00760.01510.250.615吸煙史:無0.8191有-0.15750.26210.360.548性別:男女0.17630.33190.280.5953現(xiàn)在有無吸煙:無0.751是0.14780.22140.450.5044性別:男女0.34840.29231.420.2332高血壓史和體重指數(shù)都對90分鐘timi分級有影響。結(jié)論:廣義線性模型在水稻區(qū)域試驗中的應(yīng)用A因子水平B因子水平123ⅠaBcⅡ//dⅢe/fⅣghi

把觀察值Y作為應(yīng)變量,對試驗中每個影響因素的各個處理水平進行編碼,將0和1分別作為兩個虛擬變量,建立一個廣義線性模型。例如,一個A、B兩因素?zé)o重復(fù)試驗,A因子有4個水平,B因子有3個水平,一共12個組合處理,其觀察結(jié)果為一組非平衡數(shù)據(jù)。廣義線性回歸模型的矩陣表達式傳統(tǒng)方差分析與廣義線性模型方差分析結(jié)果比較變異來源傳統(tǒng)方差分析廣義線性模型方差分析DFSSMSFProb.DFSSMSFProb.點內(nèi)區(qū)組81.020.131.000.44試驗點3166.5055.50436.930.005178.7635.75373.100.00品種108.790.886.920.001018.721.8719.540.00品種×試點3027.100.907.110.004844.740.939.730.00試驗誤差8010.160.1312812.720.10總和131213.57191254.67試驗點效應(yīng)、品種效應(yīng)及品種與試驗點之間都有很明顯的互作效應(yīng),并且兩種方法都可以得出一個結(jié)論,試驗點的生產(chǎn)力、品種的產(chǎn)量潛力以及不同的品種都在各個試點表現(xiàn)出很明顯的差異。從自由度(DF)和平方和(SS)我們也可以得知,廣義線性模型方差分析比傳統(tǒng)方差分析更多地利用了試驗數(shù)據(jù)。分析與小結(jié)廣義線性模型在非平衡數(shù)據(jù)的處理上,比傳統(tǒng)的缺區(qū)估計方法來得更準(zhǔn)確、更完善。如本文所述的水稻品種區(qū)域試驗實例,廣義線性模型盡可能多的使原始試驗數(shù)據(jù)得到了利用。廣義線性模型不只是適用于類似文中所述的一年內(nèi)多個試驗點的數(shù)據(jù),同時也適用于多年間多個試驗點的數(shù)據(jù)的分析。在實際生活應(yīng)用中,我們不能單單考慮品種的豐產(chǎn)性,還需要考慮到品種的穩(wěn)定性和適應(yīng)性。這些分析與評估都是廣義線性模型暫時還無法提供的,還有待研究人員對模型進行優(yōu)化和改進。廣義線性模型在汽車保險定價中的應(yīng)用采用一組損失數(shù)據(jù)來討論汽車保險費率厘定問題中廣義線性模型的應(yīng)用。其中共有7個變量:年行駛里程數(shù)(分5個級別,用K表示),無賠款折扣等級(分7個級別,用B表示),行駛地區(qū)(分7類,用Z表示),車型(分9類,用M表示),保單年數(shù),索賠次數(shù)和賠付額;所有的被保險人被劃分成了2182個類別(應(yīng)該是2205個類別,其中23個類別沒有被保人),總的保單年數(shù)為2383170.08。經(jīng)驗數(shù)據(jù)的平均索賠頻率為0.04749,次均賠款為4955.25,平均純保費為235.31。部分表格展示比較結(jié)果表格關(guān)于索賠次數(shù)的泊松假設(shè)和正態(tài)假設(shè)的擬合優(yōu)度比較泊松假設(shè)正態(tài)假設(shè)CriterionDFValueValue/DFDFValueValue/DFDeviance21592967.03300.10032159216.54731.3743ScaledDeviance21592967.03301.374321592182.00051.0107PearsonChi-Square21593012.90590.10032159216.54731.3955ScaledPearson21593012.90591.395521592182.00051.0107LogLiKelihood-4424844325.9344分析和小結(jié)從這個實例中我們可以看出廣義線性模型和經(jīng)典線性模型在許多數(shù)據(jù)處理結(jié)果上是相同的。廣義線性模型在數(shù)據(jù)分析中的應(yīng)用較之于經(jīng)典線性模型可用性更高,處理的結(jié)果也更精細。廣義線性模型的優(yōu)點(1)廣義線性模型對數(shù)據(jù)的要求較為寬泛,經(jīng)典線性回歸模型對于數(shù)據(jù)的要求比較苛刻,只適用與連續(xù)型數(shù)據(jù),而廣義線性模型對于連續(xù)型和離散型的數(shù)據(jù)都適用。(2)廣義線性模型在應(yīng)用的范圍上比經(jīng)典線性回歸模型大了許多。(3)經(jīng)典線性回歸模型僅僅考慮當(dāng)聯(lián)系函數(shù)為恒等函數(shù)時這種特殊情況,但廣義線性模型用聯(lián)系函數(shù)將兩個解釋變量連成一個整體,從而使得整個模型滿足線性關(guān)系。全文總結(jié)和展望

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論