版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十二章簡單回歸分析(雙變量回歸
simplelinearregression)5/15/2023“回歸”名稱的由來
英國統(tǒng)計(jì)學(xué)家F·Galton(1822——1911年)和他的學(xué)生、現(xiàn)代統(tǒng)計(jì)學(xué)的奠基者之一K·Pearson(1856——1936年)在研究父母身高與其子女身高的遺傳問題時(shí),觀察了1078對(duì)夫婦,以每對(duì)夫婦中父親的身高作為解釋變量X,而取他們的一個(gè)成年兒子的身高作為被解釋變量Y(應(yīng)變量),將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢(shì)近乎一條直線。計(jì)算出的回歸直線方程為:
5/15/2023
Galton數(shù)據(jù)散點(diǎn)圖(英寸)5/15/2023其他類型的散點(diǎn)圖XYXYX00000YXYXYXY5/15/2023回歸分析與相關(guān)分析變量間關(guān)系問題:年齡~身高、肺活量~體重、藥物劑量與動(dòng)物死亡率等。兩個(gè)關(guān)系:依存關(guān)系:應(yīng)變量(dependentvariable)Y隨自變量(independentvariable)X變化而變化?!?/p>
回歸分析
互依關(guān)系:應(yīng)變量Y與自變量X間的彼此關(guān)系———
相關(guān)分析5/15/2023實(shí)例例9-1某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h)如表9-1。估計(jì)尿肌酐含量(Y)對(duì)其年齡(X)的回歸方程。
表9-18名正常兒童的年齡X(歲)與尿肌酐含量Y(mmol/24h)
編號(hào)12345678年齡X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.655/15/20235/15/2023自變量(x):可以精確測(cè)得并嚴(yán)格控制的量。一般變量反應(yīng)變量(應(yīng)變量y):除受x的影響外,還受很多因素的影響,有不確定性,不能一次測(cè)得準(zhǔn)確的結(jié)果。隨機(jī)變量5/15/2023第一節(jié)
簡單線性回歸一、線性回歸的概念及統(tǒng)計(jì)描述例11-15/15/20235/15/20235/15/20235/15/2023兩者的關(guān)系:線性依存關(guān)系。應(yīng)變量y依自變量x變化而變化,但還是波動(dòng)的、隨機(jī)的、不確切的,這種線性依存關(guān)系又叫直線(性)回歸。函數(shù)關(guān)系:確定。例如園周長與半徑:y=2πr
回歸關(guān)系:不確定。例如血壓和年齡的關(guān)系,稱為直線回歸(linearregression)。
5/15/2023有關(guān)y依x的線性依存關(guān)系的數(shù)量表達(dá)式稱為直線回歸方程(linearregressionequation):
回歸模型:
任務(wù):建立直線回歸方程目的:
由一個(gè)變量估計(jì)另一個(gè)變量推廣:多元線性回歸5/15/2023一、
直線回歸方程
一般表達(dá)式:或a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)(X=0)。b:斜率(slope),回歸系數(shù)(regressioncoefficient)。
意義:X每改變一個(gè)單位,Y平均改變b個(gè)單位。
b>0,Y隨X的增大而增大(減少而減少)——斜上;
b<0,Y隨X的增大而減?。p少而增加)——斜下;
b=0,Y與X無直線關(guān)系——
水平。
|b|越大,表示Y隨X變化越快,直線越陡峭。5/15/2023SimpleLinearRegressionModelY的總體均數(shù)自變量Intercept總體截距Slope總體斜率5/15/2023LINE假定xy等方差性,即標(biāo)準(zhǔn)差相當(dāng)(
EQUALSTANDARDDEVIATION)
對(duì)于任何X值,隨機(jī)變量Y的標(biāo)準(zhǔn)差Y|X相等獨(dú)立INDEPENDENCE
每一觀察值之間彼此獨(dú)立y|X=α+x線性LINEARITY
反應(yīng)變量均數(shù)
與X間呈直線關(guān)系
Y|X=α+X二、直線回歸模型的前提假定正態(tài)性
NORMALITY
對(duì)于任何給定的
X,Y服從正態(tài)分布,均數(shù)為
Y|X,標(biāo)準(zhǔn)差為Y|X5/15/20235/15/2023三、回歸方程參數(shù)的估計(jì)
最小二乘法原則(leastsquaremethod):使各實(shí)際散點(diǎn)(Y)到直線()的縱向距離的平方和最小。即使
最小。因?yàn)橹本€一定經(jīng)過“均數(shù)”點(diǎn)5/15/2023最小二乘(Leastsquares)法圖解Yi(Y的估計(jì)值)
=a+bXi
Yi估計(jì)值i殘差i=Yi–估計(jì)值i尋找使S(殘差i)2最小的直線5/15/20235/15/202333LeastSquaresMethodThe“best”lineistheonethatminimizesthesumofsquaredverticaldifferencesbetweenthepointsandtheline.wwww4114(1,2)22(2,4)(3,1.5)Sumofsquareddifferences=(2-1)2+(4-2)2+(1.5-3)2+(4,3.2)(3.2-4)2=6.89Sumofsquareddifferences=(2-2.5)2+(4-2.5)2+(1.5-2.5)2+(3.2-2.5)2=3.992.5LetuscomparetwolinesThesecondlineishorizontalThesmallerthesumofsquareddifferencesthebetterthefitofthelinetothedata.5/15/2023編號(hào)X
YX2Y2XY11.1141.2196
15.421.2131.4169
15.631.0151.0225
15.040.9150.8225
13.5............141.0151225
15.0150.7170.5289
11.9合計(jì)14.72241483369
216.7SXSYSX2SY2SXY回歸參數(shù)估計(jì)值a、b計(jì)算的實(shí)例
5/15/2023回歸參數(shù)a、b的解釋
1. 斜率(b)當(dāng)X每增加1個(gè)單位時(shí),
Y改變b個(gè)單位本例b=6.9802,表明在所研究的凝血酶濃度范圍內(nèi),凝血酶濃度每增加1單位/毫升,凝血時(shí)間增加6.9802
秒2. Y的截距(a)X=0時(shí)Y的平均值5/15/2023四、回歸參數(shù)的假設(shè)檢驗(yàn)b≠0原因:①由于抽樣誤差引起,總體回歸系數(shù)β=0②存在回歸關(guān)系,總體回歸系數(shù)β≠0公式
,υ=n-2Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤
SY|X為Y的剩余標(biāo)準(zhǔn)差——扣除X的影響后Y的變異程度。
(一)
t檢驗(yàn);
(二)
方差分析5/15/2023剩余(殘差)標(biāo)準(zhǔn)差SY|X度量了實(shí)際散點(diǎn)遠(yuǎn)離回歸直線的離散程度,反映了模型的可靠性。越小模型越好。
tb檢驗(yàn),區(qū)間的計(jì)算均需要使用這一值。5/15/2023斜率b的假設(shè)檢驗(yàn)H0:=0H1:
0
.05自由度
8-2=6臨界值:檢驗(yàn)統(tǒng)計(jì)量:Decision:Conclusion:
=.05水準(zhǔn)拒絕H0回歸系數(shù)b有統(tǒng)計(jì)學(xué)意義-2.4469+2.44695/15/2023X5/15/2023Y的離均差平方和的分解5/15/2023幾個(gè)平方和的意義5/15/2023再看公式:5/15/2023SS剩的另一種解法編號(hào)(1)X
Y
(2)(3)(4)(5)=(3)-(4)(6)=(5)21133.543.47130.06870.00472113.013.1929-0.18290.0335393.092.91450.17550.0308462.482.4969-0.01690.0003582.562.7753-0.21530.04646103.363.05370.30630.09387123.183.3321-0.15210.0231872.652.63610.01390.0002合計(jì)7623.8723.8728-0.00280.2328
5/15/2023(二)方差分析5/15/2023五、直線回歸方程的區(qū)間估計(jì)5/15/20235/15/2023(三)的區(qū)間估計(jì)5/15/2023(四)個(gè)體Y值的預(yù)測(cè)區(qū)間5/15/202395%的可信區(qū)間與個(gè)體Y
的預(yù)測(cè)區(qū)間圖5/15/20235/15/2023六、直線回歸方程的應(yīng)用1、描述兩個(gè)變兩間的直線依存關(guān)系2、進(jìn)行預(yù)測(cè)3、進(jìn)行統(tǒng)計(jì)控制5/15/2023區(qū)別:
七、直線回歸與相關(guān)的區(qū)別與聯(lián)系1.資料:②
X、Y服從雙變量正態(tài)分布
①Y為正態(tài)隨機(jī)變量,X為選定變量
2.應(yīng)用:回歸——由一個(gè)變量值推算另一個(gè)變量值
相關(guān)——只反映兩變量間互依關(guān)系
相關(guān)3.回歸系數(shù)與原度量單位有關(guān),而相關(guān)系數(shù)無關(guān)回歸:5/15/2023聯(lián)系:
5/15/2023九、直線回歸與相關(guān)的應(yīng)用注意事項(xiàng)
⑴要有實(shí)際意義
⑵不能任意“外延”⑶繪制散點(diǎn)圖,有無離群值,是否直線(4)回歸直線通過均數(shù)點(diǎn)
5/15/2023第四節(jié)
秩回歸(單調(diào)回歸)
Rank(Mototonic)regression
適用資料:⑴應(yīng)變量Y不服從正態(tài)分布
⑵總體分布類型未知
⑶原始數(shù)據(jù)用等級(jí)表示建立回歸方程方法:對(duì)兩變量按小到大順序分別編秩次,相同秩次取平均秩次,然后對(duì)秩次采用前面回歸分析方法建立回歸方程。
5/15/2023(一)建立秩回歸方程5/15/2023(二)給定X值估計(jì)Y值問題:對(duì)于表9.3數(shù)據(jù),如果死因構(gòu)成(X)占0.5%,那么潛在工作損失年數(shù)構(gòu)成(Y)應(yīng)該是多少?解:將所給定的X值轉(zhuǎn)換成P值X=0.5在X1=0.47與X2=0.65之間,X1與X2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院入住老人遺愿實(shí)施與尊重制度
- 企業(yè)危廢管理制度
- 會(huì)議后續(xù)跟蹤與效果評(píng)估制度
- 2026年公務(wù)員面試備考專項(xiàng)練習(xí)題
- 2026年漢語言文學(xué)研究生入學(xué)試題及經(jīng)典文選分析
- 2026年新版膽管造口合同
- 山西省陽泉市2025~2026學(xué)年度第一學(xué)期期末教學(xué)質(zhì)量監(jiān)測(cè)高二語文試題及參考答案
- 道路施工單位臨時(shí)用電安全隱患排查制度
- 福建省龍巖市2025-2026學(xué)年高一第一學(xué)期2月期末英語試題(含答案含聽力原文無音頻)
- 2025年靈壽縣招教考試備考題庫附答案解析(奪冠)
- 2026國家國防科技工業(yè)局所屬事業(yè)單位第一批招聘62人備考題庫及答案詳解一套
- 2026年湖南工業(yè)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考題庫含答案解析
- 2026年益陽醫(yī)學(xué)高等專科學(xué)校單招職業(yè)技能筆試參考題庫含答案解析
- 中央經(jīng)濟(jì)工作會(huì)議解讀:職業(yè)教育發(fā)展強(qiáng)化
- 兒科肺炎的常見并發(fā)癥及護(hù)理措施
- 貴州省遵義市2023-2024學(xué)年七年級(jí)上學(xué)期期末英語試題(含答案)
- 2026年各地名校高三語文聯(lián)考試題匯編之語言文字運(yùn)用含答案
- 2025 AHA心肺復(fù)蘇與心血管急救指南
- 2026年九江職業(yè)大學(xué)單招職業(yè)適應(yīng)性測(cè)試題庫帶答案詳解
- 護(hù)理細(xì)節(jié)血流動(dòng)力學(xué)
- 露天礦山安全教育培訓(xùn)
評(píng)論
0/150
提交評(píng)論