相關(guān)及回歸分析學習教案_第1頁
相關(guān)及回歸分析學習教案_第2頁
相關(guān)及回歸分析學習教案_第3頁
相關(guān)及回歸分析學習教案_第4頁
相關(guān)及回歸分析學習教案_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、相關(guān)及回歸相關(guān)及回歸(hugu)分析分析第一頁,共31頁。MeasureDefineAnalyzeImproveControlq Analyze 概要概要q DATA 收集計劃收集計劃 q Graph 分析分析 q 假設(shè)假設(shè)(jish)檢定概要檢定概要q 平均的檢定平均的檢定 q 分散的檢定分散的檢定q 比率的檢定比率的檢定q 相關(guān)相關(guān)(xinggun)及回及回歸分析歸分析第1頁/共31頁第二頁,共31頁。相關(guān)相關(guān)(xinggun)及回歸分析及回歸分析第2頁/共31頁第三頁,共31頁。定義定義(dngy)(dngy)q 相關(guān)分析相關(guān)分析(Correlation Analysis) : q是把計

2、量型輸出變量和計量型輸入變量之間相關(guān)程度是把計量型輸出變量和計量型輸入變量之間相關(guān)程度(chngd),q利用相關(guān)常數(shù)利用相關(guān)常數(shù)(r)“數(shù)量化數(shù)量化”的技法。的技法。q 回歸分析回歸分析(Regression Analysis) : q導出輸入變量導出輸入變量X和輸出變量和輸出變量Y的函數(shù)關(guān)系,預(yù)測輸出變量的的函數(shù)關(guān)系,預(yù)測輸出變量的q統(tǒng)計性分析技法。統(tǒng)計性分析技法。q 回歸式回歸式(Regression Equation) : q為預(yù)測對應(yīng)的輸出值,利用輸入值的預(yù)測方程式。為預(yù)測對應(yīng)的輸出值,利用輸入值的預(yù)測方程式。第3頁/共31頁第四頁,共31頁。876543210605040302010

3、0-10-20KNOB-1OUT-195% P I95% C IReg res s ionR -Squa red = 0 .941Y = -1 0 .3333 + 7 .75XR e g re s s io n P lo t為什么使用為什么使用(shyng)這樣的工具這樣的工具?所有可能的所有可能的Xsq不防礙工程進行,對工程有意義的 DATA收集可能。q進行DOE時跟加人為的變化比較q相關(guān)關(guān)系是提供Graph分析,輸入變量(binling)和輸出變量(binling)的相關(guān)性計量化而確認。q回歸分析使用于為了管理輸入變量(binling)的預(yù)測式導出。q回歸分析能顯示輸入變量(binling

4、)和輸出變量(binling)之間的因果關(guān)系,所以能決定潛在Xs是否為Vital Few Xs. 第4頁/共31頁第五頁,共31頁。 散點圖散點圖 (Scatter Diagram) qq 相關(guān)相關(guān)(xinggun)分析分析 (Correlation Analysis)在統(tǒng)計學中最有興趣的問題中的一個變量間相關(guān)性分析(fnx)的方法 ,通過散點圖和相關(guān)常數(shù)能分析(fnx)。例例) 智能指數(shù)和學業(yè)成績、吸咽量和肺癌的發(fā)生率、身高和體重、工程溫度智能指數(shù)和學業(yè)成績、吸咽量和肺癌的發(fā)生率、身高和體重、工程溫度(wnd)和和 制品強度、運動量和肺活量間的關(guān)系、所得和消費支出。制品強度、運動量和肺活量間

5、的關(guān)系、所得和消費支出。相關(guān)分析的第一階段,把相互對應(yīng)的資料 用作表平面上的點來表示的Graph,能大概確認兩個變量之間的關(guān)系。 相關(guān)分析相關(guān)分析制品強度 (Y)工程溫度 (X)第5頁/共31頁第六頁,共31頁。 相相關(guān)關(guān)(xinggun)常常數(shù)數(shù) (Correlation Coefficient) 定量表示兩個變量之間線形關(guān)系的指標(zhbio),并不表示函數(shù)關(guān)系。 一般用 表示,其范圍是 1 1. 一般不可知道的正確值,因此使用從Sample中推定的值 r 。22)()()(yyxxyyxxriiii 相相關(guān)關(guān)(xinggun)常常數(shù)數(shù) (Correlation Coefficient)的

6、性的性質(zhì)質(zhì) r 值值(+) 時 陽的相關(guān)關(guān)系() 時 陰的相關(guān)關(guān)系接近于0時,沒有相關(guān)關(guān)系。接近于-1 或1時有強的相關(guān)關(guān)系。相關(guān)分析相關(guān)分析第6頁/共31頁第七頁,共31頁。 散點圖和相關(guān)散點圖和相關(guān)(xinggun)關(guān)系關(guān)系 強的陽的相關(guān)強的陽的相關(guān)(xinggun)關(guān)系關(guān)系 弱的陽的相關(guān)弱的陽的相關(guān)(xinggun)關(guān)系關(guān)系 中間程度的陽的相關(guān)關(guān)系中間程度的陽的相關(guān)關(guān)系 強的陰的相關(guān)關(guān)系強的陰的相關(guān)關(guān)系 弱的陰的相關(guān)關(guān)系弱的陰的相關(guān)關(guān)系 中間程度的陰的相關(guān)關(guān)系中間程度的陰的相關(guān)關(guān)系 相關(guān)分析相關(guān)分析 第7頁/共31頁第八頁,共31頁。q 檢定兩個變量之間存在(cnzi)相關(guān)關(guān)系,并不是一

7、個變量成為q 另一個變量的原因。q 可能會藏在對兩個變量都有影響的第三變量。q 即,兩個變量之間存在(cnzi)相關(guān)關(guān)系的結(jié)論,并不是一個變量q 成為另一個變量的原因。第8頁/共31頁第九頁,共31頁。通過通過(tnggu)下例觀察散點圖和相關(guān)分析。下例觀察散點圖和相關(guān)分析。 廣告費 (10萬) 銷售額 (100萬) 廣告費 (10萬) 銷售額 (100萬)4 9 12 238 20 6 189 22 10 258 15 6 107 17 9 20下面是表示某公司的廣告費用和銷售額之間關(guān)系的資料。 求這公司的廣告費和銷售額的相關(guān)(xinggun)常數(shù)。例題例題(lt)1相關(guān)分析相關(guān)分析第9頁/

8、共31頁第十頁,共31頁。Step 1Work sheet 里里輸輸入入(shr)DATA(Correlation.mtw)Step 2Graph Plot 通過Plot 作成散點圖的結(jié)果,預(yù)測是陽的相關(guān)(xinggun)關(guān)系。( Y 欄里C2, X欄里 輸入(shr)C1) 相關(guān)分析相關(guān)分析第10頁/共31頁第十一頁,共31頁。Step 3Stat Basic Statistics CorrelationStep 4Session 結(jié)結(jié)果果(ji gu)確確認認 選擇兩個選擇兩個(li(lin n )變變量列量列相關(guān)常數(shù)相關(guān)常數(shù)(chngsh)是是 0.853有陽的相關(guān)關(guān)系,有陽的相關(guān)關(guān)系,

9、 p 值為值為 0.002小于小于 留意水準留意水準 0.05,所以廣告費和銷售額的相關(guān)關(guān)系是有影響的。,所以廣告費和銷售額的相關(guān)關(guān)系是有影響的。 相關(guān)常數(shù)相關(guān)常數(shù)p 值值相關(guān)分析相關(guān)分析第11頁/共31頁第十二頁,共31頁。qq 回歸回歸(hugu)分析分析 (Regression Analysis) 為了查明變量之間函數(shù)(hnsh)的相關(guān)性而假定某數(shù)學Model,從已測定變量的Data中 推定其Model的統(tǒng)計性分析方法。根據(jù)這樣的函數(shù)(hnsh)Model,從一個變量的變化 能預(yù)測另一個變量的變化例例) 父親和兒子的身高關(guān)系父親和兒子的身高關(guān)系(gun x) 工程溫度影響的制品強度工程溫

10、度影響的制品強度輸出變量 : 欲預(yù)測的變量,受輸入變量影響的變量。輸入變量 : 影響輸出變量的變量。 (反應(yīng)變量)父親的身高和工程溫度是獨立變量,父親的身高和工程溫度是獨立變量,兒子的身高和制品的強度是從屬變量兒子的身高和制品的強度是從屬變量!回歸分析回歸分析第12頁/共31頁第十三頁,共31頁。 R-Sq值叫決定系數(shù)用 R2表示。 在0 R2 1范圍,總變動中被回歸線說明的變動所占的比率。 R2 值越接近1時,回歸線越高,判斷有意義(yy)。 合理的值是多少? 根據(jù)情況不同?;瘜W者要求的是 0.99程度的R2 值, 但根據(jù)工程和產(chǎn)業(yè)不同。一般值為0.7以上是可以認為輸出變量和 輸入變量的關(guān)系

11、大。 如果R2是0.679(67.9%) ,用回歸方程式能說明散布的67.9%, 剩下的 32.1%是別的原因造成的。q 決定系數(shù)決定系數(shù)(Coefficient of Determination )回歸回歸(hugu)分析分析第13頁/共31頁第十四頁,共31頁。通過下例觀察回歸通過下例觀察回歸(hugu)分析和決定系數(shù)。分析和決定系數(shù)。例題例題(lt)2為了知道機械的使用年度和 整備費用之間有什么(shn me)關(guān)系,得到了有關(guān)對相同機械整備記錄的如下DATA。 3 1 5 8 1 4 2 6 9 3 5 7 2 639 24 115 105 50 86 67 90 140 112 70

12、186 43 126使用年度(年)整備費用(千元)1) 對這個DATA求說明 x與 y之間關(guān)系的單純回歸方程式。2) 使用年度為10年時,整備費用是多少?回歸分析回歸分析第14頁/共31頁第十五頁,共31頁。Step 1Work sheet里里 DATA 輸輸入入(shr)Step 2Stat Regression Regression 選擇選擇(xu(xunz)nz)輸輸出出變變量列量列 選擇輸選擇輸入入(shr)(shr)變變量列量列(Regression.mtw)回歸分析回歸分析第15頁/共31頁第十六頁,共31頁。選擇選擇(xunz)顯示在殘差顯示在殘差Graph的的殘差形態(tài)殘差形態(tài)H

13、istogram of residuals : 殘差Histogram 作成(zuchng)Normal plot of residuals : 為殘差的正規(guī)性檢定而作成(zuchng)GraphResiduals versus fits : 作成(zuchng)殘差和被適合值的圖Residuals versus order : 作成(zuchng)殘差對觀測順序的圖Residuals versus the variables : 作成(zuchng)殘差對指定變量的圖回歸分析回歸分析Residual Plots第16頁/共31頁第十七頁,共31頁。輸入所需的輸入所需的x 值,通過得出的回歸式

14、值,通過得出的回歸式可以求可以求 值和信賴值和信賴(xnli)區(qū)間。區(qū)間。輸入輸入10,能計算出,能計算出10年后的整備年后的整備費用費用(預(yù)測值預(yù)測值)。y 回歸回歸(hugu)分析分析第17頁/共31頁第十八頁,共31頁?;貧w回歸(hugu)分析分析第18頁/共31頁第十九頁,共31頁。Step 3Session結(jié)果結(jié)果(ji gu)確認確認 關(guān)于整備關(guān)于整備(zhngbi)費用和使用年度的回歸式是費用和使用年度的回歸式是決定系數(shù)決定系數(shù)R-Sq 值為值為61%,在全體變動中按回歸,在全體變動中按回歸(hugu)直線直線說明的變動是說明的變動是61%.使用年度使用年度10年的機械的年的機械

15、的整備整備費用費用期待值是期待值是165.48,對其的對其的95% 信賴區(qū)間是信賴區(qū)間是(123.66, 207.29).回歸分析回歸分析xy6.131.29p 值為值為0.001小于留意水準小于留意水準0.05, 所以認為上面的回歸式有意。所以認為上面的回歸式有意。 R-Sq(adj)是在回歸式上每追加變量是在回歸式上每追加變量R-Sq 值就增加的調(diào)整值。值就增加的調(diào)整值。 輸入變量兩個以上時,此值有意義,輸入變量兩個以上時,此值有意義,所以一般分析所以一般分析 R-Sq(adj).第19頁/共31頁第二十頁,共31頁。Step 1Stat Regression Fitted Line Pl

16、ot 選擇選擇(xu(xunz)nz)輸輸出出變變量列量列 選擇輸選擇輸入入(shr)(shr)變變量列量列 回歸模型的類型回歸模型的類型(lixng)決定決定(1次次, 2次次, 3次次)回歸分析回歸分析 Fitted Line Plot : 欲用欲用Graph分析時活用。分析時活用。第20頁/共31頁第二十一頁,共31頁。Step 2Graph 結(jié)結(jié)果果(ji gu)確確認認回歸回歸(hugu)分析分析第21頁/共31頁第二十二頁,共31頁。qq 殘差分析殘差分析(fnx)從實際值中減掉被回歸模型適合(shh)的值叫殘差,通過殘差分析我們要確認模型的適合(shh)性。 殘差分析殘差分析(f

17、nx)-殘差越小,推定的回歸式越準確 說明實際觀測結(jié)果。-殘差是誤差最好的推定值。-殘差按獨立變量的大小順序或者 資料的輸入順序排列時,確認他 們對0對稱 ,不顯示特別的傾向。 殘差iiyyxy10),(iiyx 實際值回歸模型 iiiyye殘差殘差 :第22頁/共31頁第二十三頁,共31頁。例題例題(lt)3為了知道機械的使用年度和整備(zhngbi)費用之間有什么關(guān)系,得到了對相同機械的整備(zhngbi)記錄有關(guān)的如下 Data。得出適合值和殘差后執(zhí)行殘差分析。 3 1 5 8 1 4 2 6 9 3 5 7 2 639 24 115 105 50 86 67 90 140 112 70

18、 186 43 126使用(shyng)年度(年)整備費用(千元)殘差分析殘差分析Step 1Work sheet 里輸入里輸入DATA(Residuals.mtw)第23頁/共31頁第二十四頁,共31頁。Step 2Stat Regression Regression 選擇選擇(xu(xunz)nz)從屬變從屬變量列量列 選擇選擇(xu(xunz)nz)獨獨立立變變量列量列殘差分析殘差分析(fnx) Fits(適合值適合值)Check Residuals(殘差殘差)Check第24頁/共31頁第二十五頁,共31頁。Step 3Work sheet 結(jié)結(jié)果果(ji gu)確確認認 殘殘差和差和

19、適合適合(shh)(shh)值值被被儲儲存。存。Step 4Stat Regression Residual Plots 選擇選擇(xu(xunz)nz)適合適合值值列列 選擇殘差列選擇殘差列殘差分析殘差分析第25頁/共31頁第二十六頁,共31頁。Step 5確認確認(qurn)Graph 殘差分析殘差分析(fnx)第26頁/共31頁第二十七頁,共31頁。 通過Normal Plot of Residuals 數(shù)據(jù)分布接近于對角線,所以(suy)可以說殘差的分布 接近于正態(tài)分布。 ( 通過Stat Basic Statistics Normality Test 更仔細地做到正規(guī)性檢定。) 在I Chart of Residuals中不離開

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論