Miniab系統(tǒng)相關(guān)和回歸_第1頁
Miniab系統(tǒng)相關(guān)和回歸_第2頁
Miniab系統(tǒng)相關(guān)和回歸_第3頁
Miniab系統(tǒng)相關(guān)和回歸_第4頁
Miniab系統(tǒng)相關(guān)和回歸_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

(分析階段)(ZTE-GB402-V1.5)相關(guān)和回歸分析

主要內(nèi)容1.相關(guān)分析2.回歸分析

學習目的變量(X1)與變量(X2)間或X與Y間

-有多少相關(guān)性–相關(guān)分析

-變量間關(guān)系式的推測

回歸分析它們之間有關(guān)系嗎?有多強的關(guān)系?有什么樣的關(guān)系式?

機動車的數(shù)量

vs

交通事故發(fā)生率網(wǎng)板厚度

vs焊膏厚度1.相關(guān)關(guān)系是?相關(guān)關(guān)系可以用數(shù)據(jù)來看出兩個變量(Y與X,或兩個X)間緊密程度如何.兩者之間關(guān)系的強度通過相關(guān)系數(shù)(r)可以計數(shù)化.(Minitab使用Pearsonproductmoment相關(guān)系數(shù))-1.00+1.0負的相關(guān)系正的相關(guān)關(guān)系“r”

弱相關(guān)關(guān)系決定點r值r

接近-1r

接近+1(+)正的相關(guān)關(guān)系()負的相關(guān)關(guān)系接近0時幾乎沒有相關(guān)關(guān)系相關(guān)系數(shù)的性質(zhì)為調(diào)查相關(guān)關(guān)系,需要數(shù)據(jù)構(gòu)造為成對的2個變量數(shù)據(jù)相關(guān)系數(shù)(CorrelationCoefficient)

一般表示為(總體的相關(guān)關(guān)系),其范圍是11.

一般情況下我們無法知道的正確的值,因此使用從樣本推斷的值r.r從如下公式得出且范圍是-1r1.一般樣本大小(30個以上)為基準

如果|r|>0.80時具有強的相關(guān)關(guān)系

如果0.3>|r|>0.80時具有弱的相關(guān)關(guān)系.

如果|r|<0.30時認為沒有有效的關(guān)系.相關(guān)公式強的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r

|=0.936|r

|=0.560|r

|=0.3390強的負相關(guān)弱的負相關(guān)中間程度的負相關(guān)相關(guān)的類型和大小判斷相關(guān)類型…對結(jié)果

Y影響最大的因子,可從點的密集程度判斷

單純通過散點圖分析相關(guān)關(guān)系時不客觀,因此需要客觀的分析,即可看出相關(guān)程度的指數(shù)(相關(guān)系數(shù)計算方法等)

相關(guān)系數(shù)計算方法是從直線的觀點進行分析.

曲線關(guān)系時,如果以相關(guān)系數(shù)方法計算時會出現(xiàn)錯誤的結(jié)果.相關(guān)并不是分析所有的因果關(guān)系!即使證明Y與

X間具有相關(guān),也并不意味著Y的變動一定是X的變動引起的.可能存在引起X與Y同時變動的第3個隱藏變量.

兩個變量間有關(guān)系的結(jié)論并不意味著因果關(guān)系.且樣本相關(guān)系數(shù)的值接近“0”表示

兩個變量間直線關(guān)系弱

,并不意味著兩個變量間沒有關(guān)系.相關(guān)的濫用與誤用事例分析單板生產(chǎn)過程中,刮刀壓力可能會影響到焊膏的厚度,為了了解刮刀壓力和焊膏厚度的關(guān)系.為此我們進行幾次實驗后得出如下資料.求此資料的散點圖及總體的相關(guān)系數(shù).

打開

A_08.mtw.Stat>BasicStatistics>Correlation從上上面面點點來來看看,可可以以猜猜測測有有強強的的相相關(guān)關(guān)關(guān)關(guān)系系分析析結(jié)結(jié)果果根根據(jù)據(jù)刮刀刀壓壓力力和和焊焊膏膏厚厚度度的的相相關(guān)關(guān)系系數(shù)數(shù)為為r=0.955,可看看出出具具有有強強的的負負相相關(guān)關(guān).從上上述述結(jié)結(jié)果果可可以以得得出出:為為了了保保證證焊焊膏膏厚厚度度符符合合要要求求.必須監(jiān)控控刮刀的的壓力.統(tǒng)計分析析結(jié)果解釋釋事例分析析下面給出出13家家上市公公司的每每股賬面面價值和和每股紅紅利,以以1.賬面面價值作作為橫軸軸,畫散散點圖2.計算算相關(guān)系系數(shù)并解解釋公司名稱賬面價值紅利海爾22.442.40中興23.542.98深科技22.092.06深發(fā)展14.481.09清華同方20.731.96上海一汽19.251.55第一鉛筆20.732.16陜西旅游26.431.60云南白藥12.140.8粵電力23.311.94北大方正16.233.00深彩虹18.051.80咸陽偏轉(zhuǎn)12.451.21從散點圖圖我們可可以看出出什么??相關(guān)系數(shù)數(shù)可以看看出什么么?通過它我我們可以以知道哪哪個輸入入對輸出出值有多少影影響?為了得到到想要的的輸出值值,我我們應按按什么水水平管理X的規(guī)格.回歸…尋尋找“Y”與““X”關(guān)關(guān)系的方方法什么是回回歸?描述“Y”與與“X””關(guān)系的的數(shù)學方方法--創(chuàng)建建過程的的“模型型”。2.回歸分析析相關(guān)是告告訴關(guān)系系的程度度,回歸歸分析是是找出Y=F(X)的函數(shù)關(guān)關(guān)系式回歸分析析的種類類單純回歸歸模型:獨立變變量為一一個多重回歸歸模型:獨立變量量為兩個個以上例Y=a+bx1+cx2+dx3單純線性性回歸模模型:設設定直線線關(guān)系后后分析例Y=a+bx曲線回歸歸模型:設定曲線線關(guān)系后后分析例Y=a+bx+cx2+dx3Y=abx單純線性性回歸回歸分析析的階段段Data收集用散點圖圖確認關(guān)關(guān)系用最小二二乘法推斷總體體進行方差差分析畫直線(LineFitting)分析殘差差此章的因因子為一一個,因因子和輸輸出值(Y)的關(guān)系為為直線關(guān)關(guān)系的單單純線性性回歸(SimpleLinearRegression)通過樣本本推測的的直線未知的真真實直線線Yi=+xi+i(i=1,.…,n)i是相互獨獨立的遵守N(0,2)的概率變變量單純線性性回歸模模型εiei(xi,yi)xy在這里,εi~iidN(0,σ2)Model定義一個獨立立變量(x)與一個從屬屬變量(Y)間的關(guān)系系方程式化化后顯示示的方法法將誤差平平方和最最小化的的推斷方方法,找找出將殘殘差平方方最小化化的直線線.420410400390380370360350340330320350400450獨立變量從屬變量最小平方方和的單單純回歸歸單純回歸歸直線與回歸直直線的差異(誤誤差)直線是以以“最小小平方和和推斷法法(leastsquareestimation)””的原則畫出出的.從從資料的的點到直直線的距離的的平方和和最小化化.ebScatterPlotYvs.XwithFittedLineY=a+bX直線的方方程式是是Y=a+bXa是常數(shù),b是斜率.“擬合線”是包括實實際點和和直線的的平方差的和和最小化化后形成成的直線線.實際資料料的點和和直線的的差異稱稱為殘差(residuals(e)).擬合線,回歸方方程式構(gòu)構(gòu)造殘差(e)是對誤差差的最佳佳推斷值值,是實實際結(jié)果果值和回回歸方程程式推測測的最佳佳值間的的差異.殘差:實際觀測測值(yi)和推測值值的的差殘差越小小推斷的的回歸式式更能說說明實際際結(jié)果,殘差是是誤差的的最好的的推斷值值.殘差按大大小排列列或按資資料的順順序排列列時,它它們以““0”為為軸相對對稱,并并且不能能存在特別的傾傾向.大家用MINITAB對上述數(shù)數(shù)據(jù)進行行回歸分分析.打開:A13.mtw.下面是對對硅膠強強度有重重要影響響的SiO2使用量的關(guān)系的的分析數(shù)數(shù)據(jù).事例分析析Graph>Plot從散點點圖看看似乎乎有一一定相相關(guān)性性!!!那么要要進一一步分分析有有多少少相關(guān)關(guān)性...Stat>Regression>Regression回歸方方程式式方差分分析s:殘差(誤差差)的的標準準差。。殘差差為觀觀測值值-預預測值值。換換句話話說,,指觀觀測點至至回歸歸方程程式中中描述述的擬擬合線線的距距離。。(對對于優(yōu)優(yōu)秀的的模型型,此值應應較小小)s=MS(error)1/2R-Sq:由擬合線線能夠夠“解解釋釋”的的總變變差的的百分分數(shù)。。由““X””解釋釋的變變差。。(對于于優(yōu)秀秀的模模型,,此值值應較大)R-Sq(adj):對過于擬擬合情情況(方程程式中中的變變量過過多)的調(diào)調(diào)整,,它將將包括括模型中中的項項數(shù)與與觀測測值的的個數(shù)數(shù)進行行對比比其中n=觀測值值數(shù)量量p=模型中中項數(shù)數(shù),包包括常常數(shù)判斷的的方法法New“X”變量的的p值值-速度Ho:斜率=0H1:斜率=0或者,,另一一種表表達方方式::Ho:““X””不顯著著H1:““X””顯著常數(shù)的p-值H0:直線通通過原原點(0,0)…(0硬硬度=0使使用量量)H1:直線不不通過過原點點(0,0)…結(jié)果判判斷R2越大,,模型型對工工序模模擬得得越好好NewSSregression:由模型型中的的“X”解解釋釋變量量“Y”的的變動動每一X值對對應的的模型型預測測值和和Y的的總平平均值值之差的平方和和。SSerror:未被解釋的“Y”的的變差。每每個數(shù)據(jù)點點的Y觀測測值和該數(shù)數(shù)據(jù)點Y的的預測值之之差的平方方和。值越小越好。。SStotal:Y值相對其平均值的總總變差。結(jié)果判斷回歸項(的SS和MS)應比誤差項的(SS和MS)大通過查看R-Sq,R-Sq(adj),s和p值來來評估模型型p-值應<0.05,以表示示統(tǒng)計顯著性性(良好擬合合的方程式式)NewStat>Regression>FittedLinePlot(擬合線)R-sq值稱為決定定系數(shù),用用R2表示,范圍圍是0R21,R2越接近1時可以說明明越接近回歸線.Stat>Regression>FittedLinePlot殘差分析StorageOprion中選擇Residual和Fits時,可得出出如下數(shù)據(jù)據(jù).Stat>Regression>ResidualPlots(殘差圖表)殘差具有多多少正態(tài)性性條狀圖是鐘鐘型的曲線線嗎?要無視(<30)以以下的資料料.個別殘差能能看出多少少傾向?或異常常點?是否沒有傾傾向,對““0”是隨機的?回歸分析結(jié)結(jié)果解釋SiO2的使用量(X)與強度(Y)間的推斷回回歸式是強度(Y)=3.07+6.9SiO2使用量(X).且兩個變量量回歸系數(shù)數(shù)為72%,可以說說具有強的的關(guān)系.(使用Adj.R-sq)即,用上述述回歸直線線可以說明明的變動量量為72%.觀察方差分分析表回歸相關(guān)警警告-圖圖表!!!R-Sq.66.2%R-Sq.66.2%R-Sq.66.2%R-Sq.66.2%對4個不同同的資料群群從基本統(tǒng)統(tǒng)計結(jié)果來來看似乎一一樣,但期期間很明顯顯有差異.總是要用一一種以上的的方法來看看!!!不要忘記憶憶原始資料料(rawdata)!!!→→畫散點圖!!!相關(guān)與回歸歸的概要相關(guān)分析可可以作為非非常有用的的工具活用用于實際生生活中.相關(guān)關(guān)系是是看出兩個個連續(xù)型變變量間相關(guān)關(guān)性的尺度度假定因果關(guān)關(guān)系時需要要更加注意意.回歸模型將將變量間的的關(guān)系顯示示為線型或或非線型函函數(shù).回歸分析可可以從回歸歸式預測期期望值.您相信我們們的家電所所占據(jù)的展展示廳面積積的大小會會影響銷售售量。您已已經(jīng)收集了了過去12個月內(nèi),,多個零售售點銷售量量與總的占占地面積方方面的數(shù)據(jù)據(jù)?,F(xiàn)在,,您希望分分析這些數(shù)數(shù)據(jù),看占占地面積是是否確實實與年年銷銷售售量量存存在在某某種種關(guān)關(guān)系系。。應用用所所學學的的單單變變量量回回歸歸方方法法。。準準備備解解釋釋您您的的答答案案、、以以及及支支持持您您的的結(jié)結(jié)論論的的結(jié)結(jié)果果。。($K)(平方方英英尺尺)New分析析階階段段總總結(jié)結(jié)如果果我我們們的的數(shù)數(shù)據(jù)據(jù)量量比比較較大大,,采采集集數(shù)數(shù)據(jù)據(jù)非非常常容容易易時時,,我我們們可可以使使用用描描述述型型的的統(tǒng)統(tǒng)計計工工具具進進行行分分析析。。1.如如果果想想知知道道變變量量的的分分布布形形狀狀、、平平均均值值的的位位置置、、離離散散程程度度、、傾傾斜斜度度、、峰態(tài)態(tài)等等具具體體的的統(tǒng)統(tǒng)計計信信息息,,可可以以用用DisplayDescriptiveStatistics工具具來來分分析析.2.如如果果我我們們想想知知道道變變量量分分布布形形狀狀、、均均值值的的大大概概位位置置、、離離散散的的程程度度的的粗粗略信信息息時時,,我我們們可可以以用用Histogram、MultipleDotplot等工工具具分分析析.3.如如果果我我們們要要比比較較兩兩個個變變量量或或者者想想知知道道在在不不同同““條條件件””下下變變量量發(fā)發(fā)生生什什么么樣的的變變化化時時,,我我們們可可以以用用Boxplot、MultipleDotplot工具具來來分分析析.New4.如如果果我我們們想想知知道道變變量量之之間間的的相相互互關(guān)關(guān)系系時時,,可可以以使使用用Scatterplot、Marginalplot(兩個個變變量量之之間間的的關(guān)關(guān)系系))和和Matrixplot(多個個變變量量之之間的的相相互互作作用用)).5.如如果果我我們們想想知知道道隨隨著著時時間間變變化化,,變變量量怎怎樣樣變變化化時時可可以以使使用用Timeseriesplot進行行分分析析.6.如如果果我我們們要要知知道道多多個個輸輸入入變變量量((X))對輸輸出出變變量量((Y)的影影響響程程度度,,可可以以使用用Multi-VariChart、MainEffectsPlot進行行分分析析.7.如如果果我我們們要要知知道道不不良良品品,缺缺陷陷數(shù)數(shù),爭爭議議點點,事故故的的現(xiàn)現(xiàn)象象或或原原因因等等集集中中在在哪哪些方方面面的的時時候候,,可可以以使使用用Paretochart、Piechart進行行分分析析.New如果果我我們們的的數(shù)數(shù)據(jù)據(jù)量量比比較較小小,,采采集集數(shù)數(shù)據(jù)據(jù)非非常常難難,,我我們們可可以以使使用假假設設檢檢驗驗工工具具對對均值值進行行分分析析。。一、、我我們們涉涉及及的的數(shù)數(shù)據(jù)據(jù)是是連連續(xù)續(xù)性性的的數(shù)數(shù)據(jù)據(jù)時時1.如如果果我我們們想想知知道道一一個個變變量量跟跟一一個個基基準準值值是是否否在在統(tǒng)統(tǒng)計計意意義義上上有有顯顯著著性性差差異的的時時候候((也也就就是是判判斷斷這這個個變變量量是是否否發(fā)發(fā)生生了了異異常常原原因因的的波波動動)),,可可以以使用用1samplet工具具分分析析.2.如果果我我們們想想知知道道兩兩個個變變量量或或者者兩兩種種水水平平下下是是否否在在統(tǒng)統(tǒng)計計意意義義上上有有顯顯著著性性差異異的的時時候候,,可可以以使使用用2samplet、Pairedt工具具分分析析.3.如如果果我我們們要要比比較較多多個個變變量量或或者者一一個個變變量量在在多個個水水平平下下是是否否有有顯顯著著性性差差異時時,可可以以用用ANOVA工具具來來分分析析.New二、、我我們們涉涉及及的的數(shù)數(shù)據(jù)據(jù)是是離離散散型型的的數(shù)數(shù)據(jù)據(jù)時時1.如如果果我我們們想想知知道道一一個個變變量量跟跟一一個個基基準準值值是是否否在在統(tǒng)統(tǒng)計計意意義義上上有有顯顯著性性差差異異的的時時候候((也也就就是是判判斷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論