六西格瑪培訓(xùn)-分析階段_第1頁
六西格瑪培訓(xùn)-分析階段_第2頁
六西格瑪培訓(xùn)-分析階段_第3頁
六西格瑪培訓(xùn)-分析階段_第4頁
六西格瑪培訓(xùn)-分析階段_第5頁
已閱讀5頁,還剩137頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、六西格瑪培訓(xùn),六西格瑪總覽,分析階段總覽 Analyze Phase Overview,分析階段總覽,分析階段任務(wù),排列出所有的Xs重要性的優(yōu)先次序,用魚刺圖列出所有可能的導(dǎo)致變異的因素Xs 用圖形分析初步列出各個Xs的優(yōu)先次序,選出少數(shù)關(guān)鍵Xs,用數(shù)據(jù)和統(tǒng)計分析來分析Xs 確定關(guān)鍵少數(shù)的Xs,量化財務(wù)機(jī)會,去除財務(wù)分析中的水分 估算改善流程的成本,分析階段總覽,分析階段工具,圖形工具 Graphical Tools,圖形工具,目錄,目的 抉擇工具 流程輸出工具 Y和Xs - 多點(diǎn)圖Multiple Dot Plots - 多箱線圖Multiple Box Plots - 散點(diǎn)圖Scatter

2、 Plot - 矩陣圖Matrix Plot - 多變量圖Multi-Vari Chart 圖形工具總結(jié),圖形工具,目的,使用圖形來分析收集的數(shù)據(jù) 示范和練習(xí)Minitab的圖形工具 分析圖形所表達(dá)的意義 學(xué)習(xí)各種不同圖形工具分別適用于何種數(shù)據(jù)類型,圖形工具,當(dāng)前流程的知識,測量,Y = f(x),X,1,X,2,X,3,X,4,分析,重要的原因Xs,到目前為止,你應(yīng)該有許多可能的X 現(xiàn)在,你可以用圖形工具來分辨出潛在的重要X, 并檢驗(yàn)X與Y之間是否有關(guān)系。,判斷“重要的X”,圖形工具,抉擇工具,改進(jìn)抉擇,圖形工具,時間序列圖,運(yùn)行圖,散點(diǎn)圖,多變量圖,點(diǎn)圖,直方圖,箱線圖,博拉圖,卡方檢驗(yàn),

3、單樣本t檢驗(yàn),雙樣本t檢驗(yàn),方差分析,變方檢驗(yàn),假設(shè)檢驗(yàn),圖形工具,抉擇圖形工具,點(diǎn)圖 直方圖 箱線圖 正態(tài)概率圖,餅圖 博拉圖,Y的圖形,點(diǎn)圖 直方圖 箱線圖 多變量圖,博拉圖,Y和X的圖形,時間序列圖 運(yùn)行圖 散點(diǎn)圖 擬合線圖,時間序列圖 運(yùn)行圖,Y,連續(xù),離散,離散,X,連續(xù),圖形工具,小結(jié),得到數(shù)據(jù)后,總是首先使用圖形工具畫出圖 該使用哪種工具?- 所有的工具 對圖作出清晰的注釋 - 標(biāo)題 - 坐標(biāo)軸標(biāo)識和單位 - 圖例 - 數(shù)據(jù)來源 - 時間范圍 - 特殊原因、事件和注釋 清楚地表達(dá)發(fā)生了什么狀況和沒發(fā)生什么?,加速變革流程 CAP-Change Acceleration Proce

4、ss,加速變革流程,實(shí)施變革,變革成功,CAP提供文化變革的工具促成變革成功,工作品質(zhì) (技術(shù)),接受度(文化),加速變革流程,領(lǐng)導(dǎo)變革 由最高領(lǐng)導(dǎo)者發(fā)動改革,領(lǐng)導(dǎo)變革,創(chuàng)造共需,必須變革的理由?在組織中逐漸灌輸、廣泛溝通。務(wù)必使變革的需求大于阻力。,塑造愿景,對變革的結(jié)果有共同的期待。愿景必須清晰、合理合情合法、廣泛地理解、分享。,加速變革流程,加速變革流程,加速變革流程,領(lǐng)導(dǎo)變革,激勵承諾,激發(fā)關(guān)鍵人物對變革的承諾并且熱情參與。創(chuàng)造成效,從而吸引/獲得高層領(lǐng)導(dǎo)重視。,鞏固成果,變革一旦展開,勢必在組織中衍生出持續(xù)的辛苦、榮耀、知識。,監(jiān)控進(jìn)度,設(shè)立進(jìn)度指標(biāo)并指定負(fù)責(zé)人確保進(jìn)度。設(shè)立標(biāo)桿并予

5、以實(shí)現(xiàn)。,改變組織架構(gòu) 使改革成為在組織中正常運(yùn)作的一部分,加速變革流程,創(chuàng)造共需,著眼點(diǎn),使改革團(tuán)隊(duì)和重要成員對變革的必要性和合理性產(chǎn)生 共識 清楚地界定出倘若不進(jìn)行變革所將遭遇的危機(jī) 清楚地界定出進(jìn)行變革所將得到的轉(zhuǎn)機(jī),加速變革流程,創(chuàng)造共需,使得變革出軌的潛在原因,誤以為變革的必要性是顯而易見的 未把變革的必要性做合理的陳述 誤把“未能確認(rèn)變革的重要性的人”當(dāng)成是個別的問題,加速變革流程,創(chuàng)造共需,威脅 VS.機(jī)會 矩陣,短期,長期,威脅 如果不變,機(jī)會 如果變,使用時機(jī):,把變革的必要性以威脅VS.機(jī)會和短期VS.長期來陳述,加速變革流程,創(chuàng)造共需,工具 3D矩陣,使用時機(jī): 建立“溝

6、通變革的必要性”的策略,方法,策略,內(nèi)部資訊 外部資訊 參訪,優(yōu)良范例 典范工作,變革領(lǐng)導(dǎo)力 樹立高標(biāo)準(zhǔn),加速變革流程,塑造愿景,著眼點(diǎn),對期望的變革結(jié)果做清晰陳述 陳述應(yīng)該:,簡單而直接 用動詞描述 激勵打氣 共同體會、彼此分享,用動詞描述愿景可以幫助團(tuán)隊(duì)贏得承諾,識別阻力源,多一些什么 少一些什么,激勵承諾,著眼點(diǎn),主導(dǎo)運(yùn)作方向,承諾支持者的聯(lián)盟 確定潛在的阻力 轉(zhuǎn)換關(guān)鍵利益相關(guān)者的利益 由障礙轉(zhuǎn)為支持,加速變革流程,加速變革流程,激勵承諾,關(guān)鍵人物對變革的支持度分析 范例,步驟:1. 頭腦風(fēng)暴,列出重要成員,并且用“”標(biāo)出目前的狀態(tài) 2. 用“”標(biāo)出目標(biāo) 3. 計劃執(zhí)行,加速變革流程,鞏

7、固成果,著眼點(diǎn),持續(xù)的、可見的、有形的強(qiáng)化變革 把新變革項(xiàng)目和原有的工作整合 改變組織架構(gòu),使變革成為在組織中正常 運(yùn)行的一部分,唯有把鞏固成果的工作完成之后變革才得以持續(xù),加速變革流程,鞏固成果,改變組織架構(gòu),考評和獎勵 用人 有效的溝通 資訊系統(tǒng) 資源分配 組織架構(gòu),加速變革流程,鞏固成果,用人流程,制定變革策略,勝任?,外部?,內(nèi)部?,加速變革流程,監(jiān)控進(jìn)度,著眼點(diǎn),對變革效果以可觀察、可測量的方式評核 初始以及各階段變革結(jié)果都納入追蹤考評并 廣泛告知 蓄勢 當(dāng)成果逐漸展現(xiàn),加速變革流程,監(jiān)控進(jìn)度,確保對變革目標(biāo)認(rèn)同的一致性 把目標(biāo)轉(zhuǎn)化為簡單、直接、可測量的結(jié)果和行為 認(rèn)同對目標(biāo)所設(shè)的里

8、程碑 指派負(fù)責(zé)人 確認(rèn)目前所收集的監(jiān)控進(jìn)度數(shù)據(jù)的實(shí)用性 確定新數(shù)據(jù)的收集,假設(shè)檢驗(yàn) Hypothesis Testing,假設(shè)檢驗(yàn),目錄,假設(shè)檢驗(yàn)背景知識 - 總體和樣本 - 平均值的不確定性 - 從樣本得到的結(jié)論 置信區(qū)間法 P值法 假設(shè)檢驗(yàn) - 單樣本t檢驗(yàn) - 雙樣本t檢驗(yàn) - 變方檢驗(yàn) - 方差分析 - 卡方檢驗(yàn) 小結(jié),假設(shè)檢驗(yàn),目的,假設(shè)檢驗(yàn)就是檢查你的X是否對Y有(統(tǒng)計上的)顯著 影響 介紹兩種方法來評估樣本: 置信區(qū)間和P值 區(qū)分“統(tǒng)計上的顯著影響”和“實(shí)際的重要性”之間的 差別 Minitab練習(xí),假設(shè)檢驗(yàn),為什么要使用假設(shè)檢驗(yàn),為了改善流程,我們需要分辨出哪些因素影響平均值和

9、 標(biāo)準(zhǔn)差 一旦我們分辨出這些因素,就要調(diào)節(jié)它來改善,并且要 追蹤改善成效 倘若用圖形不能作出判斷就用假設(shè)檢驗(yàn)來客觀判斷是 否有不同,用假設(shè)檢驗(yàn)可以作出一致的判斷,假設(shè)檢驗(yàn),當(dāng)圖不夠時,當(dāng)圖形顯現(xiàn)的信息不明顯時,我們使用假設(shè)檢驗(yàn)來判斷 判斷兩組數(shù)據(jù)的差別是真有其事,還是巧合,是否有統(tǒng)計上的顯著性,或者僅僅是偶然性,假設(shè)檢驗(yàn),總體,總體 全部對象 舉例 2003年5月在精密鑄造車間生產(chǎn)的所有一級渦輪葉片,參數(shù) 描述總體特性 characteristic的“真值”,總體的參數(shù)通常難以得到,假設(shè)檢驗(yàn),樣本,樣本sample 是總體的一部分或 子集 統(tǒng)計量statistic 是描述樣本特性 的數(shù)值,特定

10、的樣本有其特定的統(tǒng)計值,但是樣本之間會不同,假設(shè)檢驗(yàn),有罪 VS. 無罪,基本假設(shè) Ho:無罪 對立假設(shè) Ha:有罪,司法系統(tǒng)判定一個人有罪需要足夠的有罪證據(jù),沒有證據(jù)證明有罪,則無罪。人們不需要提出無罪的證據(jù)。,基本假設(shè)(Ho) 人都沒有罪 (假設(shè)自然成立) 對立假設(shè)(Ha) 需要有力的證據(jù)證明被告有罪,假設(shè)檢驗(yàn) 找到有力的證據(jù)來拒絕基本假設(shè)而采用對立假設(shè)。 簡單地說:我們有明顯的證據(jù)表明有不同的事情發(fā)生,假設(shè)檢驗(yàn),評價決策錯誤,無罪,有罪,實(shí)情,判決,自由,入獄,Ho,Ha,Ho,Ha,假設(shè)檢驗(yàn),決策錯誤評估,Ho,Ha,實(shí)情,Ho,Ha,接受,1- = 系統(tǒng)有多大的能力將好的放行,1-

11、= 系統(tǒng)有多大的能力將不好的找出來,風(fēng)險:當(dāng)Ho為真時,拒絕Ho 稱為廠商風(fēng)險 風(fēng)險:當(dāng)Ho為假時,接受Ho 稱為消費(fèi)者風(fēng)險,假設(shè)檢驗(yàn),怎么用假設(shè)檢驗(yàn),首先描述你的假設(shè):,描述一個假設(shè),稱為基本 假設(shè)(或零假設(shè))Ho 例如: - 擊中目標(biāo) - 相同 - 無變化,描述它的對立面,稱為對立 假設(shè)Ha 事情是: - 沒有擊中目標(biāo) - 不同 - 有變化,收集數(shù)據(jù)并解決結(jié)果,沒有發(fā)現(xiàn)統(tǒng)計的不同,不像是關(guān)鍵的X,或者需要更多的數(shù)據(jù)來確認(rèn),找到統(tǒng)計的不同,數(shù)據(jù)說明這是關(guān)鍵的X,可作為下一步的研究,假設(shè)檢驗(yàn),連接真實(shí)世界,實(shí)際問題,用實(shí)際術(shù)語描述實(shí)際問題,統(tǒng)計問題,用統(tǒng)計術(shù)語描述實(shí)際問題 (Ho, Ha),統(tǒng)

12、計結(jié)果,p:不能拒絕Ho,實(shí)際問題,用實(shí)際術(shù)語描述結(jié)果,問題解決 流程,假設(shè)檢驗(yàn),置信區(qū)間法 (CI),樣本的平均值是總體平均值的最好估計 總體的平均值與樣本的平均值 - 可能會有些許不同 - 但不會有極大的不同,樣本,1,2,3,4,5,6,7,8,9,10,95%置信區(qū)間,總體的真值,區(qū)間不包含總體的真值,以置信區(qū)間(CI)界定統(tǒng)計參數(shù)的不確定范圍,假設(shè)檢驗(yàn),圖示置信區(qū)間,60,X = 60.07,60,X = 62.35,我們開始時假設(shè) 我們擊中目標(biāo): Ho:=60,我們尋找樣本證據(jù) 支持對立假設(shè)Ha: Ha:60,置信區(qū)間包含Ho,沒有統(tǒng)計的不同,置信區(qū)間不包含Ho,有統(tǒng)計的不同,假設(shè)

13、檢驗(yàn),改變一下觀點(diǎn),60,假如我們收集了一些投石距離數(shù)據(jù),計算它的均值是66.0,Ho:=60,好像偏離了目標(biāo)?,X,66.0,60,Ho:=60,好像偏離了目標(biāo)?,X,60.5,另一方面,假如它的均值是60.5,假設(shè)檢驗(yàn),P值方法,60,畫一條線 線的左邊 打中目標(biāo),不 需調(diào)整 線的右邊 未打中目標(biāo), 需要調(diào)整,Ho:=60,X,66.0,X,60.5,X,?,如果打的點(diǎn)在紅色的區(qū)域內(nèi),應(yīng)該說:瞄準(zhǔn)的目標(biāo)已不是60,這句話不正確的概率小于5%,需要調(diào)整,不要調(diào)整,P=0.05,X,60,總面積為1,假設(shè)檢驗(yàn),P值方法,我們開始時假設(shè) 我們擊中目標(biāo): Ho: =60,不要調(diào)整,P=0.43,6

14、0,我們尋找樣本證據(jù) 支持對立假設(shè)Ha: Ha: 60,需要調(diào)整,P=0.02,60,假設(shè)檢驗(yàn),P值,Ho,Ha,實(shí)情,Ho,Ha,接受,P值大于等于0.05,沒有足夠的證據(jù)推翻基本假設(shè),P值小于0.05,有足夠的證據(jù)推翻基本假設(shè), 對立假設(shè)成立。 換句話說:有顯著的不同,P值,假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)的步驟,假設(shè)檢驗(yàn)流程 - 描述基本假設(shè) 假設(shè)都一樣 - 描述對立假設(shè) 不同、不等、小于 - 選擇假設(shè)檢驗(yàn)的方式 - 收集數(shù)據(jù) - 計算置信區(qū)間或P值 - 解釋結(jié)果,好消息 - Minitab將替你計算P值,P值0.05,表示有統(tǒng)計的不同,對立假設(shè)成立,假設(shè)檢驗(yàn),統(tǒng)計顯著性和實(shí)際重要性,LSL = 4.

15、4,USL = 4.7,A,= 4.58,B,= 4.62,P值 = 0.021 0.05 發(fā)現(xiàn)有統(tǒng)計的不同,假設(shè)檢驗(yàn)決定你收集的 樣本之間是否有(統(tǒng)計 上的)不同 如果有大量的數(shù)據(jù),或 者數(shù)據(jù)之間的變異很小, 假設(shè)檢驗(yàn)可以檢驗(yàn)出樣 本之間很小的差異 當(dāng)發(fā)現(xiàn)樣本間有統(tǒng)計上 得不同,這種不同未必 意味實(shí)際上得嚴(yán)重性,假設(shè)檢驗(yàn)只顯示統(tǒng)計上的不同,而你要決定這種不同是否真的重要,假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)方法,比較目標(biāo)均值,比較兩個均值,比較兩個以上均值,比較多個方差,比較離散數(shù),假設(shè)檢驗(yàn),單樣本t檢驗(yàn),1-Sample t-Test比較均值是否等于目標(biāo)值,當(dāng)你有一組連續(xù)型的數(shù)據(jù),你想檢查這組數(shù)的均值是否與

16、指定的值(目標(biāo))相同,假定:,Ho: = 目標(biāo),Ha: 目標(biāo),當(dāng)P值0.05時,則斷定:樣本與指定值不同,假設(shè)檢驗(yàn),例1 單樣本t檢驗(yàn),部門經(jīng)理設(shè)立了一個目標(biāo):處理發(fā)票的時間是14天。你有30份最近的處理發(fā)票天數(shù)的數(shù)據(jù),請判斷一下現(xiàn)在是否是在要求的時間處理了發(fā)票,并判斷流程是否要改善。,流程要改善嗎?,總是首先畫圖!- 你能否得出結(jié)論? 描述基本假設(shè)和對立假設(shè):,Ho: = 14天,Ha: 14天,假設(shè)檢驗(yàn),說明結(jié)果,發(fā)票處理天數(shù)點(diǎn)圖,由于P=0.0430.05,所以處理發(fā)票的時間不是14天,假設(shè)檢驗(yàn),Minitab練習(xí),你的投石器團(tuán)隊(duì)打了15發(fā),均值是60.55。 你能判定你瞄準(zhǔn)的目標(biāo)是60

17、嗎?,60,60.55,距離,你的投石器需要調(diào)整嗎?,假設(shè)檢驗(yàn),Minitab結(jié)果 單樣本t檢驗(yàn),由于P值大于0.05,所以沒有足夠的證據(jù)表明投石的平均距離與目標(biāo)值60有顯著的不同,依據(jù)表面信息決定重新瞄準(zhǔn)只會增加流程的分散性,假設(shè)檢驗(yàn),雙樣本t檢驗(yàn),2-Sample t-Test比較兩組樣本均值是否相等,當(dāng)你有兩組連續(xù)型的數(shù)據(jù),你想檢查這兩組數(shù)是否來自兩個不同的總體,假定:,Ho: 1 = 2,Ha: 1 2,當(dāng)P值0.05時,則斷定:兩組樣本分別來自不同的總體,假設(shè)檢驗(yàn),例2 雙樣本t檢驗(yàn),一臺鉆床的鉆頭在新的時候和6個月后分別測量它加工孔的直徑,你懷疑機(jī)器需要停下來維修。但這將可能耽誤產(chǎn)

18、品的發(fā)運(yùn)并增加成本。,設(shè)備的能力隨時間改變了嗎?,總是首先畫圖!- 你能否得出結(jié)論? 描述基本假設(shè)和對立假設(shè):,Ho: new = 6months,Ha: new 6months,假設(shè)檢驗(yàn),觀察結(jié)果,新的,6個月后,鉆孔直徑直方圖,由于P=0.0000.05,所以鉆床在新的與6月后鉆孔的直徑的均值統(tǒng)計上有不同,假設(shè)檢驗(yàn),Minitab練習(xí) 雙樣本t檢驗(yàn),你的投石器團(tuán)隊(duì)完成了50發(fā)的一個批次 在完成頭25次后,做了一次調(diào)整縮短了距離,調(diào)整前后投石的平均距離有不同嗎?,假設(shè)檢驗(yàn),比較兩個均值,由于P值小于0.05,所以有足夠的證據(jù)表明調(diào)整前與調(diào)整后的平均距離有顯著的不同,調(diào)整導(dǎo)致了不同,假設(shè)檢驗(yàn),

19、變方檢驗(yàn),比較兩個或兩個以上樣本的方差是否相等,假定:,Ho: 1 = 2 = 3 = = n,Ha: 至少有一個不同,當(dāng)P值0.05時,則斷定:至少有一個方差不同,假設(shè)檢驗(yàn),例3 變方檢驗(yàn),我們需要鍛件來制造渦輪盤。我們需要按照鍛件發(fā)運(yùn)的時間來計劃我們的設(shè)備和人員。我們收集了兩個供應(yīng)商的交付時間數(shù)據(jù)。,是否有一個供應(yīng)商的交付時間更穩(wěn)定?,總是首先畫圖!- 你能否得出結(jié)論? 描述基本假設(shè)和對立假設(shè):,Ho: 1 = 2,Ha: 1 2,假設(shè)檢驗(yàn),解釋結(jié)果,P值:0.000,由于P=0.000,所以可以斷定: 兩個供應(yīng)商的供貨時間的方差不同,假設(shè)檢驗(yàn),Minitab練習(xí),你的投石器團(tuán)隊(duì)完成了50

20、發(fā)的一個批次 某隊(duì)員宣稱:從第一輪(round1)到第二輪(round2),我們不 僅更瞄準(zhǔn)了目標(biāo),而且分散性較小。,兩輪的方差有不同嗎?,假設(shè)檢驗(yàn),Minitab輸出,由于P=0.0230.05,所以兩輪的方差有統(tǒng)計上的不同,假設(shè)檢驗(yàn),方差分析 樣本均值假設(shè)檢驗(yàn),比較兩個或兩個以上樣本的方差是否相等,假定:,Ho: 1 = 2 = 3 = = n,Ha: 至少有一個均值不同,當(dāng)P值0.05時,則斷定:至少有一個樣本的均值不同,假設(shè)檢驗(yàn),例4 方差分析,有個采購員想改善備件的開票效率。 客戶可以通過6種不同的傳遞方式收到發(fā)票,傳遞方式會影響開票的周期嗎?,總是首先畫圖!- 你能否得出結(jié)論? 描

21、述基本假設(shè)和對立假設(shè):,因素(factor):傳遞方式 水平(level):6種不同的類型,編碼為:A,C,E,M,S,U,Ho: 1 = 2 = 3 = = n,Ha: 至少有一個均值不同,假設(shè)檢驗(yàn),因素factor和水平level,我們同時檢查相同因素factor不同水平levels的均值是否不同 在此例中,采購員認(rèn)為傳遞方式是可能影響到開票周期 因素 factor是傳遞方法 6種傳遞的類型 水平levels,假設(shè)檢驗(yàn),例4 解釋結(jié)果,由于P=0.0000.05,所以我們發(fā)現(xiàn)至少一個均值在統(tǒng)計上與其它的不同,假設(shè)檢驗(yàn),何者不同?,哪兩種方式有不同?,P值只能告訴我們是否有不同 (-*-)表

22、示95%的置信區(qū)間 如果畫一條直線不能同時穿過兩個置信區(qū)間,即表示對應(yīng)的 兩個傳遞方式均值不同,假設(shè)檢驗(yàn),解釋變異,傳遞方式的平方和SS =42.445 總得平方和SS =523.013,Delivery_Method,Total,此例:P=0.000表示傳遞方式對開票的周期有影響,但是影響有多大?,SS / SS = 42.445 / 523.013 = 8.12%,Delivery_Method,Total,傳遞方式對總的開票周期的變異只解釋了8.12%,假設(shè)檢驗(yàn),卡方檢驗(yàn),離散的Y,離散的X,比較 非連續(xù)數(shù)據(jù)組,Ho: 所有組都相同,Ha: 至少有一組不同,當(dāng)P值0.05 (斜率不存在)

23、,簡單線性回歸,回歸線,回歸線可以在95%的信賴區(qū)間轉(zhuǎn)動,如果斜率只能為正, 則P值0.05 (斜率存在),當(dāng)你收集的數(shù)據(jù)越多,置信區(qū)間就會越小,簡單線性回歸,P值和R,(adj),R 大,(adj),R 小,(adj),P 0.05,簡單線性回歸,預(yù)估方程式,轉(zhuǎn)速為1717時推力是0嗎?,回歸方程式: Thrust = - 57366 + 33.4 RPM,給定一個轉(zhuǎn)速值,就可以找到對應(yīng)的發(fā)動機(jī)推力,注意:推斷只能在一個范圍內(nèi)有效,確認(rèn)回歸方程的有效區(qū)間,簡單線性回歸,關(guān)于s,S: 殘差(誤差)的標(biāo)準(zhǔn)差。殘差為:觀測值 預(yù)測值。 換句話說,指實(shí)際點(diǎn)至回歸線的舉例。 (對于優(yōu)秀的模型,此值應(yīng)較

24、小),S = 977.4,95%,2 S = 2 * 977.4 = 1954.8,依項(xiàng)目需求決定S是否夠小,簡單線性回歸,殘差分析和假設(shè),殘差Error回歸線到實(shí)際點(diǎn)的距離 殘差應(yīng)該服從正態(tài)分布,中心值應(yīng)該是0 如果不是0或不是正太,則有其它可能的X沒有找到,Error,簡單線性回歸,殘差分析 - Minitab,殘差,殘差,正態(tài)分布? 中心值是0?,簡單線性回歸,殘差分析 - Minitab,殘差,殘差,Observation Order,分布是否隨機(jī)?是否有規(guī)律性的現(xiàn)象發(fā)生?,簡單線性回歸,不正常的殘差分布,殘差應(yīng)隨機(jī)分布。殘差存在的型態(tài)可能指出所選擇的模型不對。,型態(tài)舉例: - 曲線(

25、起點(diǎn)低,逐漸上升,然后下降) - 隨數(shù)據(jù)收集的時間而變化 - 不等變差(一般情況下,值越大,變差越大) - 一個或兩個極端值,Fit,Resid,Fit for Time,Resid,Fit,Resid,改進(jìn)不良擬合的幾種方法: - 調(diào)查非同尋常的數(shù)據(jù),它可能是錯誤,也可能是您的研究中最重要信息。 - 擬合不同的方程式(可能不是線性關(guān)系) - 轉(zhuǎn)換Y(對數(shù),平方根,倒數(shù),y ) - 轉(zhuǎn)換“X”變量(對數(shù),平方根,倒數(shù)),k,簡單線性回歸,一般程序和復(fù)習(xí),了解原始數(shù)據(jù) 保證你知道數(shù)據(jù)時如何收集的,數(shù)值的范圍、分布等 作出散點(diǎn)圖 觀察分布、區(qū)分組別,其它對數(shù)據(jù)有潛在影響的因素 建立模型 用P值評估

26、回歸方程式與各個X 評估R - 用于解釋X對Y的變化所造成的影響 證實(shí)你的模型 咨詢項(xiàng)目的專家,確認(rèn)你的模型符合實(shí)情,S是否可以接受,(adj),多元回歸 Multiple Regression,多元回歸,目的,學(xué)習(xí)建立多個Xs的回歸模型 以R 來量化表示多個Xs對Y變化的影響大小 使用Minitab建立多元線性回歸 介紹包含離散數(shù)據(jù)的回歸分析(General Linear Model) 介紹如何為回歸模型選擇Xs組合的方法,(adj),多元回歸,關(guān)鍵概念:多元線性關(guān)系,與簡單的線不同,擬合的點(diǎn)構(gòu)成一個平面,平面回歸方程: Y = b + a1 X1 + a2 X2,X2,X1,Y,平面是由每

27、一點(diǎn)到面的 最短距離來決定的 最好的擬合面應(yīng)是位 于數(shù)據(jù)點(diǎn)中央處,而實(shí) 際數(shù)據(jù)則隨機(jī)分布在平 面的上下方,多元回歸,回歸,人力資源部想了解影響員工的薪酬有哪些因素 他們有如下數(shù)據(jù):,薪水 畢業(yè)后工齡 員工業(yè)績 在所屬級別的工資等級 汽車價格 藍(lán)領(lǐng)/白領(lǐng) 學(xué)業(yè)成績,多元回歸,畫圖,薪水,畢業(yè)后工齡,員工業(yè)績,員工身高,學(xué)業(yè)成績,多元回歸,模型,薪水與工齡的一元線性回歸,薪水與汽車價格的一元線性回歸,是否是因?yàn)檐嚨膬r格高,因此會得到高的薪水?,多元回歸,結(jié)果分析,三個因素都有影響,回歸方程式存在,多元回歸,統(tǒng)計與實(shí)際的影響,人力資源部想改進(jìn)它的評估,所以講身高加入進(jìn)來,身高對薪資有統(tǒng)計的影響,但是

28、實(shí)際只影響了R-Sq(adj)的0.4%(= 98.9% - 98.5%),變化Xs在Minitab的輸入順序,可能對這些值有影響,因?yàn)閄s之間可能有交互的影響,多元回歸,統(tǒng)計與實(shí)際的影響,這些因素總影響是98.9%,那么每一個因素的貢獻(xiàn)各有多大?,Years 工齡: 80.97%,Error 誤差: 1.03%,height 身高: 0.37%,depth in 等級: 3.39%,rating 業(yè)績: 14.24%,多元回歸,最佳子集 篩選關(guān)鍵X結(jié)果,Response is pay,越小越好,越大越好,選3或4個X比較好?,幫助你找到正確的方向和重要的Xs,通用線性回歸 General L

29、inear Modal (GLM),連續(xù)的Y 多個連續(xù)的Xs 不連續(xù)的X,通用線性回歸,GLM,白領(lǐng)的薪資與藍(lán)領(lǐng)的薪資不一樣嗎?,白領(lǐng)Group A與藍(lán)領(lǐng)Group B的薪資平均值相差: 87.08 71.63 = 15.5 K美元,通用線性回歸,觀察數(shù)據(jù),A,B,0,10,20,30,40,A、B兩組的平均工齡不同,通用線性回歸,結(jié)果分析,加入group后,身高已不再重要,years,rating,0%,1%,0%,3%,14%,82%,通用線性回歸,模型的結(jié)論,A、B兩組的平均薪資有不同,相差為: 82.99-77.77=5.22K美元 注意:不是先前的15.5K美元,參考以前的表,GLM

30、能在考量 連續(xù)的Xs 的影響條件下反映出 非連續(xù)的X 對Y的影響,通用線性回歸,工具集,二元邏輯回歸 Binary Logistic Regression (BLR),二元邏輯回歸,目的,使用BLR(二元邏輯回歸)的時機(jī) 介紹倍率 odds ratio,二元邏輯回歸,分析工具箱 二元邏輯回歸使用時機(jī),Y = 離散數(shù)據(jù),即可區(qū)分?jǐn)?shù)據(jù),如:合格/不合格、1/0 X = 連續(xù)或非連續(xù),注意:如果X是連續(xù)的,卡方檢驗(yàn)就不能使用,只能用二元邏輯回歸,二元邏輯回歸,二元邏輯回歸BLR,在多元回歸(Multiple Regression)中,我們介紹了 通用線性模型(General Linear Model),用于分析 X有連續(xù)型的也有非連續(xù)型的數(shù)據(jù) GLM是一種數(shù)學(xué)模型,以Xs的線性組合來解釋Y 邏輯回歸是GLM的一部分,回歸,邏輯,最小平方,GLM,ANOVA,二元邏輯回歸,計算倍率 Odds Ratio,例如:我們要檢查有工作壓力/沒有工作壓力與患心臟病/不患心臟病的倍率關(guān)系,X = 工作壓力?,Y = 心臟???,倍率Odds Ratio 是X=1與X=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論