六西格瑪數(shù)據(jù)分析技術(shù)3.ppt_第1頁
六西格瑪數(shù)據(jù)分析技術(shù)3.ppt_第2頁
六西格瑪數(shù)據(jù)分析技術(shù)3.ppt_第3頁
六西格瑪數(shù)據(jù)分析技術(shù)3.ppt_第4頁
六西格瑪數(shù)據(jù)分析技術(shù)3.ppt_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、六西格瑪管理培訓(xùn)叢書(5),何曉群 主編,六西格瑪數(shù)據(jù)分析技術(shù),何曉群 編著,中 國 人 民 大 學(xué) 出 版 社,3.1 隨機變量 3.2 隨機變量的分布 3.3 隨機變量的均值與方差 3.4 二項分布及其應(yīng)用 3.5 泊松分布及其應(yīng)用 3.6 正態(tài)分布及其應(yīng)用 3.7 中心極限定理 3.8 各種概率分布計算的Minitab實現(xiàn) 小組討論與練習(xí),第3章 管理中常見的幾個概率分布,返回目錄,本 章 目 標(biāo),1.理解隨機變量及隨機變量分布的基本概念 2.理解隨機變量的均值及方差在管理中運用的思想 3.理解二項分布的意義,掌握二項分布的應(yīng)用 4.掌握泊松分布的意義和應(yīng)用理念 5.理解正態(tài)分布與6的關(guān)

2、系 6.理解中心極限定理的意義 7.掌握各種概率分布的計算實現(xiàn),返回目錄,3.1 隨機變量,日常生活中,生產(chǎn)實踐中隨機現(xiàn)象無處不在 把隨機現(xiàn)象的結(jié)果用變量來表示,就稱為隨機變量 隨機變量是隨機現(xiàn)象表示的一種抽象,有了這種抽象,使得我們的研究更具普遍性。 常用大寫的字母X,Y,Z等表示隨機變量,隨機變量的取值常用小寫字母x,y,z等表示。 隨機變量有離散型和連續(xù)型兩大類,返回目錄,離散型隨機變量,定義:如果一個隨機變量的取值是可數(shù)的,則稱該隨機變量是離散型隨機變量。 離散型隨機變量是僅取數(shù)軸上有限個點或可列個點,x1,x2,x3,x4,x5,x6,x7,X,圖1,公路上的汽車,完好瓷磚的數(shù)目,返

3、回目錄,連續(xù)型隨機變量,定義:如果一個隨機變量可取數(shù)軸上某一區(qū)間內(nèi)的任一值,則稱該隨機變量為連續(xù)型隨機變量。 連續(xù)型隨機變量的取值可以是整個實數(shù)軸上的任一區(qū)間(a,b)(如圖2)。,X,圖2,返回目錄,3.2 隨機變量的分布,隨機變量的取值的統(tǒng)計規(guī)律就是隨機變量的分布。 知道了一個隨機變量的分布就掌握了它的關(guān)鍵。,離散型隨機變量的分布。 隨機變量X可能取哪些值,X取這些值的概率各是多大? 連續(xù)型隨機變量的分布。 隨機變量X在哪個區(qū)間上取值,它在任意小區(qū)間取值的概率是多少?,返回目錄,離散型隨機變量的分布,離散型隨機變量的分布常用下面表格形式的分布列來表示: 用數(shù)學(xué)表達式表示即為: P(X=xi

4、)=pi,i=1,2,n 離散型隨機變量的分布應(yīng)滿足概率公理化定義的要求,即pi0,p1+p2+pn=1 擲一枚骰子出現(xiàn)的點數(shù)及其概率就可用離散型隨機變量的分布列表示:,返回目錄,連續(xù)型隨機變量的分布,連續(xù)型隨機變量X,它可取某一區(qū)間內(nèi)的所有值,但它的取值不能逐一列出。我們用函數(shù)f(x)表示隨機變量X的密度函數(shù)。 用概率密度函數(shù)f(x)來反映隨機變量X在某一區(qū)間取值的統(tǒng)計規(guī)律性 連續(xù)型隨機變量取某一固定值的概率為零 在6管理中用連續(xù)型隨機變量X常常表示產(chǎn)品的某種質(zhì)量特性,譬如啤酒的裝量、電子元件的靈敏度、電子產(chǎn)品的壽命等。,返回目錄,質(zhì)量特性與概率密度函數(shù),在生產(chǎn)制造業(yè)的管理現(xiàn)場我們常常要抽取

5、若干樣品測定某種產(chǎn)品的質(zhì)量特性X。如在啤酒廠今天生產(chǎn)的啤酒中隨機抽取若干瓶量測它們的裝量(ml),就可用直方圖表示它們的質(zhì)量特性。隨著測定的數(shù)量越多,直方圖就會演變成一條光滑曲線,這就是所謂的概率密度函數(shù)曲線,它就刻畫出隱藏在質(zhì)量特性X隨機取值后面的統(tǒng)計規(guī)律性。這條光滑曲線f(x)告訴了我們什么信息?,返回目錄,概率密度曲線的幾種不同情形,在管理現(xiàn)場,不同產(chǎn)品的不同質(zhì)量特性所表現(xiàn)的概率密度曲線不同,這決定了形狀不同,散布不同,位置不同。正是這些不同的曲線形式?jīng)Q定了質(zhì)量特性的差別。,形狀不同,散布不同,位置不同,返回目錄,概率密度函數(shù)的性質(zhì),概率密度曲線的縱軸在做直方圖時,它是“單位長度上的頻率

6、”,由于頻率的穩(wěn)定性,于是用概率代替了頻率,從而縱軸就演變成為“單位長度上的概率”,這也是為什么把密度曲線稱為概率密度曲線的緣由。 連續(xù)型隨機變量的密度函數(shù)f(x)具有如下性質(zhì): 1. 2. 3. 其中 表示質(zhì)量特性值在區(qū)間(a,b)中的概率。 這里涉及到積分概念,不必感到憂慮,因為積分計算不是重點。,返回目錄,3.3 隨機變量的均值與方差,前面第1章中看到的具體數(shù)據(jù)可以用均值和方差來分別描述數(shù)據(jù)的集中趨勢和離種趨勢,隨機變量也有均值和方差的概念,用它們分別表示分布的中心位置和分散程度。 在擲骰子例子中,每次擲下后出現(xiàn)的點數(shù)不僅相同,平均出現(xiàn)的點數(shù)是多少?在啤酒的裝量測定中,每瓶啤酒的裝量嚴(yán)格

7、來說都不一樣,它們的平均裝量是多少?這就是隨機變量的均值問題。 相對均值而言,每次擲骰子出現(xiàn)的結(jié)果都在它的左右,那么平均的偏差有多大?假如一批瓶裝啤酒的平均裝量是640ml,各瓶偏離640ml的多少都不一樣,它們平均偏離是多少?這就是隨機變量的方差及標(biāo)準(zhǔn)差問題。,返回目錄,隨機變量均值與方差的理解,生產(chǎn)或服務(wù)過程中的差別是難以避免的。生產(chǎn)過程中由于種種隨機因素的影響,使得我們無法避免變異的產(chǎn)生。 在扔飛鏢時,誰都想發(fā)發(fā)命中靶心,可遺憾的事常常發(fā)生! 計算多次投標(biāo)的平均結(jié)果就是求均值,計算相對均值的離散程度就是計算方差。,如何理解上面兩圖的結(jié)果,返回目錄,如何理解直方圖,直方圖的上下公差限的總寬

8、度是對生產(chǎn)能力的一個設(shè)計。在大部分時間里,生產(chǎn)運行的結(jié)果就在這一區(qū)間上發(fā)生。 譬如,根據(jù)啤酒裝量的抽檢數(shù)據(jù)建立了如下的直方圖,期望值 640,返回目錄,直方圖的解釋,圖形縱軸表示在某一范圍內(nèi)量測到的數(shù)目,公差限以內(nèi)就是合格品,出了公差限就是廢品。 上圖中的T值就是均值(640ml),也即數(shù)學(xué)期望。這是一個理想值,也就是說,設(shè)計人員期望每瓶啤酒的裝量正好是640ml,然而由于種種說不清道不明的原因的影響,不可能,也不存在正好的640ml,于是只要在上下公差限之內(nèi)的都是合格品,出了上下公差限的就是廢品。 假如總共抽檢了300瓶啤酒,有10瓶低于下規(guī)格限LSL,15瓶超過了上規(guī)格限USL,因此,這批

9、產(chǎn)品的廢品率是 25/300=0.083 合格率是1-0.083=0.917,即合格率為91.7%,返回目錄,實際與理想的差距,我們應(yīng)該意識到,一個生產(chǎn)過程內(nèi)在的精度不是由設(shè)計人員及設(shè)計方案所規(guī)定的。就像我們?nèi)语w鏢每一發(fā)都想命中靶心,但往往事與愿違。 提高質(zhì)量的核心就是優(yōu)化流程,減小變異,提高生產(chǎn)流程內(nèi)在的精度。這是6管理的精髓。,返回目錄,6管理的目標(biāo)是縮小實際與理想的差距,T是目標(biāo)值,期望值,設(shè)計值。然而常常在生產(chǎn)實際中,生產(chǎn)實際的中心值會發(fā)生變化,偏離目標(biāo)值。這也說明實際生產(chǎn)結(jié)果的中心值 是獨立于設(shè)計值規(guī)定的目標(biāo)值(T)的。 6管理的目的就在于優(yōu)化流程,減小變異,使實際生產(chǎn)結(jié)果的中心值盡

10、可能與設(shè)計的目標(biāo)值重合。,LSL,USL,T,返回目錄,均值的計算公式,離散型隨機變量的數(shù)學(xué)期望(均值) 連續(xù)型隨機變量的數(shù)學(xué)期望,返回目錄,均值計算舉例,例31. 擲骰子試驗中出現(xiàn)的點數(shù)用隨機變量X表示,隨機變量X的均值(數(shù)學(xué)期望)為 即擲骰子出現(xiàn)的結(jié)果很不一樣,但它們的平均取值是3.5 例32. 電子產(chǎn)品首次發(fā)生故障(需要維修)的時間通常遵從指數(shù)分布。譬如某種品牌的手機首次發(fā)生故障的時間T(單位:小時)遵從指數(shù)分布 問計算這種品牌的手機首次需要維修的平均時間是多少小時。 解: 即這種品牌的手機首次需要維修的平均時間是10000小時。,返回目錄,方差的計算公式,離散型隨機變量的方差 連續(xù)型隨

11、機變量的方差 由于方差不能帶單位,故用標(biāo)準(zhǔn)差來刻畫隨機變量相對均值的離散程度,返回目錄,方差計算舉例,例33. 擲骰子問題中,出現(xiàn)點數(shù)的平均值是3.5,每次取值相對于均值的離散程度是多大? 解: 即相對均值平均偏離1.71點。 可以證明,指數(shù)分布的均值與標(biāo)準(zhǔn)差相等,即 例32中某種品牌的手機首次需要維修的平均時間是10000小時,即標(biāo)準(zhǔn)差也為10000小時。標(biāo)準(zhǔn)差如此之大有點不好理解。然而,凡是遵從指數(shù)分布的產(chǎn)品壽命問題就是這樣,也即你的期望越高,標(biāo)準(zhǔn)差必然就大。實際中,也確有同一品牌的手機有的剛剛使用就遇到故障,而有的用了好幾年也不需修理。,返回目錄,3.4 二項分布及其應(yīng)用,二項分布的概率

12、計算公式: 其中 是從n個不同元素中取出x個的組合數(shù),計算公式為: 二項分布的概率計算公式中有兩個重要的參數(shù),一個是n,一個是p,故通常把二項分布記為B(n,p),返回目錄,一個產(chǎn)品檢驗的例子,例34. 已知某生產(chǎn)流程生產(chǎn)的產(chǎn)品中有10%是有缺陷的,而該生產(chǎn)流程生產(chǎn)的產(chǎn)品是否有缺陷完全是隨機的,現(xiàn)在隨機選取5個產(chǎn)品,求其中有2個產(chǎn)品有缺陷的概率是多大? 解:這是一個符合二項分布情形的問題。設(shè)X為抽取的5個產(chǎn)品中有缺陷的產(chǎn)品的個數(shù),則X是遵從二項分布B(5,0.1)的隨機變量。某一產(chǎn)品有缺陷的概率為p=0.1,n=5。擇所要求的概率為: 類似可以計算出在抽取的5件產(chǎn)品中有0、1、3、4、5個產(chǎn)品

13、有缺陷的概率分別為,返回目錄,二項分布的均值與標(biāo)準(zhǔn)差,可以證明,如果隨機變量XB(n,p),它們的均值、方差、標(biāo)準(zhǔn)差分別為: 在例34中,二項分布B(5,0.1)的均值、方差與標(biāo)準(zhǔn)差分別為: 二項分布的計算在n很大時,像上面的那樣的運算是很麻煩的,然而,通常可以通過查二項分布表直接解決這一問題,或通過Minitab軟件計算。,返回目錄,3.5 泊松分布及其應(yīng)用,單位產(chǎn)品缺陷數(shù)的概念 在任何生產(chǎn)流程中,缺陷的出現(xiàn)難以避免 缺陷的出現(xiàn)完全是隨機的 如果50件產(chǎn)品發(fā)現(xiàn)了50處缺陷,則單位產(chǎn)品的缺陷數(shù)為1 生產(chǎn)一件產(chǎn)品無缺陷的最大可能性是多少? 一件產(chǎn)品保證不再返工或修理的最大可能性是多少?,返回目錄

14、,某一產(chǎn)品無缺陷的最大可能性是多大?,假設(shè)某種產(chǎn)品由10個零部件組成,返回目錄,零件數(shù)和單位產(chǎn)品缺陷數(shù)(DPU),10,100,1000,10000,100000,.3480,.3500,.3520,.3540,.3560,.3580,.3600,.3620,.3640,.3660,.3680,0.9010=.34868,0.99100,0.9991000,0.999910000,0.99999100000,零件數(shù),產(chǎn)生合格率(以DPU=1為例),返回目錄,對缺陷模型的泊松模擬(DPU=1),當(dāng)零件數(shù)趨于無限時,我們可以注意到合格品率趨于: 泊松公式: 其中,d/U是單位產(chǎn)品缺陷數(shù),r是缺 陷

15、實際發(fā)生的數(shù)量。因此,當(dāng)r=0時, 就可得到單位產(chǎn)品無缺陷的概率。 注意:它不同于傳統(tǒng)意義上的產(chǎn)品合格 率。例如合格產(chǎn)品的數(shù)量比上所有被檢 驗產(chǎn)品的數(shù)量。,返回目錄,泊松分布的更一般情形,泊松分布常用來描述在一指定時間、面積、體積之內(nèi)某一事件出現(xiàn)的個數(shù)的分布。譬如: 1.修一條鐵路,每月出的傷亡事故數(shù) 2.在某一單位時間內(nèi),某種機器發(fā)生的故障數(shù) 3.一輛汽車的表面上的斑痕數(shù) 4.你的手機每天接到的呼喚次數(shù) 泊松分布的一般數(shù)學(xué)形式是: 其中 為某種特定單位內(nèi)的平均數(shù)。在研究產(chǎn)品缺陷問題中,返回目錄,一個實際例子,例35. 某一大型礦山每年發(fā)生工傷事故的平均次數(shù)為2.7,如果企業(yè)的安全條件沒有質(zhì)的

16、改變,則下一年發(fā)生的工傷事故小于2的概率是多少? 解:設(shè)X為下一年發(fā)生的工傷事故數(shù),則X遵從 為2.7的泊松分布,于是X遵從的分布為 于是 可算得 即下一年發(fā)生工傷事故數(shù)小于2的概率為24.866%。 可以證明泊松分布的均值與方差相等,且均為,即,返回目錄,用泊松分布近似二項分布,通常在實際應(yīng)用中,當(dāng) 時,用泊松分布近似二項分布效果良好。 例36. 已知某種電子元件的次品率為1.5,在一大批元件中隨機抽取1000個,問次品數(shù)為0,1,2,3的概率是多少? 解:把“電子元件的次品數(shù)”看成隨機變量X,顯然X遵從二項分布B(1000,0.0015)。如果直接利用二項分布公式求解,就要計算 顯然,計算

17、量很大!,返回目錄,用泊松分布近似二項分布(續(xù)),如果用泊松分布去近似計算,則 泊松分布與二項分布計算結(jié)果的比較,返回目錄,3.6 正態(tài)分布及其應(yīng)用,隨機變量XN(,2)的正態(tài)分布曲線:,曲線拐點的橫坐標(biāo)或 s,P(aXb)=?,返回目錄,不同的、對應(yīng)的正態(tài)曲線,相同,不同的情況,相同, 不同的情況,返回目錄,當(dāng)不變時,不同的對應(yīng)的曲線形狀不變,僅僅是位置不同。而當(dāng)不變時,不同的對應(yīng)的曲線形狀不同,大的曲線較矮胖,小的曲線較瘦高。因此反映了曲線的位置,是位置參數(shù),它是正態(tài)隨機變量的平均值,也稱為正態(tài)變量的均值(或數(shù)學(xué)期望)。反映了曲線的形狀,即隨機變量取值的離散程度,是形狀參數(shù)(也稱尺度參數(shù))

18、,稱為正態(tài)變量的標(biāo)準(zhǔn)差,2為其方差。常記為,返回目錄,標(biāo)準(zhǔn)正態(tài)分布,藍色部分的面積: P(-3X3)=0.9973,返回目錄,當(dāng)=0,=1時 ,稱隨機變量X遵從標(biāo)準(zhǔn)正態(tài)分布,記為 。如果一個隨機變量X遵從標(biāo)準(zhǔn)正態(tài)分布,則其取值落在橫軸上任意區(qū)間的概率可通過標(biāo)準(zhǔn)正態(tài)分布表查出。 標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)用 表示,即 例: 當(dāng) 時, 即,返回目錄,把一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,返回目錄,把一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,1.當(dāng) 時,要通過變換公式 把一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布 2.當(dāng)轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布后,查相應(yīng)的標(biāo)準(zhǔn)正態(tài)分布表 3.對于 ,可由 獲取 4.當(dāng) 時,直接查表即可 5.當(dāng) 時,有

19、公式:,返回目錄,例37:某批零件的長度遵從正態(tài)分布, 平均長度為10mm,標(biāo)準(zhǔn)差為0.2mm. 試問: (1)從該批零件中隨機抽取一件,其長度不到9.4mm的概率是多少? (2)為了保證產(chǎn)品質(zhì)量,要求以95%的概率保證該零件的長度在 9.5mm10.5mm之間,這一要求能否得到保證? 解:已知XN(10,0.22) (1)P(X9.4)=(9.4-10)/0.2)=(-3)=0.00135,返回目錄,(2)P(9.5x10.5)=(10.5-10)/0.2)-(9.5-10)/0.2)= (2.5)-(-2.5)=2(2.5)-1=0.98758,P(9.5X10.5)=?,P(-2.5z2

20、.5)=?,即可以用98.76%的概率保證該批零件的長度在9.5mm10.5mm之間,返回目錄,6與正態(tài)分布,99.9937%,99.999943%,99.9999998%,99.73%,68.27%,95.45%,返回目錄,USL,不考慮漂移時6水準(zhǔn)的合格率為99.9999998%,1/10億,LSL,1/10億,USL,LSL,1/10億,0.999999998,返回目錄,規(guī)格范圍,LSL,USL,0.001ppm,1350ppm,0.001ppm,1350ppm,標(biāo)稱值=,西格瑪水平和對應(yīng)的合格率,一個容易引起誤會的比較圖,返回目錄,流程II,流程I與流程II的比較,LSL,USL,流程

21、I,(樣本均值),返回目錄,3流程與6流程的比較,6流程比3流程好得多!,返回目錄,LSL,USL,1.5的漂移,如果你達到了6sigma質(zhì)量水準(zhǔn),就意味著在有100萬個出現(xiàn)缺陷 的機會的流程中,實際出現(xiàn)的缺陷僅為3.4個,6,7.5,1.5,6,當(dāng)考慮漂移后 : 6十億分之二次品率 63.4ppm,期望流程,流程平均值的漂移,4.5,面積約等于百萬分之3.4,返回目錄,3.8 各種概率分布計算的Minitab實現(xiàn),二項分布 以例34為例,1、在工作表中填入1-5(因為選取了五個產(chǎn)品) 2、選取 Calc Probability Distributions Binomial. 3、選取 Pro

22、bability. 4、在 Number of trials(試驗次數(shù))欄中, 填入5. 在 Probability of success(成功概率)欄中,填入 0.10. 5、選取 Input column 并選擇數(shù)據(jù)列. 點擊 OK.,返回目錄,用Minitab計算二項分布概率,輸入數(shù)據(jù),選取 Calc Probability Distributions Binomial.,返回目錄,用Minitab計算二項分布概率(續(xù)),在 Number of trials(試驗次數(shù))欄中, 填入5. 在 Probability of success(成功概率)欄中,填入 0.10.選取 Input column 并選擇數(shù)據(jù)列. 點擊 OK,計算得5個產(chǎn)品中有2個產(chǎn)品有缺陷的概率是0.0729,返回目錄,泊松分布 以例35為例,1、在工作表中填入1-2(只需考慮2次事故) 2、選取 Calc Probability Distributions Possion. 3、選取 Cumulative probability. 4、在 Mean(均值)欄中, 填入2.7. 5、選取 Input column 并選擇數(shù)據(jù)列. 點擊 OK.,用Minitab計算泊松分布概率,返回目錄,用Minitab計算泊松分布概率(續(xù)一),輸入數(shù)據(jù),選取 Calc Probability D

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論