版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
概率論與數(shù)理統(tǒng)計課件一元回歸分析演示文稿當(dāng)前1頁,總共34頁。優(yōu)選概率論與數(shù)理統(tǒng)計課件一元回歸分析當(dāng)前2頁,總共34頁。
在現(xiàn)實問題中,處于同一個過程中的一些變量,往往是相互依賴和相互制約的,它們之間的相互關(guān)系大致可分為兩種:
相關(guān)關(guān)系問題
(1)確定性關(guān)系——函數(shù)關(guān)系;
(2)非確定性關(guān)系——相關(guān)關(guān)系;
相關(guān)關(guān)系表現(xiàn)為這些變量之間有一定的依賴關(guān)系,但這種關(guān)系并不完全確定,它們之間的關(guān)系不能精確地用函數(shù)表示出來,這些變量其實是隨機變量,或至少有一個是隨機變量。當(dāng)前3頁,總共34頁。
相關(guān)關(guān)系舉例
例如:在氣候、土壤、水利、種子和耕作技術(shù)等條件基本相同時,某農(nóng)作物的畝產(chǎn)量Y與施肥量X之間有一定的關(guān)系,但施肥量相同,畝產(chǎn)量卻不一定相同。畝產(chǎn)量是一個隨機變量。
又如:人的血壓Y與年齡X之間有一定的依賴關(guān)系,一般來說,年齡越大,血壓越高,但年齡相同的兩個人的血壓不一定相等。血壓是一個隨機變量。
農(nóng)作物的畝產(chǎn)量與施肥量、血壓與年齡之間的這種關(guān)系稱為相關(guān)關(guān)系,在這些變量中,施肥量、年齡是可控變量,畝產(chǎn)量、血壓是不可控變量。一般在討論相關(guān)關(guān)系問題中,可控變量稱為自變量,不可控變量稱為因變量。當(dāng)前4頁,總共34頁。函數(shù)關(guān)系與相關(guān)關(guān)系的區(qū)別
相關(guān)關(guān)系——影響的值,函數(shù)關(guān)系——決定的值,
因此,統(tǒng)計學(xué)上討論兩變量的相關(guān)關(guān)系時,是設(shè)法確定:在給定自變量的條件下,因變量的條件數(shù)學(xué)期望不能確定。當(dāng)前5頁,總共34頁?;貧w分析的概念
研究一個隨機變量與一個(或幾個)可控變量之間的相關(guān)關(guān)系的統(tǒng)計方法稱為回歸分析。
只有一個自變量的回歸分析稱為一元回歸分析;多于一個自變量的回歸分析稱為多元回歸分析。引進回歸函數(shù)稱為回歸方程
回歸方程反映了因變量隨自變量的變化而變化的平均變化情況.當(dāng)前6頁,總共34頁。
回歸分析主要包括三方面的內(nèi)容
(1)提供建立有相關(guān)關(guān)系的變量之間的數(shù)學(xué)關(guān)系式(稱為經(jīng)驗公式)的一般方法;
(2)判別所建立的經(jīng)驗公式是否有效,并從影響隨機變量的諸變量中判別哪些變量的影響是顯著的,哪些是不顯著的;回歸分析的內(nèi)容
(3)利用所得到的經(jīng)驗公式進行預(yù)測和控制。當(dāng)前7頁,總共34頁。一元線性回歸模型
如果試驗的散點圖中各點呈直線狀,則假設(shè)這批數(shù)據(jù)的數(shù)學(xué)模型為
設(shè)隨機變量Y依賴于自變量x,作n次獨立試驗,得n對觀測值:稱這n對觀測值為容量為n的一個子樣,若把這n對觀測值在平面直角坐標系中描點,得到試驗的散點圖.其中
,且相互獨立,則當(dāng)前8頁,總共34頁。圖9-1其中同服從于正態(tài)分布相互獨立,因此當(dāng)前9頁,總共34頁。其中是與無關(guān)的未知常數(shù)。(9.1)一元線性回歸模型
一般地,稱如下數(shù)學(xué)模型為一元線性模型而稱為回歸函數(shù)或回歸方程。稱為回歸系數(shù)。當(dāng)前10頁,總共34頁?;貧w函數(shù)(方程)的建立
由觀測值確定的回歸函數(shù),應(yīng)使得較小??紤]函數(shù)問題:確定,使得取得極小值。這是一個二元函數(shù)的無條件極值問題。當(dāng)前11頁,總共34頁?;貧w方程的建立令當(dāng)前12頁,總共34頁。回歸方程的建立記表示對的估計值則變量對的回歸方程為簡寫為最小二乘法當(dāng)前13頁,總共34頁?;貧w方程有效性的檢驗
對于任何一組數(shù)據(jù),都可按最小二乘法確定一個線性函數(shù),但變量與之間是否真有近似于線性函數(shù)的相關(guān)關(guān)系呢?尚需進行假設(shè)檢驗。假設(shè)如果成立,則不能認為與有線性相關(guān)關(guān)系。三種檢驗方法:F檢驗法、t-檢驗法、r檢驗法。當(dāng)前14頁,總共34頁?;貧w方程有效性的F檢驗法記——總離差平方和,反映觀測值與平均值的偏差程度。經(jīng)恒等變形,將分解當(dāng)前15頁,總共34頁?;貧w方程有效性的F檢驗法——回歸平方和,反映回歸值與平均值的偏差,揭示變量與的線性關(guān)系所引起的數(shù)據(jù)波動?!S嗥椒胶停从秤^測值與回歸值的偏差,揭示試驗誤差和非線性關(guān)系對試驗結(jié)果所引起的數(shù)據(jù)波動。當(dāng)前16頁,總共34頁?;貧w方程有效性的F檢驗法如果為真,則于是,統(tǒng)計量對給定的檢驗水平,(1)當(dāng)時,拒絕,即可認為變量與有線性相關(guān)關(guān)系;(2)當(dāng)時,接受,即可認為變量與沒有線性相關(guān)關(guān)系;當(dāng)前17頁,總共34頁?;貧w方程有效性的F檢驗法(2)當(dāng)時,接受,即可認為變量與沒有線性相關(guān)關(guān)系;此時,可能有以下幾種情況:(2)對有顯著影響,但這種影響不能用線性關(guān)系表示,應(yīng)作非線性回歸;(3)除之外,還有其它變量對也有顯著影響,從而削弱了對的影響,應(yīng)考慮多元回歸。(1)對沒有顯著影響,應(yīng)丟棄自變量;當(dāng)前18頁,總共34頁?;貧w方程有效性的r檢驗法記——樣本的相關(guān)系數(shù)
可反映變量與之間的線性相關(guān)程度。因為當(dāng)前19頁,總共34頁?;貧w方程有效性的r檢驗法記——樣本的相關(guān)系數(shù)
越大,變量與之間的線性相關(guān)程度越強。因為(1)(2)時,(3)時,
與有線性相關(guān)關(guān)系;
與無線性相關(guān)關(guān)系;當(dāng)前20頁,總共34頁?;貧w方程有效性的r檢驗法計算對給定的檢驗水平,查相關(guān)系數(shù)的臨界值表
如果,則拒絕,即線性回歸方程有效;否則,接受,即線性回歸方程無效。F檢驗與r檢驗是一致的:當(dāng)前21頁,總共34頁?;貧w方程有效性的t檢驗法統(tǒng)計量H0成立時,對給定的檢驗水平,H0的拒絕域為即當(dāng)時,變量與有線性相關(guān)關(guān)系。F檢驗與t檢驗是一致的:當(dāng)前22頁,總共34頁。編號123456789脂肪含量%15.417.518.920.021.022.815.817.819.1蛋白質(zhì)含量%44.039.241.838.937.438.144.640.739.8試求出與的關(guān)系,并判斷是否有效。例1
為了研究大豆脂肪含量和蛋白質(zhì)含量的關(guān)系,測定了九種大豆品種籽粒內(nèi)的脂肪含量和蛋白質(zhì)含量,得到如下數(shù)據(jù)當(dāng)前23頁,總共34頁。解(1)描散點圖當(dāng)前24頁,總共34頁。(2)建立模型由散點圖,設(shè)變量與為線性相關(guān)關(guān)系:確定回歸系數(shù)和:編號123456789x15.417.518.920.021.022.815.817.819.1168.3y44.039.241.838.937.438.144.640.739.8364.5x2237.16306.25357.21400441519.84249.64316.84364.813192.75y219361536.641747.241513.211398.761451.611989.161656.491584.0414813.2xy677.6686790.02778785.4868.68704.68724.46760.186775.02當(dāng)前25頁,總共34頁。所以,所求的回歸方程為當(dāng)前26頁,總共34頁。(3)檢驗回歸方程的有效性查相關(guān)系數(shù)臨界值表因為所以回歸方程在的檢驗水平下有統(tǒng)計意義。即可以認為大豆的蛋白質(zhì)含量與脂肪含量有線性相關(guān)性。當(dāng)前27頁,總共34頁。利用回歸方程進行預(yù)測1、點預(yù)測時,即為的點預(yù)測值。2、區(qū)間預(yù)測統(tǒng)計量對給定的置信水平,的預(yù)測區(qū)間為當(dāng)前28頁,總共34頁。
續(xù)例1求大豆脂肪含量為18.6%的條件下蛋白質(zhì)95%的預(yù)測區(qū)間。解由已求得的回歸方程得蛋白質(zhì)的點預(yù)測值為所以脂肪含量為18.6%時,蛋白質(zhì)的95%的預(yù)測區(qū)間為利用回歸方程進行預(yù)測當(dāng)前29頁,總共34頁??刂苿t為預(yù)測的反問題:已知因變量的取值區(qū)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水性涂裝施工方案(3篇)
- 物資轉(zhuǎn)運施工方案(3篇)
- 電力清障施工方案(3篇)
- 秋季節(jié)施工方案(3篇)
- 管道水井施工方案(3篇)
- 編施工方案價格(3篇)
- 船艙電路施工方案(3篇)
- 路肩干砌石施工方案(3篇)
- 通州花園施工方案(3篇)
- 木門及門套安裝工程施工方案
- 宮頸息肉個案護理
- 新生兒感染護理查房
- 2026屆高考語文專題復(fù)習(xí)-哲理詩
- (二調(diào))武漢市2025屆高中畢業(yè)生二月調(diào)研考試 生物試卷(含標準答案)
- 2024-2025學(xué)年天津市和平區(qū)高三上學(xué)期1月期末英語試題(解析版)
- 管理人員應(yīng)懂財務(wù)知識
- ISO9001-2015質(zhì)量管理體系版標準
- 翻建房屋四鄰協(xié)議書范本
- 打樁承包合同
- 輸煤棧橋彩鋼板更換施工方案
- 農(nóng)田水利施工安全事故應(yīng)急預(yù)案
評論
0/150
提交評論