土木工程科學(xué)數(shù)據(jù)分析方法 課件全套 張明 第1-6章 緒論、工程數(shù)據(jù)處理常用軟件 -方差分析_第1頁
土木工程科學(xué)數(shù)據(jù)分析方法 課件全套 張明 第1-6章 緒論、工程數(shù)據(jù)處理常用軟件 -方差分析_第2頁
土木工程科學(xué)數(shù)據(jù)分析方法 課件全套 張明 第1-6章 緒論、工程數(shù)據(jù)處理常用軟件 -方差分析_第3頁
土木工程科學(xué)數(shù)據(jù)分析方法 課件全套 張明 第1-6章 緒論、工程數(shù)據(jù)處理常用軟件 -方差分析_第4頁
土木工程科學(xué)數(shù)據(jù)分析方法 課件全套 張明 第1-6章 緒論、工程數(shù)據(jù)處理常用軟件 -方差分析_第5頁
已閱讀5頁,還剩183頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

土木工程科學(xué)數(shù)據(jù)分析方法Page:22026/1/4主要參考資料1、《土木工程科學(xué)數(shù)據(jù)分析方法》(預(yù)出版)2、網(wǎng)上圖書館資料Page:32026/1/4學(xué)時(shí)與成績構(gòu)成總學(xué)時(shí):16學(xué)時(shí)學(xué)分:1學(xué)分成績構(gòu)成:平時(shí)成績(40%)+期末考試成績(60%)考試方式:閉卷考試難度較大,大家一定要高度重視?。?!授課內(nèi)容Page:42026/1/41授課內(nèi)容第一章:緒論土木工程科學(xué)數(shù)據(jù)

?

用來記錄、描述和識(shí)別土工建/構(gòu)筑物工作行為的按一定規(guī)律排列組合的物理符號(hào),是一組表示數(shù)量、行動(dòng)和目標(biāo)的非隨機(jī)的可鑒別的符號(hào),是客觀事物的屬性、數(shù)量、位置及其相互關(guān)系等的抽象表示,以適合用人工或自然的方式進(jìn)行保存、傳遞和處理。它既可以是數(shù)字、文字、圖形、圖像、聲音或者味道,也可以是計(jì)算機(jī)代碼。

土木工程科學(xué)數(shù)據(jù)用屬性描述,屬性也稱變量、特征、維等。人們經(jīng)過對(duì)土木工程科學(xué)數(shù)據(jù)進(jìn)行系統(tǒng)地收集、整理、提煉、加工、管理和分析,可以從土木工程科學(xué)數(shù)據(jù)中提取信息,可以從信息中挖掘、認(rèn)識(shí)土工建/構(gòu)筑物的物理規(guī)律,進(jìn)而對(duì)土木工程生產(chǎn)實(shí)踐進(jìn)行有效干預(yù)。時(shí)間/s授課內(nèi)容2026/1/41授課內(nèi)容第一章:緒論土木工程科學(xué)數(shù)據(jù)的分類(1)按照結(jié)構(gòu)構(gòu)造對(duì)數(shù)據(jù)進(jìn)行分類

尺寸參數(shù)、約束條件、材料性質(zhì)、質(zhì)量分布(2)按照結(jié)構(gòu)系統(tǒng)輸入對(duì)數(shù)據(jù)進(jìn)行分類永久荷載、可變荷載、偶然荷載、地震作用(3)按照結(jié)構(gòu)系統(tǒng)輸出對(duì)數(shù)據(jù)進(jìn)行分類1)內(nèi)力,軸力、彎矩、剪力、扭矩等;2)變形,撓度、轉(zhuǎn)角、側(cè)移、裂縫等授課內(nèi)容2026/1/41授課內(nèi)容第一章:緒論數(shù)據(jù)分析的作用?

在土木工程領(lǐng)域,數(shù)據(jù)分析是指用適當(dāng)?shù)姆治龇椒▽?duì)收集來的大量原始的土木工程科學(xué)數(shù)據(jù)(結(jié)構(gòu)構(gòu)造數(shù)據(jù)、輸入數(shù)據(jù)和輸出數(shù)據(jù))進(jìn)行分析,提取有用信息(如截面尺寸、荷載特征值、梁的跨中最大撓度等),形成結(jié)論(如50年一遇基本雪壓、結(jié)構(gòu)/構(gòu)件輕微損傷等)并對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。數(shù)據(jù)分析可以幫助土木工程師作出判斷,以便采取適當(dāng)?shù)男袆?dòng)(如調(diào)整截面尺寸、對(duì)結(jié)構(gòu)進(jìn)行加固等)。

土木工程科學(xué)數(shù)據(jù)分析的目的其實(shí)就是把隱藏在土工結(jié)構(gòu)相關(guān)領(lǐng)域背后大批雜亂無章的有工程意義的數(shù)據(jù)中進(jìn)行信息的集中、萃取和提煉出來,以便找出所研究對(duì)象的內(nèi)在規(guī)律,能夠達(dá)到對(duì)土工結(jié)構(gòu)相關(guān)工作性能進(jìn)行模式分類(又叫模式識(shí)別)、預(yù)測、查找原因等目的。本門課程的重點(diǎn)授課內(nèi)容2026/1/41授課內(nèi)容第一章:緒論數(shù)據(jù)分析的作用(1)模式分類

模式分類又叫模式識(shí)別,主要利用一定的數(shù)學(xué)算法對(duì)所采集的數(shù)據(jù)樣本進(jìn)行分析,并根據(jù)數(shù)據(jù)樣本特征將數(shù)據(jù)樣本劃分到一定的類別中去,如結(jié)構(gòu)或構(gòu)件的失效和可靠分類等。

一個(gè)完整的模式分類系統(tǒng)主要由數(shù)據(jù)獲取、預(yù)處理、特征提取或特征選擇、分類決策等幾部分或環(huán)節(jié)組成,圖1.2-1給出了它們之間的聯(lián)系和先后順序。圖1.2-1模式識(shí)別系統(tǒng)組成授課內(nèi)容2026/1/41授課內(nèi)容第一章:緒論數(shù)據(jù)分析的作用(2)預(yù)測

利用不同的數(shù)據(jù)分析方法可以對(duì)采集設(shè)備或測量設(shè)備所收集到的大量土工數(shù)據(jù)進(jìn)行分析,從而預(yù)測土工結(jié)構(gòu)的工作行為。如在巖土工程方面,支持向量機(jī)方法可以對(duì)巖土結(jié)構(gòu)位移進(jìn)行預(yù)測;采用決策樹算法預(yù)測隧道掘進(jìn)速度、巖爆烈度等;在建筑結(jié)構(gòu)工程方面,采用細(xì)胞自動(dòng)機(jī)方法可以預(yù)測單層網(wǎng)殼結(jié)構(gòu)和砌體墻板的破壞模式和失效荷載。(3)原因分析

利用不同的數(shù)據(jù)分析方法可以對(duì)采集設(shè)備或測量設(shè)備所收集或監(jiān)測到的大量土工數(shù)據(jù)進(jìn)行分析,之后采用數(shù)值模擬或試驗(yàn)的方法可以對(duì)土工結(jié)構(gòu)出現(xiàn)異?,F(xiàn)象的原因進(jìn)行分析。如貴州某隧道穿越高水壓煤系地層時(shí),多處出現(xiàn)仰拱隆起問題。通過現(xiàn)場觀察和襯砌結(jié)構(gòu)變形監(jiān)測,并采用數(shù)值模擬方法對(duì)隧道仰拱隆起的原因進(jìn)行分析。結(jié)果表明,基底圍巖軟化和高水壓力是隧道仰拱隆起的兩大因素,且圍巖軟化對(duì)仰拱結(jié)構(gòu)安全的影響更大。授課內(nèi)容2026/1/41授課內(nèi)容第一章:緒論常用的數(shù)據(jù)分析方法

數(shù)據(jù)分析的基本方法非常多,對(duì)于具體的問題,數(shù)據(jù)分析不存在固定的解決方案。目前,常用的數(shù)據(jù)分析方法有線性回歸分析、假設(shè)檢驗(yàn)、方差分析、動(dòng)態(tài)規(guī)劃算法、神經(jīng)網(wǎng)絡(luò)算法、支持向量機(jī)、聚類分析、主成分分析、因子分析、判別分析、遺傳算法、決策樹算法、關(guān)聯(lián)分析算法、貝葉斯分類算法等。因本教材主要針對(duì)土木工程方向本科生學(xué)習(xí),故重點(diǎn)講解了線性回歸分析、假設(shè)檢驗(yàn)、方差分析及動(dòng)態(tài)規(guī)劃算法部分,而將其它算法合并到第8章進(jìn)行概述講解,供學(xué)生了解。另外,數(shù)據(jù)分析工作離不開統(tǒng)計(jì)軟件,本教材的第2章重點(diǎn)描述了數(shù)據(jù)分析常用的軟件工具。授課內(nèi)容2026/1/41授課內(nèi)容第一章:緒論總結(jié)土木工程科學(xué)數(shù)據(jù)的概念及內(nèi)涵土木工程科學(xué)數(shù)據(jù)的分類數(shù)據(jù)分析的作用常用的數(shù)據(jù)分析方法土木工程科學(xué)數(shù)據(jù)分析方法授課內(nèi)容Page:122026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件

復(fù)雜系統(tǒng)的科學(xué)研究往往需要收集和處理大量反映系統(tǒng)特征的數(shù)據(jù)信息,這類原始數(shù)據(jù)的樣本數(shù)量巨大,各種指標(biāo)變量眾多,并帶有隨機(jī)性。人們需要認(rèn)識(shí)和分析復(fù)雜數(shù)據(jù)的內(nèi)在規(guī)律性,對(duì)高維復(fù)雜數(shù)據(jù)進(jìn)行綜合、變換、將其中的重要信息提取出來,方能清晰地展現(xiàn)系統(tǒng)的結(jié)構(gòu)與其中元素之間的內(nèi)在聯(lián)系,也有助于取得正確的研究成果。這項(xiàng)工作的完成往往離不開統(tǒng)計(jì)分析,而統(tǒng)計(jì)軟件的使用可以大大提高效率。統(tǒng)計(jì)分析軟件實(shí)際上是算法的整合,即常用數(shù)據(jù)分析方法內(nèi)置于軟件內(nèi)部。授課內(nèi)容Page:132026/1/4Page:142026/1/4特征參數(shù)授課內(nèi)容Page:152026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件

目前,常用于統(tǒng)計(jì)分析的軟件有SPSS、Origin、Stata、SAS、Excel、Matlab等。本門教程重點(diǎn)介紹SPSS、Origin、Excel、Matlab授課內(nèi)容Page:162026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件SPSS(StatisticalProductandServiceSolutions),是全球公認(rèn)的最優(yōu)秀的數(shù)據(jù)統(tǒng)計(jì)分析軟件包之一,SPSS在社會(huì)科學(xué)、自然科學(xué)的各個(gè)領(lǐng)域的數(shù)據(jù)整理和分析中都能發(fā)揮巨大作用,并已經(jīng)應(yīng)用于經(jīng)濟(jì)學(xué)、生物學(xué)、教育學(xué)、心理學(xué)、醫(yī)學(xué)以及體育、工業(yè)、農(nóng)業(yè)、林業(yè)、商業(yè)和金融等各個(gè)領(lǐng)域。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等,具體內(nèi)容包括描述統(tǒng)計(jì)、列聯(lián)分析、總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成分分析、時(shí)間序列分析、非參數(shù)檢驗(yàn)等多個(gè)大類,每個(gè)類中還有多個(gè)專項(xiàng)統(tǒng)計(jì)方法。SPSS設(shè)有專門的繪圖系統(tǒng),可以根據(jù)使用者的需要將給出的數(shù)據(jù)繪制成各種圖形,能夠滿足用戶的不同需求。授課內(nèi)容Page:172026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件操作界面授課內(nèi)容Page:182026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件SPSS文件主要有SPSS數(shù)據(jù)文件和SPSS結(jié)果輸出文件數(shù)據(jù)文件結(jié)果輸出文件錄入、編輯、整理和分析數(shù)據(jù)記錄數(shù)據(jù)編輯的操作過程,呈現(xiàn)數(shù)據(jù)分析結(jié)果授課內(nèi)容Page:192026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件

成功啟動(dòng)SPSS后,屏幕上就會(huì)出現(xiàn)【數(shù)據(jù)編輯器】窗口,如下圖所示為【數(shù)據(jù)編輯器】窗口的各部分構(gòu)成。授課內(nèi)容Page:202026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件SPSS主要操作方式:窗口菜單方式和命令語句方式。授課內(nèi)容Page:212026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件(1)操作步驟1)依次單擊“文件”|“新建”|“數(shù)據(jù)”命令或“文件”|“打開”|“數(shù)據(jù)”命令,均可打開數(shù)據(jù)編輯器窗口,如下圖所示。2)在變量窗口進(jìn)行變量的編輯。3)在數(shù)據(jù)視圖中編輯具體數(shù)據(jù)。4)保存數(shù)據(jù)并關(guān)閉數(shù)據(jù),以待使用。授課內(nèi)容Page:222026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件(2)模塊解讀

一個(gè)完整的SPSS數(shù)據(jù)變量結(jié)構(gòu)模塊包括變量名、變量類型、變量名標(biāo)簽、變量值標(biāo)簽、缺失值的定義、計(jì)量尺度以及數(shù)據(jù)的顯示屬性。

變量名(Name)是變量參與分析的唯一標(biāo)識(shí),定義變量結(jié)構(gòu)時(shí)首先應(yīng)給出每個(gè)變量的變量名,否則系統(tǒng)默認(rèn)為var00001、var0002、var0003等。授課內(nèi)容Page:232026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件SPSS的變量類型(Type)有三種:數(shù)值型、字符型和日期型。數(shù)值型變量按不同的要求分為標(biāo)準(zhǔn)型、逗號(hào)型、句號(hào)型、科學(xué)計(jì)數(shù)型、美元型和自定義貨幣型,系統(tǒng)默認(rèn)的為標(biāo)準(zhǔn)數(shù)值型變量。日期型變量(Date)適用于表示日期和時(shí)間的數(shù)值類型,SPSS提供了29種日期型變量的格式供用戶選擇。字符型變量(String)其值由字符串組成。圖2.2-8和圖2.2-9所示分別為變量類型和自定義貨幣型定義的對(duì)話框。授課內(nèi)容Page:242026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件一般當(dāng)數(shù)據(jù)量較少時(shí),我們可以直接輸入的方式建立數(shù)據(jù)庫;當(dāng)數(shù)據(jù)庫較大時(shí),我們一般不直接在SPSS中錄入,而是采用其他方式建立數(shù)據(jù)庫(如Excel、Epidata),然后用SPSS直接導(dǎo)入的方法建成SPSS數(shù)據(jù)庫。如下圖所示為“數(shù)據(jù)視圖”下的某數(shù)據(jù)庫。授課內(nèi)容Page:252026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件練習(xí)題基于SPSS對(duì)上述數(shù)據(jù)做簡單分析,如求最大值、均值、最小值、分組等等。授課內(nèi)容Page:262026/1/41授課內(nèi)容第二章:工程數(shù)據(jù)處理常用軟件授課內(nèi)容Page:272026/1/41授課內(nèi)容MATLAB軟件簡介及其操作界面MATLAB這一名字是由矩陣(Matrix)和實(shí)驗(yàn)室(Laboratory)的頭3個(gè)字母組合而成,意為矩陣實(shí)驗(yàn)室,是一款商業(yè)數(shù)學(xué)軟件。它主要用于數(shù)據(jù)可視化、算法開發(fā)、數(shù)據(jù)分析以及數(shù)值計(jì)算,提供了一種高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境。MATLAB語言與其他計(jì)算機(jī)高級(jí)語言相比,有著以下明顯的優(yōu)勢:1)高效的數(shù)值計(jì)算及符號(hào)計(jì)算功能,能使用戶從繁雜的數(shù)學(xué)運(yùn)算分析中解脫出來;

2)具有完備的圖形處理功能,實(shí)現(xiàn)計(jì)算結(jié)果和編程的可視化;3)友好的用戶界面及接近數(shù)學(xué)表達(dá)式的自然化語言,使學(xué)者易于學(xué)習(xí)和掌握;4)功能豐富的應(yīng)用工具箱(如信號(hào)處理工具箱、通信工具箱等),為用戶提供了大量方便實(shí)用的處理工具。授課內(nèi)容Page:282026/1/41授課內(nèi)容MATLAB軟件簡介及其操作界面授課內(nèi)容Page:292026/1/41授課內(nèi)容MATLAB軟件簡介及其操作界面

單擊每個(gè)子窗口右上角的

圖標(biāo)的“取消??俊?,可以將該子窗口從MATLAB工作界面中脫離出來,成為獨(dú)立的窗口,此時(shí)MATLAB工作界面的布局會(huì)發(fā)生相應(yīng)的變化。以MATILAB命令窗口為例,獨(dú)立的命令窗口如下圖所示。單擊上圖右上角的

??繄D標(biāo),可將命令窗口重新嵌入MATLAB工作界面。授課內(nèi)容Page:302026/1/41授課內(nèi)容MATLAB軟件簡介及其操作界面單擊MATLAB工作界面上的“Desktop”菜單,在彈出的下拉菜單中通過勾選(或取消勾選)各選項(xiàng),也可改變MATIAB工作界面布局。如果工作界面布局已經(jīng)改變,通過菜單項(xiàng)“Desktop”→“DesktopLayout”→“Default”可恢復(fù)默認(rèn)工作界面布局。授課內(nèi)容Page:312026/1/41授課內(nèi)容MATLAB軟件簡介及其操作界面“File”→“New”→“BlankM-File”授課內(nèi)容Page:322026/1/41授課內(nèi)容M文件程序設(shè)計(jì)M文件有兩種形式,一種是腳本M文件(又稱為命令M文件),另一種是函數(shù)M文件。這兩種文件都是以字母m為擴(kuò)展名,不同的是函數(shù)M文件的第一行必須是以字符串function開始的函數(shù)說明語句,而腳本M文件是可直接運(yùn)行文件。

腳本M文件是一系列命令的集合,運(yùn)行時(shí),其中的變量保存于工作空間中。因此,它可以使用工作空間原有的變量。但反過來,不需要使用原有工作空間中的變量時(shí),工作空間保留機(jī)制可能會(huì)造成不可預(yù)知的錯(cuò)誤。因此,規(guī)范的腳本文件往往以clear、closeall等命令開頭,以清除變量,關(guān)閉其他的圖形窗口。

腳本文件名注意不要與預(yù)定義或用戶自定義的函數(shù)文件重名,以免發(fā)生錯(cuò)誤。執(zhí)行腳本文件有以下幾種方法。授課內(nèi)容Page:332026/1/41授課內(nèi)容M文件程序設(shè)計(jì)最好實(shí)操,如果允許授課內(nèi)容Page:342026/1/41授課內(nèi)容M函數(shù)文件最好實(shí)操,如果允許授課內(nèi)容Page:352026/1/41授課內(nèi)容自學(xué)授課內(nèi)容Page:362026/1/41授課內(nèi)容MATLAB軟件中通過Princomp、cluster、classify等簡單的幾個(gè)命令就可以實(shí)現(xiàn)方差分析、回歸分析、主成分分析、聚類分析、判別分析等。MATLAB軟件部分?jǐn)?shù)據(jù)處理功能自學(xué)授課內(nèi)容Page:372026/1/41授課內(nèi)容MATLAB軟件部分?jǐn)?shù)據(jù)處理功能授課內(nèi)容Page:382026/1/41授課內(nèi)容MATLAB軟件部分?jǐn)?shù)據(jù)處理功能授課內(nèi)容Page:392026/1/41授課內(nèi)容

本章簡單介紹了工程數(shù)據(jù)處理常用軟件SPSS統(tǒng)計(jì)分析軟件、MATLAB軟件、Origin軟件和EXCEL軟件,實(shí)際使用過程中應(yīng)通過這些統(tǒng)計(jì)分析軟件的一種或者幾種軟件相結(jié)合可以實(shí)現(xiàn)后面章節(jié)所涉及的數(shù)據(jù)統(tǒng)計(jì)分析處理工作,如基礎(chǔ)和高級(jí)統(tǒng)計(jì)、誤差分析、假設(shè)檢驗(yàn)、回歸和方差分析、決策分析、可信度分析、相關(guān)分析、聚類分析、因子分析等。Origin軟件和EXCEL軟件,自學(xué)?。。∈谡n內(nèi)容Page:402026/1/4后期學(xué)習(xí)過程中可能會(huì)用到的土木工程科學(xué)數(shù)據(jù)分析方法人工神經(jīng)網(wǎng)絡(luò)支持向量機(jī)聚類分析主成分分析因子分析判別分析遺傳算法決策樹算法授課內(nèi)容Page:412026/1/4后期學(xué)習(xí)過程中可能會(huì)用到的土木工程科學(xué)數(shù)據(jù)分析方法土木工程科學(xué)數(shù)據(jù)分析方法授課內(nèi)容Page:432026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:442026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理

在試驗(yàn)過程中,由于環(huán)境的影響,試驗(yàn)方法和設(shè)備、儀器的不完善以及試驗(yàn)人員的認(rèn)識(shí)能力所限等原因,使得試驗(yàn)測得的數(shù)值和真值之間存在一定的差異,在數(shù)值上即表現(xiàn)為誤差。隨著科學(xué)技術(shù)的進(jìn)步和人們認(rèn)識(shí)水平的不斷提高,雖可將試驗(yàn)誤差控制得越來越小,但始終不可能完全消除它,即誤差的存在具有必然性和普遍性。在試驗(yàn)設(shè)計(jì)中應(yīng)盡力控制誤差,使其減小到最小程度,以提高試驗(yàn)結(jié)果的精確性。3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:452026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理

試驗(yàn)誤差按其性質(zhì)可分為系統(tǒng)誤差(systematicerror)、隨機(jī)誤差(random/chanceerror)和粗大誤差(mistakeerror)。(1)系統(tǒng)誤差

系統(tǒng)誤差是由于偏離測量規(guī)定的條件,或者測量方法不合適,按某一確定的規(guī)律所引起的誤差。在同一試驗(yàn)條件下,多次測量同一量值時(shí),系統(tǒng)誤差的絕對(duì)值和符號(hào)保持不變;或在條件改變時(shí),按一定規(guī)律變化。例如,標(biāo)準(zhǔn)值的不準(zhǔn)確、儀器刻度的不準(zhǔn)確而引起的誤差都是系統(tǒng)誤差。3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:462026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:472026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理(1)系統(tǒng)誤差

系統(tǒng)誤差是由按確定規(guī)律變化的因素所造成的,這些誤差因素是可以掌握的。具體來說,有4個(gè)方面的因素:1)測量人員:由于測量者的個(gè)人特點(diǎn),在刻度上估計(jì)讀數(shù)時(shí),習(xí)慣偏于某一方向;動(dòng)態(tài)測量時(shí),記錄某一信號(hào),有滯后的傾向。2)測量儀器裝置:儀器裝置結(jié)構(gòu)設(shè)計(jì)原理存在缺陷,儀器零件制造和安裝不正確,儀器附件制造有偏差。3)測量方法:采取近似的測量方法或近似的計(jì)算公式等引起的誤差。4)測量環(huán)境:測量時(shí)的實(shí)際溫度對(duì)標(biāo)準(zhǔn)溫度的偏差,測量過程中溫度、濕度等按一定規(guī)律變化的誤差。

系統(tǒng)誤差的大小及其符號(hào)在同一試驗(yàn)中是恒定的,或在試驗(yàn)條件改變時(shí),按照某一確定的規(guī)律變化。如果能發(fā)現(xiàn)產(chǎn)生系統(tǒng)誤差的原因,可以設(shè)法避免,或通過校正加以消除。3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:482026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理(2)隨機(jī)誤差

在同一條件下,多次測量同一量值時(shí),絕對(duì)值和符號(hào)以不可預(yù)定方式變化著的誤差,稱為隨機(jī)誤差(也稱偶然誤差和不定誤差)。即對(duì)系統(tǒng)誤差進(jìn)行修正后,還出現(xiàn)觀測值與真值之間的誤差。例如,儀器儀表中傳動(dòng)部件的間隙和摩擦,連接件的變形等引起的示值不穩(wěn)定等都是偶然誤差。這種誤差的特點(diǎn)是在相同條件下,少量地重復(fù)測量同一個(gè)物理量時(shí),誤差有時(shí)大有時(shí)小,有時(shí)正有時(shí)負(fù),沒有確定的規(guī)律,且不可能預(yù)先測定。但是當(dāng)觀測次數(shù)足夠多時(shí),隨機(jī)誤差完全遵守概率統(tǒng)計(jì)的規(guī)律。即這些誤差的出現(xiàn)沒有確定的規(guī)律性,但就誤差總體而言,卻具有統(tǒng)計(jì)規(guī)律性。3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:492026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:502026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理(2)隨機(jī)誤差

隨機(jī)誤差是由很多暫時(shí)未被掌握的因素構(gòu)成的,主要有三個(gè)方面:1)測量人員:瞄準(zhǔn)、讀數(shù)的不穩(wěn)定等。2)測量儀器裝置:零部件、元器件配合的不穩(wěn)定,零部件的變形、零件表面油膜不均、摩擦等。3)測量環(huán)境:測量溫度的微小波動(dòng),濕度、氣壓的微量變化,光照強(qiáng)度變化,灰塵、電磁場變化等。

由于隨機(jī)誤差的形成取決于試驗(yàn)過程的一系列隨機(jī)因素,這些隨機(jī)因素是試驗(yàn)者無法嚴(yán)格控制的,因此,隨機(jī)誤差是不可避免的,試驗(yàn)人員可設(shè)法將其大大減小,但不可能完全消除它。3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:512026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理(3)粗大誤差

明顯歪曲測量結(jié)果的誤差稱為粗大誤差。例如,測量者在測量時(shí)對(duì)錯(cuò)了標(biāo)志、讀錯(cuò)了數(shù)、記錯(cuò)了數(shù)等。凡包含粗大誤差的測量值稱之為壞值。只要實(shí)驗(yàn)者加強(qiáng)工作責(zé)任心,粗大誤差是可以完全避免的。發(fā)生粗大誤差的原因主要有兩個(gè)方面:1)測量人員的主觀原因:由于測量者責(zé)任心不強(qiáng),工作過于疲勞,缺乏經(jīng)驗(yàn)操作不當(dāng),或在測量時(shí)不仔細(xì)、不耐心、馬馬虎虎等,造成讀錯(cuò)、聽錯(cuò)、記錯(cuò)等。2)客觀條件變化的原因:測量條件意外的改變(如外界振動(dòng)等)引起儀器示值或被測對(duì)象位置改變而造成粗大誤差。3.1試驗(yàn)數(shù)據(jù)誤差的分類授課內(nèi)容Page:522026/1/41授課內(nèi)容

誤差的大小可以反映出試驗(yàn)結(jié)果的好壞,誤差可能是由于隨機(jī)誤差或系統(tǒng)誤差單獨(dú)成的,還可以是兩者的疊加。為了說明這一問題,引出了精密度、正確度和準(zhǔn)確度這三個(gè)表示誤差性質(zhì)的術(shù)語。通常“精度”包括精密度和準(zhǔn)確度兩層含義。第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.2試驗(yàn)數(shù)據(jù)的精準(zhǔn)度與判斷授課內(nèi)容Page:532026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.2試驗(yàn)數(shù)據(jù)的精準(zhǔn)度與判斷(1)精密度

精密度(precision)反映了隨機(jī)誤差大小的程度,是指在一定的試驗(yàn)條件下,多次試驗(yàn)值的彼此符合程度。精密度的概念與重復(fù)試驗(yàn)時(shí)單次試驗(yàn)值的變動(dòng)有關(guān)系,如果試驗(yàn)數(shù)據(jù)分散程度較小,則說明是精密的。例如,甲、乙二人對(duì)同一個(gè)量進(jìn)行測量,得到兩組試驗(yàn)值:

甲:11.45,11.46,11.45,11.44

乙:11.39,11.45,11.48,11.50

很顯然,甲組數(shù)據(jù)的彼此符合程度好于乙組,故甲組數(shù)據(jù)的精密度較高。

由于精密度表示了隨機(jī)誤差的大小,因此對(duì)于無系統(tǒng)誤差的試驗(yàn),可以通過增加試驗(yàn)次數(shù)而達(dá)到提高數(shù)據(jù)精密度的目的。如果試驗(yàn)過程足夠精密,則只需少量幾次試驗(yàn)就能滿足要求。授課內(nèi)容Page:542026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.2試驗(yàn)數(shù)據(jù)的精準(zhǔn)度與判斷(2)正確度

正確度(correctness)反映了系統(tǒng)誤差的大小,是指在一定的試驗(yàn)條件下,所有系統(tǒng)誤差的綜合。圖3.2-1精密度和正確度的關(guān)系授課內(nèi)容Page:552026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.2試驗(yàn)數(shù)據(jù)的精準(zhǔn)度與判斷(2)正確度圖3.2-1精密度和正確度的關(guān)系

由于隨機(jī)誤差和系統(tǒng)誤差是兩種不同性質(zhì)的誤差,因此對(duì)于某一組試驗(yàn)數(shù)據(jù)而言,精密度高并不意味著正確度也高;反之,精密度不好,但當(dāng)試驗(yàn)次數(shù)相當(dāng)多時(shí),有時(shí)也會(huì)得到較好的正確度。精密度和正確度的區(qū)別和聯(lián)系,可通過圖3.2-1得到說明。圖(a)表示精密度好,正確度不好;圖(b)表示精密度好,正確度好;圖(c)表示精密度不好,正確度好。授課內(nèi)容Page:562026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.2試驗(yàn)數(shù)據(jù)的精準(zhǔn)度與判斷(2)正確度

若試驗(yàn)數(shù)據(jù)的平均值與真值的差異較大,就認(rèn)為試驗(yàn)數(shù)據(jù)的正確性不高,試驗(yàn)數(shù)據(jù)和試驗(yàn)方法的系統(tǒng)誤差較大,所以對(duì)試驗(yàn)數(shù)據(jù)的平均值進(jìn)行檢驗(yàn),實(shí)際上是對(duì)系統(tǒng)誤差的檢驗(yàn)。圖3.2-1精密度和正確度的關(guān)系授課內(nèi)容Page:572026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.2試驗(yàn)數(shù)據(jù)的精準(zhǔn)度與判斷(3)準(zhǔn)確度圖3.2-1精密度和正確度的關(guān)系

準(zhǔn)確度(accuracy)反映了系統(tǒng)誤差和隨機(jī)誤差的綜合,表示了試驗(yàn)結(jié)果與真值的一致程度。如圖3.2-1中,圖(a)具有精密度;(b)具有準(zhǔn)確度;(c)具有正確度。授課內(nèi)容Page:582026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除

在實(shí)際測量中,由于隨機(jī)誤差(偶然誤差)的客觀存在,所得的數(shù)據(jù)總存在著一定的離散性。但也可能由于粗大誤差出現(xiàn)個(gè)別離散較遠(yuǎn)的數(shù)據(jù),這通常稱為壞值或可疑值。

如果保留了這些數(shù)據(jù),由于壞值對(duì)測量結(jié)果的平均值的影響往往非常明顯,故不能以平均值為真值的估計(jì)值;

如果把屬于隨機(jī)誤差(偶然誤差)的個(gè)別數(shù)據(jù)當(dāng)作壞值處理,也許暫時(shí)可以報(bào)告出一個(gè)精確度較高的結(jié)果,但這是虛偽的、不科學(xué)的??梢蓴?shù)據(jù)的判斷問題授課內(nèi)容Page:592026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除對(duì)于可疑數(shù)據(jù)的取舍一定要慎重,一般處理原則如下:1)在試驗(yàn)過程中,發(fā)現(xiàn)異常數(shù)據(jù),應(yīng)停止試驗(yàn),分析原因,及時(shí)糾正錯(cuò)誤。2)試驗(yàn)結(jié)束后,在分析試驗(yàn)結(jié)果時(shí),如發(fā)現(xiàn)異常數(shù)據(jù)。則應(yīng)先找出產(chǎn)生差異的原因,再對(duì)其進(jìn)行取舍。3)在分析試驗(yàn)結(jié)果時(shí),如不清楚產(chǎn)生異常值的原因,則應(yīng)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,常用的統(tǒng)計(jì)方法有拉伊達(dá)準(zhǔn)則、肖維勒準(zhǔn)則、格拉布斯準(zhǔn)則、狄克遜準(zhǔn)則、F檢驗(yàn)法等;若數(shù)據(jù)較少,則可重做一組數(shù)據(jù)。4)對(duì)于舍去的數(shù)據(jù),在試驗(yàn)報(bào)告中應(yīng)注明舍去的原因或所選用的統(tǒng)計(jì)方法。

總之,對(duì)待可疑數(shù)據(jù)要慎重,不能任意拋棄或修改。往往通過對(duì)可疑數(shù)據(jù)的考察,可以發(fā)現(xiàn)引起系統(tǒng)誤差的原因,進(jìn)而改進(jìn)試驗(yàn)方法,有時(shí)甚至可得到新試驗(yàn)方法的線索。授課內(nèi)容Page:602026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除拉依達(dá)(PauTa)準(zhǔn)則

(3.3-1)則該測量數(shù)據(jù)判定為異常值,應(yīng)舍棄。

授課內(nèi)容Page:612026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除拉依達(dá)(PauTa)準(zhǔn)則

3s=6.3上述測量數(shù)據(jù)均需保留授課內(nèi)容Page:622026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除拉依達(dá)(PauTa)準(zhǔn)則

授課內(nèi)容Page:632026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除格拉布斯(Grubbs)準(zhǔn)則

授課內(nèi)容Page:642026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除格拉布斯(Grubbs)準(zhǔn)則

此時(shí),測量值是異常的,應(yīng)予舍去。算或的值,兩者中選擇殘余誤差較大者。

授課內(nèi)容Page:652026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除2)格拉布斯(Grubbs)準(zhǔn)則

授課內(nèi)容Page:662026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除狄克遜(Dixon)準(zhǔn)則

授課內(nèi)容Page:672026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除狄克遜(Dixon)準(zhǔn)則

授課內(nèi)容Page:682026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除

狄克遜(Dixon)準(zhǔn)則

授課內(nèi)容Page:692026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.3可疑數(shù)據(jù)的剔除

土木工程科學(xué)數(shù)據(jù)分析方法授課內(nèi)容Page:712026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

隨機(jī)誤差的大小可用試驗(yàn)數(shù)據(jù)的精密度來反映,而精密度的好壞可用方差來度量,所以,對(duì)測試結(jié)果進(jìn)行方差檢驗(yàn),即可判斷各試驗(yàn)方法或試驗(yàn)結(jié)果的隨機(jī)誤差之間的關(guān)系。χ2檢驗(yàn)F檢驗(yàn)授課內(nèi)容Page:722026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差χ2檢驗(yàn)

檢驗(yàn)適用于單個(gè)正態(tài)總體的方差檢驗(yàn),即在試驗(yàn)數(shù)據(jù)的總體方差已知的情況下,對(duì)試驗(yàn)數(shù)據(jù)的隨機(jī)誤差或精密度進(jìn)行檢驗(yàn)。有一組試驗(yàn)數(shù)據(jù)x1,x2,···,xn服從正態(tài)分布,則統(tǒng)計(jì)量

對(duì)于給定的顯著性水平α,由χ2分布表查得臨界值進(jìn)行比較,就可判斷兩方差之間有無顯著差異。顯著性水平α一般為0.01和0.05。

雙尾檢驗(yàn)時(shí),若<<,則可判斷該組數(shù)據(jù)的方差與原總體方差無顯著差異,否則有顯著差異。授課內(nèi)容Page:732026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)χ2檢驗(yàn)

單尾檢驗(yàn)時(shí),若

>,則判定該組數(shù)據(jù)的方差與原總體方差無顯著減小,否則有顯著減小,此為左尾檢驗(yàn);若<,則判定該組數(shù)據(jù)的方差與原總體方差無顯著增大,否則有顯著增大,此為右尾檢驗(yàn)。

如果對(duì)所研究的問題只需判斷有無顯著差異,則采用雙尾檢驗(yàn);如果所關(guān)心的是某個(gè)參數(shù)是否比某個(gè)值偏大(或偏小),則宜采用單尾檢驗(yàn)。授課內(nèi)容Page:742026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差χ2檢驗(yàn)

授課內(nèi)容Page:752026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差χ2檢驗(yàn)(1)本題提到的“穩(wěn)定性”實(shí)際反映的是隨機(jī)誤差大小,檢修后試驗(yàn)結(jié)果的樣本方差比正常情況下的方差顯著變大或變小,都認(rèn)為儀器的穩(wěn)定性有了顯著變化,可用χ2雙尾檢驗(yàn)。

授課內(nèi)容Page:762026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差χ2檢驗(yàn)

授課內(nèi)容Page:772026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差F檢驗(yàn)F檢驗(yàn)適用于兩組具有正態(tài)分布的試驗(yàn)數(shù)據(jù)之間的精密度的比較。

授課內(nèi)容Page:782026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)F檢驗(yàn)

授課內(nèi)容Page:792026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差F檢驗(yàn)【例3.6】用新、舊儀器設(shè)備測定某材料的彈性模量(GPa),測定結(jié)果如下。新:37.90,39.35,40.20,42.15,38.25,37.95,40.35,41.80,38.90,39.60舊:39.15,36.60,36.80,38.55,39.50,40.25,39.25,43.50,39.75,41.25,37.20

試問:(1)新舊儀器設(shè)備的精密度是否有顯著差異?(2)新儀器設(shè)備的精密度是否有顯著提高?(α=0.05)授課內(nèi)容Page:802026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差F檢驗(yàn)

授課內(nèi)容Page:812026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.4隨機(jī)誤差的判斷

(1)隨機(jī)誤差F檢驗(yàn)

授課內(nèi)容Page:822026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)

在相同條件下的多次重復(fù)試驗(yàn)不能發(fā)現(xiàn)系統(tǒng)誤差,只有改變形成誤差的條件,才能發(fā)現(xiàn)系統(tǒng)誤差。對(duì)系統(tǒng)結(jié)果必須進(jìn)行檢驗(yàn),以便能及時(shí)減小或消除系統(tǒng)誤差,提高試驗(yàn)結(jié)果的正確度。

若試驗(yàn)數(shù)據(jù)的平均值與真值的差異較大,就認(rèn)為試驗(yàn)數(shù)據(jù)的正確度不高,試驗(yàn)數(shù)據(jù)與試驗(yàn)方法的系統(tǒng)誤差較大,所以對(duì)試驗(yàn)數(shù)據(jù)的平均值進(jìn)行檢驗(yàn),實(shí)際上是對(duì)系統(tǒng)誤差的檢驗(yàn)。授課內(nèi)容Page:832026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)平均值與給定值比較兩個(gè)平均值比較成對(duì)數(shù)據(jù)比較授課內(nèi)容Page:842026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(1)平均值與給定值比較

如果有一組試驗(yàn)數(shù)據(jù)服從正態(tài)分布,要檢驗(yàn)這組數(shù)據(jù)的算術(shù)平均值是否與給定值有顯著差異,則檢驗(yàn)統(tǒng)計(jì)量

。s是n(n<30)個(gè)試驗(yàn)數(shù)據(jù)的樣本標(biāo)準(zhǔn)差,μ0是給定值(可以是真值、期望或標(biāo)準(zhǔn)值),根據(jù)給定的顯著性水平α,將計(jì)算的t值與臨界值比較,即可得到檢驗(yàn)結(jié)論。

雙尾檢驗(yàn)時(shí),若

,則可判斷該組數(shù)據(jù)的平均值與給定值無顯著差異,否則就有顯著差異。

左尾檢驗(yàn)時(shí),若t<0,且

,則判斷該組數(shù)據(jù)的平均值與給定值無顯著減小,否則有顯著減小。

右尾檢驗(yàn)時(shí),若t>0,且

,則判斷該組數(shù)據(jù)的平均值與給定值無顯著增大,否則有顯著增大。授課內(nèi)容Page:852026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(1)平均值與給定值比較

【例3.7】為了判斷某種新型快速水分測定儀的可靠性,用該儀器測定了某試劑含水量為7.5%的標(biāo)準(zhǔn)樣品,5次測量結(jié)果(%)為:7.6,7.8,8.5,8.3,8.7。對(duì)于給定的顯著性水平α=0.05,試檢驗(yàn):(1)該儀器的測量結(jié)果是否存在顯著的系統(tǒng)誤差?(2)該儀器的測量結(jié)果較標(biāo)準(zhǔn)值是否顯著偏大?

本例屬于平均值與標(biāo)準(zhǔn)值之間的比較,(1)屬于雙尾檢驗(yàn),(2)屬于單尾檢驗(yàn)。根據(jù)題意有

授課內(nèi)容Page:862026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(2)兩平均值比較

設(shè)有兩組試驗(yàn)數(shù)據(jù):

兩組數(shù)據(jù)都服從正態(tài)分布,根據(jù)兩組數(shù)據(jù)的方差是否存在顯著差異,分以下兩種情況進(jìn)行分析。

如果兩組數(shù)據(jù)的方差無顯著差異時(shí),則統(tǒng)計(jì)量

,為合并標(biāo)準(zhǔn)差,其計(jì)算公式為

如果兩組數(shù)據(jù)的精密度或方差有顯著差異時(shí),則統(tǒng)計(jì)量授課內(nèi)容Page:872026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(2)兩平均值比較

根據(jù)給定的顯著性水平α,將計(jì)算的t值與臨界值比較,即可得到檢驗(yàn)結(jié)論。

雙尾檢驗(yàn)時(shí),若

,則可判斷兩平均值無顯著差異,否則就有顯著差異。

單尾檢驗(yàn)時(shí)(左尾檢驗(yàn)),若t<0,且

,則判斷平均值1與平均值2無顯著減小,否則有顯著減小。

單尾檢驗(yàn)時(shí)(右尾檢驗(yàn)),若t>0,且

,則判斷平均值1與平均值2無顯著增大,否則有顯著增大。授課內(nèi)容Page:882026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(2)兩平均值比較

【例3.8】硅酸鹽水泥砂漿配方的抗折強(qiáng)度試驗(yàn)。

某工程師比較改良配方砂漿與未改良配方砂漿的抗折強(qiáng)度(又稱粘合強(qiáng)度),改良的砂漿配方是在水泥砂漿的原配方中加進(jìn)了聚合乳膠液。試驗(yàn)者收集了改良配方砂漿強(qiáng)度的10個(gè)觀察值和未改良配方砂漿強(qiáng)度的10個(gè)觀察值。

改良砂漿:165.2,160.8,168.8,160.3,162.0,167.1,166.3,168.2,162.37,162.5

未改良砂漿:171.6,172.9,179.0,176.5,175.1,174.1,178.7,175.5,176.1,178.0

假設(shè)兩種砂漿配方的抗折強(qiáng)度的方差是相同的,對(duì)于給定的顯著性水平α=0.05,試檢驗(yàn):改良砂漿與未改良砂漿強(qiáng)度是否存在系統(tǒng)誤差?授課內(nèi)容Page:892026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(2)兩平均值比較

授課內(nèi)容Page:902026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(3)成對(duì)數(shù)據(jù)比較

在某些試驗(yàn)中,試驗(yàn)數(shù)據(jù)是成對(duì)出現(xiàn)的,除了被比較的因素之外,其他條件是相同的。例如,用兩種分析方法或用兩種儀器測定同一來源的樣品,或兩分析人員用同樣的方法測定同一來源的樣品,以判斷兩種方法、兩種儀器或兩分析人員的測定結(jié)果之間是否存在系統(tǒng)誤差。

成對(duì)數(shù)據(jù)的比較,是把成對(duì)數(shù)據(jù)之差的總體平均值與零或其它指定值進(jìn)行比較,采用的統(tǒng)計(jì)量為

,d0可取零或給定值,

是成對(duì)測定值之差的算術(shù)平均值,即,sd是n對(duì)試驗(yàn)值之差的樣本標(biāo)準(zhǔn)差,即

。

對(duì)于給定的顯著性水平α,如果

,則成對(duì)數(shù)據(jù)之間不存在顯著的系統(tǒng)誤差,否則兩組數(shù)據(jù)之間存在顯著的系統(tǒng)誤差。授課內(nèi)容Page:912026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(3)成對(duì)數(shù)據(jù)比較

【例3.9】用兩種方法測定某水劑型鋁粉膏(加氣混凝土用)的發(fā)氣率,測得4min發(fā)氣率(單位:%)的數(shù)據(jù)如表3.5-1所示。x4445505548495342y4851535756414750d=x-y-4-6-3-2-886-8表3.5-1發(fā)氣率數(shù)據(jù)表試問兩種方法之間是否存在系統(tǒng)誤差?(α=0.05)授課內(nèi)容Page:922026/1/41授課內(nèi)容第三章:試驗(yàn)數(shù)據(jù)誤差及處理3.5系統(tǒng)誤差的檢驗(yàn)(3)成對(duì)數(shù)據(jù)比較

按成對(duì)數(shù)據(jù)來檢驗(yàn),若兩種方法之間無系統(tǒng)誤差,則可設(shè)d0=0,由觀察值得,查附表1得tα/2(7)=2.365,而

顯然

,所以兩種測量方法的正確度是一致的。土木工程科學(xué)數(shù)據(jù)分析方法授課內(nèi)容Page:942026/1/41授課內(nèi)容第四章:線性回歸分析

回歸分析(regressionanalysis)是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。同時(shí),回歸分析法可建立一個(gè)相關(guān)性較好的回歸方程(函數(shù)表達(dá)式),以用于預(yù)測因變量今后的變化規(guī)律。在各種回歸分析方法中,線性回歸通常是學(xué)習(xí)預(yù)測模型時(shí)首選的技術(shù)之一。本章介紹一元及多元線性回歸方法的相關(guān)知識(shí)。授課內(nèi)容Page:952026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型

一元線性回歸是描述兩個(gè)變量之間相關(guān)關(guān)系的最簡單回歸模型,通過一元線性回歸模型的建立過程,可以了解回歸分析方法的基本思想以及它在實(shí)際問題研究中的應(yīng)用原理。1、回歸模型的數(shù)學(xué)形式

在對(duì)所研究的問題首先要收集與它有關(guān)的n組樣本數(shù)據(jù)(xi,yi),其中i=1,2,…,n。若只考慮兩個(gè)變量間的關(guān)系,描述上述x與y間線性關(guān)系的數(shù)學(xué)結(jié)構(gòu)通常用式(4.1-1)的形式。(4.1-1)授課內(nèi)容Page:962026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型

式(4.1-1)將實(shí)際問題中變量y與x之間的關(guān)系用兩個(gè)部分描述。一部分是由于x的變化引起y線性變化的部分,即β0

+β1x,另一部分是由其他一切隨機(jī)因素引起的,記為ε。式(4.1-1)確切地表達(dá)了變量x與y之間的密切相關(guān)關(guān)系,但密切的程度又沒有到由x唯一確定y的這種特殊關(guān)系。(4.1-1)授課內(nèi)容Page:972026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型(4.1-1)

式(4.1-1)稱為變量y對(duì)x的一元線性回歸理論模型。一般稱y為被解釋變量(因變量),x為解釋變量(自變量)。式中β0和β1是未知參數(shù),稱β0為回歸常數(shù),β1為回歸系數(shù)。ε表示其他隨機(jī)因素的影響。在式(4.1-1)中一般假定ε是不可觀測的隨機(jī)誤差,它是一個(gè)隨機(jī)變量,通常假定ε滿足(4.1-2)授課內(nèi)容Page:982026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型(4.1-2)(4.1-1)式中,E(ε)表示ε的數(shù)學(xué)期望,Var(ε)表示ε的方差。對(duì)式(4.1-1)兩端求期望得如下回歸方程(4.1-3)授課內(nèi)容Page:992026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型(4.1-1)

一般情況下,對(duì)所研究的某個(gè)實(shí)際問題,獲得n組樣本觀測值(x1,y1),(x2,y2),…,(xn,yn),如果他們符合模型(4.1-1),則(4.1-4)式(4.1-4)即為一元線性回歸模型。其均值和方差分別為:(4.1-5)授課內(nèi)容Page:1002026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型(4.1-4)(4.1-5)

通常還假定n組數(shù)據(jù)是獨(dú)立觀測的,因而y1,y2,…,yn與ε1,ε2,…,εn都是相互獨(dú)立的隨機(jī)變量。而xi(i=1,2,…,n)是確定性變量,其值是可以精確測量和控制的。對(duì)式(4.1-4)兩邊分別求數(shù)學(xué)期望和方差,得(4.1-6)授課內(nèi)容Page:1012026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型(4.1-6)

式(4.1-6)表明隨機(jī)變量y1,y2,,…,yn的期望不等,方差相等,因而y1,y2,…,yn是獨(dú)立的隨機(jī)變量,但并不同分布。而ε1,ε2,…,εn是獨(dú)立同分布的隨機(jī)變量。(4.1-5)E(yi)=β0+β1xi,從平均意義上表達(dá)了變量y與x的統(tǒng)計(jì)規(guī)律性,正確理解回歸方程的這個(gè)特點(diǎn)對(duì)實(shí)際應(yīng)用有重要的指導(dǎo)意義。授課內(nèi)容Page:1022026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型(實(shí)際問題)

回歸分析的主要任務(wù)就是通過n組樣本觀測值(x1,y1)(i=1,2,…,n)對(duì)β0和β1進(jìn)行估計(jì)。一般用分別表示β0,β1的估計(jì)值,則稱式(4.1-7)為y關(guān)于x的一元線性經(jīng)驗(yàn)回歸方程。??????授課內(nèi)容Page:1032026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型

在實(shí)際問題的研究中,為了方便地作區(qū)間估計(jì)和假設(shè)檢驗(yàn),還假定模型(4.1-1)中誤差項(xiàng)ε遵從正態(tài)分布,即

。由于ε1,ε2,…,εn是ε的獨(dú)立且同分布的樣本,因而有(4.1-9)在遵從正態(tài)分布的假定下,隨機(jī)變量yi也遵從正態(tài)分布,即(4.1-10)

一元線性回歸方程的一般形式(4.1-4)可用矩陣表示為(4.1-12)授課內(nèi)容Page:1042026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型

一元線性回歸方程的一般形式(4.1-4)可用矩陣表示為(4.1-12)授課內(nèi)容Page:1052026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型2、回歸參數(shù)的估計(jì)

為了由樣本數(shù)據(jù)得到回歸參數(shù)β0和β1的理想估計(jì)值,一般使用最小二乘法估計(jì)(ordinaryleastsquaresestimate,OLSE)。

所謂最小二乘法,就是尋找參數(shù)β0,β1的估計(jì)值

,使下式定義的離差平方和為極小。(4.1-13)

而后,依照式(4.1-14)求出的

就稱為回歸參數(shù)β0和β1的最小二乘估計(jì)。(4.1-14)授課內(nèi)容Page:1062026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型2、回歸參數(shù)的估計(jì)(4.1-14)

按式(4.1-14)求

是一個(gè)求極值問題。由于Q是關(guān)于

的非負(fù)二次函數(shù),因而它的最小值總是存在的。根據(jù)微積分中求極值的原理可求得的具體取值。進(jìn)而,式(4.1-15)被稱為yi(i=1,2,…,n)的回歸擬合值,簡稱回歸值或擬合值,式(4.1-16)中SSE稱為殘差平方和。(4.1-15)(4.1-16)授課內(nèi)容Page:1072026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型2、回歸參數(shù)的估計(jì)(4.1-15)(4.1-16)

如果殘差平方和為0,則得到一條直線且所有點(diǎn)都在該直線上;如果殘差平方和不為0,則所有點(diǎn)(xi,yi)不會(huì)落在同一條直線上,所以不得不移動(dòng)直線,使其離某些點(diǎn)較近、離其它點(diǎn)較遠(yuǎn)。因此,擬合直線的過程為先計(jì)算出各點(diǎn)的殘差,進(jìn)而算出殘差平方和,再通過最小化殘差平方和,最后選出最好的擬合直線(確定截距和斜率)。授課內(nèi)容Page:1082026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型2、回歸參數(shù)的估計(jì)令式(4.1-16)右端對(duì)

求偏導(dǎo)數(shù)均為0,則有

(4.1-16)(4.1-17)解未知數(shù)為

的二元一次方程(4.1-17),得到(4.1-18)授課內(nèi)容Page:1092026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型2、回歸參數(shù)的估計(jì)可以得到β0和β1的最小二乘估計(jì)量為式中,

。由于

,(4.1-18)(4.1-19)得到一個(gè)實(shí)際問題的經(jīng)驗(yàn)回歸方程授課內(nèi)容Page:1102026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)

當(dāng)?shù)玫揭粋€(gè)實(shí)際問題的經(jīng)驗(yàn)回歸方程

后,還不能直接就用它去作分析和預(yù)測,因?yàn)?/p>

是否真正描述了變量y與x之間的統(tǒng)計(jì)規(guī)律性,還需運(yùn)用統(tǒng)計(jì)方法對(duì)回歸方程進(jìn)行檢驗(yàn),在對(duì)回歸方程進(jìn)行檢驗(yàn)時(shí),通常需要將其假設(shè)為正態(tài)分布,即。

常用的顯著性檢驗(yàn)方法包括t檢驗(yàn)、F檢驗(yàn)、相關(guān)系數(shù)、樣本決定系數(shù)及統(tǒng)計(jì)軟件計(jì)算檢驗(yàn)值等方法。對(duì)一元線性回歸分析而言,t檢驗(yàn)、

F檢驗(yàn)和相關(guān)系數(shù)這三種檢驗(yàn)的結(jié)果是等價(jià)的,因而對(duì)一元線性回歸實(shí)際只需要做其中的一種檢驗(yàn)即可。對(duì)于多元線性回歸,這三種檢驗(yàn)所考慮的問題已有所不同,是三種不同的檢驗(yàn),因而并不等價(jià)。授課內(nèi)容Page:1112026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)t檢驗(yàn)、F檢驗(yàn)的原理及方法在第五章有詳細(xì)介紹,本節(jié)僅針對(duì)相關(guān)系數(shù)、樣本決定系數(shù)及統(tǒng)計(jì)軟件計(jì)算檢驗(yàn)值這三種方法進(jìn)行介紹。本節(jié)以下的檢驗(yàn)內(nèi)容若無特別聲明,都是在正態(tài)分布的假設(shè)下進(jìn)行的。授課內(nèi)容Page:1122026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)1)相關(guān)系數(shù)的顯著性檢驗(yàn)

若設(shè)(xi,yi)(i=1,2,···,n)是(x,y)的n組樣本觀測值,式(4.1-17)稱為x與y的簡單相關(guān)系數(shù),簡稱相關(guān)系數(shù)。(4.1-17)式中,相關(guān)系數(shù)r表示x與y的線性關(guān)系的密切程度,相關(guān)系數(shù)的取值范圍為|r|≤1。授課內(nèi)容Page:1132026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)1)相關(guān)系數(shù)的顯著性檢驗(yàn)(4.1-17)

相關(guān)系數(shù)接近于1的程度與數(shù)據(jù)組數(shù)n有關(guān)。當(dāng)n較小時(shí),相關(guān)系數(shù)的絕對(duì)值容易接近于1,當(dāng)n較大時(shí),相關(guān)系數(shù)的絕對(duì)值容易偏小。特別是當(dāng)n=2時(shí),相關(guān)系數(shù)的絕對(duì)值總為1。因此,在樣本容量較小時(shí),不能僅憑相關(guān)系數(shù)較大就說明變量x與y之間有密切的線性關(guān)系。授課內(nèi)容Page:1142026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)2)樣本決定系數(shù)

回歸平方和SSR與總離差平方和SST之比定義稱為樣本決定系數(shù),記為r2,其表達(dá)式如式(4.1-18)所示。由式(4.1-19)可以證明式(4.1-18)的r2正好是式(4.1-17)中相關(guān)系數(shù)r的平方。(4.1-18)(4.1-19)(4.1-17)授課內(nèi)容Page:1152026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)2)樣本決定系數(shù)(4.1-18)

決定系數(shù)r2是一個(gè)回歸直線與樣本觀測值擬合優(yōu)度的相對(duì)指標(biāo),反映了因變量的波動(dòng)中能用自變量解釋的比例,r2的值總是在0和1之間,也可以用百分量表示。一個(gè)線性回歸模型如果充分利用了x的信息,因變量不確定性的絕大部分能由回歸方程解釋,則r2越接近于1,擬合優(yōu)度就越好。反之,如果r2不大,說明以模型中給出的x對(duì)y解釋的信息還不充分,回歸方程的效果不好,應(yīng)進(jìn)行修改,使x與y的信息得到充分利用。授課內(nèi)容Page:1162026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)2)樣本決定系數(shù)(4.1-18)

一般而言,回歸方程的顯著性檢驗(yàn)與r2值的大小是一致的,即檢驗(yàn)越顯著(概率P值越?。?,r2就越大,但是這種關(guān)系并不是完全確定的,在樣本容量n很大時(shí),對(duì)高度顯著的檢驗(yàn)結(jié)果仍然可能得到一個(gè)小的r2。授課內(nèi)容Page:1172026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)3)用統(tǒng)計(jì)軟件計(jì)算檢驗(yàn)值以SPSS為例,介紹檢驗(yàn)值的計(jì)算方法R.Square即為樣本決定系數(shù)r2;Std.ErroroftheEstimate為標(biāo)準(zhǔn)誤差估計(jì);SumofSquares為離均差平方和;df為自由度;F值是方差檢驗(yàn)量;Sig是significance(顯著性)的簡寫;其它參數(shù),請自查。授課內(nèi)容Page:1182026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型3、回歸方程的顯著性檢驗(yàn)3)用統(tǒng)計(jì)軟件計(jì)算檢驗(yàn)值以SPSS為例,介紹檢驗(yàn)值的計(jì)算方法授課內(nèi)容Page:1192026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型4、預(yù)測和控制

建立回歸模型的目的就是為了應(yīng)用,預(yù)測和控制是回歸模型最重要的應(yīng)用。1)單值預(yù)測

單值預(yù)測就是用單個(gè)值作為因變量新值的預(yù)測值。例如研究水泥產(chǎn)量y與原材料用量x的關(guān)系時(shí),在n塊單位面積的礦山上各原材料用量xi,最后求得相應(yīng)的產(chǎn)量yi,建立回歸方程

。某單位在一塊單位面積的礦山上原材料用量x=x0時(shí),該塊礦山預(yù)期的水泥產(chǎn)量為

,此即因變量新值的單值預(yù)測。預(yù)測目標(biāo)是一個(gè)隨機(jī)變量,因而這個(gè)預(yù)測不能用無偏性來衡量。根據(jù)式

,說明預(yù)測值

與目標(biāo)值y0有相同的均值。授課內(nèi)容Page:1202026/1/41授課內(nèi)容第四章:線性回歸分析4.1一元線性回歸模型4、預(yù)測和控制

建立回歸模型的目的就是為了應(yīng)用,預(yù)測和控制是回歸模型最重要的應(yīng)用。2)控制問題

預(yù)測和控制有著密切的關(guān)系,控制問題相當(dāng)于預(yù)測的反問題。在許多研究問題中,要獲得y在一定的范圍內(nèi)取值,這些問題用數(shù)學(xué)表達(dá)式描述,即要求T1<y<T2。另外,控制問題需要進(jìn)一步討論如何控制x的值才能以1-α的概率保證把目標(biāo)值y控制在T1<y<T2中,即(4.1-20)式中,α是事先給定的小的正數(shù),其取值范圍是0<α<1。授課內(nèi)容Page:1212026/1/41授課內(nèi)容第四章:線性回歸分析作業(yè)題:4.3.1中的表4.3-1,給出回歸模型、回歸參數(shù)、相關(guān)系數(shù)、樣本決定系數(shù)。土木工程科學(xué)數(shù)據(jù)分析方法授課內(nèi)容Page:1232026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸模型

被解釋變量y與多個(gè)解釋變量x有關(guān)的線性回歸問題,即多元線性回歸模型。本節(jié)主要內(nèi)容包括多元線性回歸模型及其基本假設(shè),回歸模型未知參數(shù)的估計(jì)及其性質(zhì),回歸方程及回歸系數(shù)的顯著性檢驗(yàn)等。授課內(nèi)容Page:1242026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸1、回歸模型的數(shù)學(xué)形式設(shè)隨機(jī)變量y與一般變量x1,x2,…,xm的線性回歸模型為(4.2-1)式中,β0,β1,…,βm是m+1個(gè)未知參數(shù),β1,…,βm稱為回歸系數(shù)。y稱為被解釋變量(因變量),而x1,x2,…,xm是m個(gè)可以精確測量并可控制的一般變量,稱為解釋變量(自變量)。m=1時(shí),式(4.2-1)即為一元線性回歸模型,m≥2時(shí),就稱式(4.2-1)為多元線性回歸模型,ε是隨機(jī)誤差。授課內(nèi)容Page:1252026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸1、回歸模型的數(shù)學(xué)形式設(shè)隨機(jī)變量y與一般變量x1,x2,…,xm的線性回歸模型為(4.2-1)式中,β1,…,βm稱為回歸系數(shù),ε是隨機(jī)誤差,與一元線性回歸一樣,對(duì)隨機(jī)誤差項(xiàng)常假定(4.2-2)(4.2-3)在式(4.2-1)和式(4.2-2)基礎(chǔ)上,理論回歸方程可以寫成式(4.2-3)的形式:授課內(nèi)容Page:1262026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸1、回歸模型的數(shù)學(xué)形式

對(duì)一個(gè)實(shí)際問題,如果獲得n組觀測數(shù)據(jù)(xi1,xi2,…,xim;yi),i=1,2,…,n,則線性回歸模型可表示為(4.2-4)式(4.2-4)寫成矩陣形式為(4.2-5)授課內(nèi)容Page:1272026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸2、基本假定

為了便于進(jìn)行模型的參數(shù)估計(jì),對(duì)回歸方程(4.2-4)做如下一些基本假定:

(1)解釋變量x1,x2,…,xm是確定性變量,不是隨機(jī)變量,且要求rank(X)=m+1<n。這里的rank(X)=m+1<n,表明設(shè)計(jì)矩陣X中的自變量列之間不相關(guān),樣本容量的個(gè)數(shù)應(yīng)大于解釋變量的個(gè)數(shù),X是滿秩矩陣。(2)隨機(jī)誤差項(xiàng)具有0均值和等方差,即(3)正態(tài)分布的假定條件為授課內(nèi)容Page:1282026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸3、回歸參數(shù)的估計(jì)

多元線性回歸方程未知參數(shù)β0、β1、β2、…、βm的估計(jì)與一元線性回歸方程的參數(shù)估計(jì)原理一樣,仍然采用最小二乘法估計(jì)。對(duì)于式(4.2-5)矩陣形式表示的回歸模型y=Xβ+ε,就是尋找參數(shù)β0、β1、β2、…、βm的估計(jì)值

(β0尖)、、、···、,使離差平方和達(dá)極小值,即尋找

、、、…、

滿足:(4.2-12)

依照式(4.2-12)求出的

、、、···、就稱為回歸參數(shù)β0、β1、β2、…、βm的最小二乘估計(jì)。授課內(nèi)容Page:1292026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸3、回歸參數(shù)的估計(jì)

根據(jù)微積分中求極值的原理,

、、、···、應(yīng)滿足下列方程組:(4.2-13)授課內(nèi)容Page:1302026/1/41授課內(nèi)容第四章:線性回歸分析4.2多元線性回歸3、回歸參數(shù)的估計(jì)以上方程組經(jīng)整理后,得出用矩陣形式表示的方程組(4.2-14)移項(xiàng)得

,當(dāng)(XTX)-1存在時(shí),即得回歸參數(shù)的最小二乘估計(jì)為(4.2-15)(4.2-16)式(4.2-16)稱為經(jīng)驗(yàn)回歸方程。

多元回歸的計(jì)算量要比一元回歸大得多,手工計(jì)算難度非常大,費(fèi)時(shí)費(fèi)力,難以保證結(jié)果的準(zhǔn)確性,建議用SPSS或MATLAB軟件完成計(jì)算。授課內(nèi)容1授課內(nèi)容第四章:線性回歸分析4.3土木工程中的應(yīng)用案例編號(hào)庫水位(m)沉陷量(mm)(編號(hào))庫水位(m)沉陷量(mm)1102.714-1.967135.046-5.46295.154-1.888140.373-5.693114.364-3.969144.958-3.944120.170-3.3110141.011-5.825126.630-4.9411130.308-4.186129.393-5.6912121.234-2.90表4.3-1大壩的水位與沉降量數(shù)據(jù)

表4.3-1為我國某水壩的庫水位與大壩沉降量的觀測數(shù)據(jù),試采用回歸分析方法對(duì)大壩的變形值進(jìn)行預(yù)測。授課內(nèi)容1授課內(nèi)容第四章:線性回歸分析4.3土木工程中的應(yīng)用案例

設(shè)水庫水位為x,沉陷量y,將以上數(shù)據(jù)輸入MATLAB中進(jìn)行分析,利用matlab軟件可以得到y(tǒng)關(guān)于x的散點(diǎn)圖如圖3.3-1所示。圖4.3-1水壩沉降量與水庫水位的散點(diǎn)圖

由于提取的數(shù)據(jù)包含有其它各方面的影響因素,綜合考慮其它因素的影響,由圖1可知,沉陷量y和水庫水位x成線性相關(guān)關(guān)系,因此,可以設(shè)x與y為一元回歸線性模型,其具體表達(dá)式為:

,式中β0、ε為常數(shù)項(xiàng),β1為變量的系數(shù)。授課內(nèi)容1授課內(nèi)容第四章:線性回歸分析4.3土木工程中的應(yīng)用案例在matlab中輸入編碼如下:x=[102.71495.154114.364120.170126.630129.393135.046140.373144.958141.011];y=[-1.96-1.88-3.96-3.31-4.94-5.69-5.46-5.69-3.94-5.82];X=sum(x)/10;Y=sum(y)/10;A=ones(1,10)*X;B=ones(1,10)*Y;Sx=x-A;Sy=y-B;Sxx=sum(Sx.*Sx);Sxy=sum(Sx.*Sy);P1=Sxy/Sxx;P0=Y-X*P1;結(jié)果輸出:P1=Sxy/SxxP1=-0.0749P0=Y-X*P1P0=5.0967故回歸模型為授課內(nèi)容1授課內(nèi)容第四章:線性回歸分析4.3土木工程中的應(yīng)用案例模型參數(shù)的顯著性檢驗(yàn)在matlab中輸入以下的編碼:X=[ones(10,1),x'];[b,bint,r,rint,s]=regress(y',X);上式中,b表示回歸方程系數(shù)估計(jì)值;bint返回系數(shù)估計(jì)值的95%置信區(qū)間矩陣;r表示由殘差組成的向量;rint表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論