版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1/1對葡萄酒的評價(jià)的分析對葡萄酒的評價(jià)的分析
林彩密葛欣雨蔣耀萱
問題一的解答
本文提供了大量與葡萄酒有關(guān)的數(shù)據(jù),要求參賽者通過數(shù)據(jù)的處理確定葡萄酒的質(zhì)量。主要設(shè)及4個(gè)問題:
1、分析附件1中兩組評酒員的評價(jià)結(jié)果有無顯著性差異,哪一組結(jié)果更可信?
2、根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級。
3、分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。
4、分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評價(jià)葡萄酒的質(zhì)量。
問題一要求我們分析兩組評酒員評價(jià)結(jié)果有無顯著性差異。在進(jìn)行差異性檢驗(yàn)之前必須先對數(shù)據(jù)服從的分布進(jìn)行檢驗(yàn),從而選定合適的檢驗(yàn)方法進(jìn)行檢驗(yàn)。
問題二要求根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對釀酒葡萄進(jìn)行分級。由題意可知除了葡萄酒的質(zhì)量對葡萄的分級有比較大的影響外,釀酒葡萄的理化指標(biāo)在一定程度上也會影響葡萄的質(zhì)量。問題意在讓我們建立一個(gè)綜合葡萄酒質(zhì)量與釀酒葡萄理化指標(biāo)綜合影響和葡萄分級的模型。
問題三要求分析釀酒葡萄與葡萄酒理化指標(biāo)之間的聯(lián)系。由于釀酒葡萄理化指標(biāo)眾多,在分析兩者的聯(lián)系之前需要對葡萄的理化指標(biāo)進(jìn)行篩選。
問題四要求分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評價(jià)葡萄酒的質(zhì)量。難點(diǎn)在于對附件三葡萄酒和葡萄芳香物數(shù)據(jù)的使用。
這是關(guān)于大型數(shù)據(jù)處理與分析的結(jié)果,前面三個(gè)問題是第四個(gè)問題的基礎(chǔ),最終目的是分析葡萄和葡萄酒理化指標(biāo)對葡萄酒質(zhì)量的影響。
問題二的解答
我們選擇的論文是《葡萄酒的評價(jià)》(附件一),這篇論文主要過程如下:
問題一:
問題二數(shù)據(jù)標(biāo)準(zhǔn)化處理
逐步回歸:線性回歸擬合
聚類分析:SPSS進(jìn)行聚類,進(jìn)行分級檢驗(yàn)
問題一顯著性差異的
檢驗(yàn)
正態(tài)分布檢驗(yàn):SPSS
評價(jià)可靠性
判斷
離散程度分析
模型改進(jìn)可靠性評價(jià)指標(biāo)
(不符合正態(tài)分布)
(結(jié)果無顯著性差)
(大致是正態(tài)分布)
標(biāo)準(zhǔn)化數(shù)據(jù)再進(jìn)行顯著性檢驗(yàn):SPSS,f檢驗(yàn)
頻數(shù)分布圖進(jìn)行分布初步分析
非參數(shù)檢驗(yàn):秩和檢驗(yàn)
(檢驗(yàn)結(jié)果知,二者評價(jià)結(jié)果具有顯著性差異)
在問題四中,先用用逐步回歸法分析葡萄酒理化指標(biāo)對葡萄酒質(zhì)量的影響,然后建立了芳香物質(zhì)對葡萄酒質(zhì)量影響的函數(shù)關(guān)系。
問題三、四的解答
文中主要用到了逐步回歸的擬合方法,公式
β0,β1,β2,β3…βn是待估參數(shù),ε是表示誤差的隨機(jī)變量。
逐步回歸的基本思想是:對全部因子按其對y影響程度大小(偏回歸平方的大?。?,從大
到小地依次逐個(gè)地引入回歸方程,并隨時(shí)對回歸方程當(dāng)時(shí)所含的全部變量進(jìn)行檢驗(yàn),看其是否仍然顯著,如不顯著就將其剔除,知道回歸方程中所含的所有變量對y的作用都顯著是,才考慮引入新的變量。再在剩下的未選因子中,選出對y作用最大者,檢驗(yàn)其顯著性,顯著著,引入方程,不顯著,則不引入。直到最后再沒有顯著因子可以引入,也沒有不顯著的變量需要剔除為止。
逐步回歸分析時(shí)在考慮的全部自變量中按其對y的貢獻(xiàn)程度大小,由大到小地逐個(gè)引入回歸方程,而對那些對y作用不顯著的變量可能是中不被引入回歸方程。另外,已被引入回歸方程的變量在引入新變量進(jìn)行F檢驗(yàn)后失去重要性時(shí),需要從回歸方程中剔除出去。
求回歸方程的方法步驟如下:
問題
四
分析影響
Eviews擬合方程
問題
三
數(shù)據(jù)預(yù)處理
釀酒葡萄理化性質(zhì):利用Matlab生成相關(guān)矩陣
逐步回歸:利用Eviews
模型改進(jìn)
設(shè)有含量為n的樣本,對每個(gè)觀察單位觀察了m個(gè)自變量Xj(j=1,2,…m)和一個(gè)應(yīng)變量Y(可記為Xm+1),得原始數(shù)據(jù)如表1。
表1原始數(shù)據(jù)格式
觀察單位編號
變量
X1
X2
?Xm
Y=Xm+1
12…
X11X21…
X12X22…
………
X1mX2m…
X1,m+1X2,m+1…
nXn1Xn2…XnmXn,m+1
(一)數(shù)據(jù)的標(biāo)準(zhǔn)化轉(zhuǎn)換
其中:
是原變量的平均數(shù)、標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)化變量中:
1s1,s0,x0,y*i*y*
i*====
標(biāo)準(zhǔn)化變量的回歸方程:
)(0bxb...xbxbby*
0*
p
*p*2*2*1*1*0*=++++=?
解下列方程組可求標(biāo)準(zhǔn)化變量的回歸系數(shù):
其中:
)(1,2,...,nt,p1,2,...,ii
i
ti*ti
yt*tsxxx,syyy==-=-=
iyis,s,x,y**
py*p*pp*2*p2*1*p1**
2y*1*2p*2*22*1*21**1y*p*1p*2*12*1*11LbLbLbL
LbLbLbLLbLbLbL=+++=+++=+++{
∑∑∑====-=-=n
1
t2*i
tn1t2
*i
tn1t2*i
*
i
t*i
ix0xxxL)()()(i
iiiii2
iiin
1
t2
i
i
itr1n1n/LLsLsxx)()
()(
-=-=
=
-=∑=j
ij
jiij
ijjiij
ij
iji*jir1nLLL
1n1/nL1/nLLssLL)()
()
)((-=-=--=
=
(i=1,2,…,p;j=1,2,……,p)
將原方程組的系數(shù)改換為相關(guān)系數(shù)的形式,再將(n-1)消去,得下面的形式。
標(biāo)準(zhǔn)化變量回歸系數(shù)與原變量的回歸系數(shù)間的關(guān)系可以表示為下面的形式:
(見下面推導(dǎo)過程)
因?yàn)?/p>
所以
(二)初始相關(guān)矩陣
將正規(guī)方程組等號兩邊的簡相關(guān)系數(shù)構(gòu)成矩陣,稱增廣矩陣,在其下方添上一行構(gòu)成對稱矩陣,稱初始陣R(0),其實(shí)初始陣就是第十章所研究的簡相關(guān)系數(shù)矩陣R。引入或剔除變量后都要按一定規(guī)則對R(k)逐步變換來進(jìn)行。(k為變換次數(shù))。
R(0)=
1.偏回歸(貢獻(xiàn))的計(jì)算及相關(guān)陣的轉(zhuǎn)換
無論是引入或剔除一個(gè)因子都要計(jì)算該因子的偏回歸平方和(貢獻(xiàn)),計(jì)算式如下。k=1,2,3,…
y
iy
yiiyiyyiiy
iy
iyi*y
ir1nLLL1n1n/L1n/LLssLL)()
()]
()][([-=-=--=
=
py*Ppp*2p2*1p12y
*12p*222*1211y*P1P*212*111rbrbrbr
rbrbrbrrbrbrbr=+++=+++=+++{
)
(0b*
0=yy
ypy3y2y1pyppp3p2p12y
2p2322211y1p131211rrrrrrrrrrrrrrrrrrrr)
()()
(][1kii21kyiki
rrV--=
y
i
i*iiy*iiss
bb,ssbb==yiyi*y
iiiii*i
issLL,ssLL==y
iyi*y
ii
iii*i
issLL,ssLL=
=
)(tj,ti≠≠
)(tj,ti=≠
R(k)=)(tj,ti≠=
其中:k為第k次轉(zhuǎn)換,i為第i行,j為第j列。rij為R(k)中第i行,第j列的元素,t為引入或剔除因子序號。當(dāng)引入因子時(shí)應(yīng)取Vi中最大者,當(dāng)剔除因子時(shí)應(yīng)取Vi中最小者。每引入一個(gè)因子或者剔除一個(gè)因子,矩陣R(k)都要進(jìn)行變換。每一次變換結(jié)果,矩陣的最右一列的最后一個(gè)值就是標(biāo)準(zhǔn)化變量的Q*,而U*=1-Q*,被引入變量xi的回歸系數(shù)bi就是該列的第i個(gè)元素的值。
先規(guī)定一個(gè)F*值,作為引入或剔除自變量時(shí)進(jìn)行F檢驗(yàn)的界值。對于給定的顯著性水準(zhǔn)a來說,每一步作檢驗(yàn)時(shí)的Fa(1,n-m′-1)值是不同的,f但由于樣本含量n比引入自變量的個(gè)數(shù)m′大得多(一般在10倍以上),所以各步的m′雖然不同,但Fa(1,n-m′-1)值都近似相等。故為方便起見,可取一個(gè)定數(shù)F*作為F檢驗(yàn)的標(biāo)準(zhǔn)。2.計(jì)算每個(gè)變量的均數(shù)Xj、離均差平方和(lii、ljj),每兩個(gè)變量的離均差積和lij,以及相關(guān)系數(shù)rij,
并以求得的
rij為元素列出原始相關(guān)矩陣R(0)(陣中rij(0)=rij):
以后每引入或剔除一個(gè)變量都計(jì)為一步運(yùn)算。設(shè)R(0)經(jīng)L步所得的R(L)為
??
???
?
?????==-=-=)
()()
()
()()
()
()()()()()()(1kttktt1kt
t1kij
ktj1kt
t1ktikti1ktt1ktj1kti1kijkij1/rrrrrrrr/rrrrr)(tj,ti==
對于每一步,R(L)均同樣按式(2)變換成R(L+1)。設(shè)引入或剔除的變量為Xg(g為
該變量的下標(biāo)),按式(2)作變換Lg,則R(L)成R(L+1)時(shí),兩矩陣中的各元素rij,有如下關(guān)系式:
(三)選自變量。
1.引入未選量。按式(3)計(jì)算各未選量的偏回歸平方和Vj(L+1),
找出其中最大者,記作Va(L+1),就它所對應(yīng)的自變量Xa按式(4)作F檢驗(yàn):
式中m′為已引入變量的個(gè)數(shù)。當(dāng)F1>F*時(shí)引入變量X
a
,并對R(L)按式(2)作變
換La,得R(L+1);當(dāng)F
1
≤F*時(shí)挑選變量工作就此結(jié)束。
2.剔除已選量。引入新變量后,對原先引入的已選量分別計(jì)算其偏回歸平方和Vj(L):
3.找出V
j(L)中最小者,記作Vb(L)。就Vb(L)所對應(yīng)的自變量X
b
按式(6)作F檢驗(yàn)。
當(dāng)F
2≤F*時(shí),剔除X
b
,并對R(L)按式(2)作變換L
b
得R(L+1);下一步對其余已選量
再按式(5)、(6)求V
j并作F檢驗(yàn),直到已選量中沒有可剔除時(shí)為止;當(dāng)F
2
>F*時(shí),已
選量都不能被剔除,于是再考慮從未選量中能否引入新變量。如此反復(fù)進(jìn)行到第L步,若已選量都不能被剔除,未選量都不能引入時(shí),逐步運(yùn)算結(jié)束。
4.求回歸方程。由相關(guān)矩陣R(L)求得的回歸方程
稱為標(biāo)準(zhǔn)回歸方程,式中b′
j
是標(biāo)準(zhǔn)偏回歸系數(shù),按式(7)求得。
b'
j=r
j
.m+1(L)。(7)
實(shí)用中多元線性回歸方程常用變量X
j
的原單位,因此須再按式(8)求化成原單
位后X
j的偏回歸系數(shù)b
j
。
式中l(wèi)
m+1,m+1=l
YY
,即Y的離均差平方和,l
jj
為X
j
的離均差平方和?;貧w方程
的常數(shù)項(xiàng)按式(9)計(jì)算,
b0=-∑bjXj,(9)
式中j為已選量的下標(biāo)。于是得多元回歸方程為
?=b0+∑bjXj。(10)
5.回歸方程的線性假設(shè)檢驗(yàn)。按式(11)作方差分析。
回歸的剩余標(biāo)準(zhǔn)誤差s按式(12)計(jì)算。
其意義標(biāo)準(zhǔn)誤差定義為各測量值誤差的平方和的平均值的平方根,故又稱為均方誤差。
多元相關(guān)系數(shù)R按式(13)計(jì)算,R是可決系數(shù),用來表示擬合優(yōu)度。人越大,擬合效果越好。
求得多元線性回歸方程后,就可利用它來進(jìn)行預(yù)測。春天
的風(fēng)是有靈性的,依著風(fēng)的眼眸,我看到了那一株株桃花讀信的倩影,在桃林深處,紫色的青藤爬滿那個(gè)小屋。我的小城,桃花已然開成海,像是一場粉色的春夢。是否,可以赴一場最美的相逢,如是,便不負(fù)曾經(jīng)許下的約定。守住心底最美風(fēng)景,是一種風(fēng)度,一種期望。讓心,隨花兒輕舞,讓夢,隨蝶兒翩躚。
等一縷柔風(fēng)載滿詩意,落滿我的小院,好想,牽著你的手走在花開的路上,臨摹又一個(gè)春的相遇,陌上綠色蔓延,讓深情的詩句落在眉彎,打開靈魂的心門,寫盡情意綿綿。春雨如絲,暖了一季寒涼露出溫暖,碧水映藍(lán)天,云朵兒似乎摸到嫩草尖尖?;ㄏ闶铮迪阌?。我們微笑著,不說話,就十分美好。
生命里,總會有一些人,漸行漸遠(yuǎn),偶爾想起,卻只是停留在文字里,那一抹淡淡的回憶。唯有春天,總那么詩意明亮,始終暈染著眉心,讓澀澀的往事隨風(fēng),讓一些溫暖的記憶溫潤著心房。珍惜眼前的幸福,緊握手中的暖意,面向青山綠水,一路微笑,一路行走
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院員工培訓(xùn)與考核制度
- 企業(yè)員工培訓(xùn)與技能發(fā)展路徑制度
- 交通管制與疏導(dǎo)方案制度
- 2026年會計(jì)師繼續(xù)教育練習(xí)題企業(yè)會計(jì)準(zhǔn)則
- 2026年經(jīng)濟(jì)學(xué)理論與經(jīng)濟(jì)現(xiàn)象分析試題
- 2026年社會調(diào)查與研究方法理論考試題庫
- 2026年醫(yī)師資格考試疾病診斷與治療方案分析
- 跨境數(shù)字貨幣支付結(jié)算合規(guī)審查服務(wù)合同
- 2026年新版御夫座協(xié)議
- 檢驗(yàn)科檢驗(yàn)數(shù)據(jù)錄入錯(cuò)誤的處理制度及流程
- 新疆環(huán)保行業(yè)前景分析報(bào)告
- 2025~2026學(xué)年福建省泉州五中七年級上學(xué)期期中測試英語試卷
- 聯(lián)合辦公合同范本
- 2025年生物多樣性保護(hù)與生態(tài)修復(fù)項(xiàng)目可行性研究報(bào)告
- 2025年黑龍江省檢察院公益訴訟業(yè)務(wù)競賽測試題及答案解析
- 一氧化碳中毒救治課件
- 廣東事業(yè)單位歷年考試真題及答案
- 《會計(jì)信息化工作規(guī)范》解讀(楊楊)
- 工程機(jī)械設(shè)備租賃服務(wù)方案投標(biāo)文件(技術(shù)方案)
- 高海拔地區(qū)GNSS大壩監(jiān)測技術(shù)研究
- 實(shí)施指南(2025)《DL-T 1630-2016氣體絕緣金屬封閉開關(guān)設(shè)備局部放電特高頻檢測技術(shù)規(guī)范》
評論
0/150
提交評論