對葡萄酒的評價(jià)的分析_第1頁
對葡萄酒的評價(jià)的分析_第2頁
對葡萄酒的評價(jià)的分析_第3頁
對葡萄酒的評價(jià)的分析_第4頁
對葡萄酒的評價(jià)的分析_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1/1對葡萄酒的評價(jià)的分析對葡萄酒的評價(jià)的分析

林彩密葛欣雨蔣耀萱

問題一的解答

本文提供了大量與葡萄酒有關(guān)的數(shù)據(jù),要求參賽者通過數(shù)據(jù)的處理確定葡萄酒的質(zhì)量。主要設(shè)及4個(gè)問題:

1、分析附件1中兩組評酒員的評價(jià)結(jié)果有無顯著性差異,哪一組結(jié)果更可信?

2、根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級。

3、分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。

4、分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評價(jià)葡萄酒的質(zhì)量。

問題一要求我們分析兩組評酒員評價(jià)結(jié)果有無顯著性差異。在進(jìn)行差異性檢驗(yàn)之前必須先對數(shù)據(jù)服從的分布進(jìn)行檢驗(yàn),從而選定合適的檢驗(yàn)方法進(jìn)行檢驗(yàn)。

問題二要求根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對釀酒葡萄進(jìn)行分級。由題意可知除了葡萄酒的質(zhì)量對葡萄的分級有比較大的影響外,釀酒葡萄的理化指標(biāo)在一定程度上也會影響葡萄的質(zhì)量。問題意在讓我們建立一個(gè)綜合葡萄酒質(zhì)量與釀酒葡萄理化指標(biāo)綜合影響和葡萄分級的模型。

問題三要求分析釀酒葡萄與葡萄酒理化指標(biāo)之間的聯(lián)系。由于釀酒葡萄理化指標(biāo)眾多,在分析兩者的聯(lián)系之前需要對葡萄的理化指標(biāo)進(jìn)行篩選。

問題四要求分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評價(jià)葡萄酒的質(zhì)量。難點(diǎn)在于對附件三葡萄酒和葡萄芳香物數(shù)據(jù)的使用。

這是關(guān)于大型數(shù)據(jù)處理與分析的結(jié)果,前面三個(gè)問題是第四個(gè)問題的基礎(chǔ),最終目的是分析葡萄和葡萄酒理化指標(biāo)對葡萄酒質(zhì)量的影響。

問題二的解答

我們選擇的論文是《葡萄酒的評價(jià)》(附件一),這篇論文主要過程如下:

問題一:

問題二數(shù)據(jù)標(biāo)準(zhǔn)化處理

逐步回歸:線性回歸擬合

聚類分析:SPSS進(jìn)行聚類,進(jìn)行分級檢驗(yàn)

問題一顯著性差異的

檢驗(yàn)

正態(tài)分布檢驗(yàn):SPSS

評價(jià)可靠性

判斷

離散程度分析

模型改進(jìn)可靠性評價(jià)指標(biāo)

(不符合正態(tài)分布)

(結(jié)果無顯著性差)

(大致是正態(tài)分布)

標(biāo)準(zhǔn)化數(shù)據(jù)再進(jìn)行顯著性檢驗(yàn):SPSS,f檢驗(yàn)

頻數(shù)分布圖進(jìn)行分布初步分析

非參數(shù)檢驗(yàn):秩和檢驗(yàn)

(檢驗(yàn)結(jié)果知,二者評價(jià)結(jié)果具有顯著性差異)

在問題四中,先用用逐步回歸法分析葡萄酒理化指標(biāo)對葡萄酒質(zhì)量的影響,然后建立了芳香物質(zhì)對葡萄酒質(zhì)量影響的函數(shù)關(guān)系。

問題三、四的解答

文中主要用到了逐步回歸的擬合方法,公式

β0,β1,β2,β3…βn是待估參數(shù),ε是表示誤差的隨機(jī)變量。

逐步回歸的基本思想是:對全部因子按其對y影響程度大小(偏回歸平方的大?。?,從大

到小地依次逐個(gè)地引入回歸方程,并隨時(shí)對回歸方程當(dāng)時(shí)所含的全部變量進(jìn)行檢驗(yàn),看其是否仍然顯著,如不顯著就將其剔除,知道回歸方程中所含的所有變量對y的作用都顯著是,才考慮引入新的變量。再在剩下的未選因子中,選出對y作用最大者,檢驗(yàn)其顯著性,顯著著,引入方程,不顯著,則不引入。直到最后再沒有顯著因子可以引入,也沒有不顯著的變量需要剔除為止。

逐步回歸分析時(shí)在考慮的全部自變量中按其對y的貢獻(xiàn)程度大小,由大到小地逐個(gè)引入回歸方程,而對那些對y作用不顯著的變量可能是中不被引入回歸方程。另外,已被引入回歸方程的變量在引入新變量進(jìn)行F檢驗(yàn)后失去重要性時(shí),需要從回歸方程中剔除出去。

求回歸方程的方法步驟如下:

問題

分析影響

Eviews擬合方程

問題

數(shù)據(jù)預(yù)處理

釀酒葡萄理化性質(zhì):利用Matlab生成相關(guān)矩陣

逐步回歸:利用Eviews

模型改進(jìn)

設(shè)有含量為n的樣本,對每個(gè)觀察單位觀察了m個(gè)自變量Xj(j=1,2,…m)和一個(gè)應(yīng)變量Y(可記為Xm+1),得原始數(shù)據(jù)如表1。

表1原始數(shù)據(jù)格式

觀察單位編號

變量

X1

X2

?Xm

Y=Xm+1

12…

X11X21…

X12X22…

………

X1mX2m…

X1,m+1X2,m+1…

nXn1Xn2…XnmXn,m+1

(一)數(shù)據(jù)的標(biāo)準(zhǔn)化轉(zhuǎn)換

其中:

是原變量的平均數(shù)、標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)化變量中:

1s1,s0,x0,y*i*y*

i*====

標(biāo)準(zhǔn)化變量的回歸方程:

)(0bxb...xbxbby*

0*

p

*p*2*2*1*1*0*=++++=?

解下列方程組可求標(biāo)準(zhǔn)化變量的回歸系數(shù):

其中:

)(1,2,...,nt,p1,2,...,ii

i

ti*ti

yt*tsxxx,syyy==-=-=

iyis,s,x,y**

py*p*pp*2*p2*1*p1**

2y*1*2p*2*22*1*21**1y*p*1p*2*12*1*11LbLbLbL

LbLbLbLLbLbLbL=+++=+++=+++{

∑∑∑====-=-=n

1

t2*i

tn1t2

*i

tn1t2*i

*

i

t*i

ix0xxxL)()()(i

iiiii2

iiin

1

t2

i

i

itr1n1n/LLsLsxx)()

()(

-=-=

=

-=∑=j

ij

jiij

ijjiij

ij

iji*jir1nLLL

1n1/nL1/nLLssLL)()

()

)((-=-=--=

=

(i=1,2,…,p;j=1,2,……,p)

將原方程組的系數(shù)改換為相關(guān)系數(shù)的形式,再將(n-1)消去,得下面的形式。

標(biāo)準(zhǔn)化變量回歸系數(shù)與原變量的回歸系數(shù)間的關(guān)系可以表示為下面的形式:

(見下面推導(dǎo)過程)

因?yàn)?/p>

所以

(二)初始相關(guān)矩陣

將正規(guī)方程組等號兩邊的簡相關(guān)系數(shù)構(gòu)成矩陣,稱增廣矩陣,在其下方添上一行構(gòu)成對稱矩陣,稱初始陣R(0),其實(shí)初始陣就是第十章所研究的簡相關(guān)系數(shù)矩陣R。引入或剔除變量后都要按一定規(guī)則對R(k)逐步變換來進(jìn)行。(k為變換次數(shù))。

R(0)=

1.偏回歸(貢獻(xiàn))的計(jì)算及相關(guān)陣的轉(zhuǎn)換

無論是引入或剔除一個(gè)因子都要計(jì)算該因子的偏回歸平方和(貢獻(xiàn)),計(jì)算式如下。k=1,2,3,…

y

iy

yiiyiyyiiy

iy

iyi*y

ir1nLLL1n1n/L1n/LLssLL)()

()]

()][([-=-=--=

=

py*Ppp*2p2*1p12y

*12p*222*1211y*P1P*212*111rbrbrbr

rbrbrbrrbrbrbr=+++=+++=+++{

)

(0b*

0=yy

ypy3y2y1pyppp3p2p12y

2p2322211y1p131211rrrrrrrrrrrrrrrrrrrr)

()()

(][1kii21kyiki

rrV--=

y

i

i*iiy*iiss

bb,ssbb==yiyi*y

iiiii*i

issLL,ssLL==y

iyi*y

ii

iii*i

issLL,ssLL=

=

)(tj,ti≠≠

)(tj,ti=≠

R(k)=)(tj,ti≠=

其中:k為第k次轉(zhuǎn)換,i為第i行,j為第j列。rij為R(k)中第i行,第j列的元素,t為引入或剔除因子序號。當(dāng)引入因子時(shí)應(yīng)取Vi中最大者,當(dāng)剔除因子時(shí)應(yīng)取Vi中最小者。每引入一個(gè)因子或者剔除一個(gè)因子,矩陣R(k)都要進(jìn)行變換。每一次變換結(jié)果,矩陣的最右一列的最后一個(gè)值就是標(biāo)準(zhǔn)化變量的Q*,而U*=1-Q*,被引入變量xi的回歸系數(shù)bi就是該列的第i個(gè)元素的值。

先規(guī)定一個(gè)F*值,作為引入或剔除自變量時(shí)進(jìn)行F檢驗(yàn)的界值。對于給定的顯著性水準(zhǔn)a來說,每一步作檢驗(yàn)時(shí)的Fa(1,n-m′-1)值是不同的,f但由于樣本含量n比引入自變量的個(gè)數(shù)m′大得多(一般在10倍以上),所以各步的m′雖然不同,但Fa(1,n-m′-1)值都近似相等。故為方便起見,可取一個(gè)定數(shù)F*作為F檢驗(yàn)的標(biāo)準(zhǔn)。2.計(jì)算每個(gè)變量的均數(shù)Xj、離均差平方和(lii、ljj),每兩個(gè)變量的離均差積和lij,以及相關(guān)系數(shù)rij,

并以求得的

rij為元素列出原始相關(guān)矩陣R(0)(陣中rij(0)=rij):

以后每引入或剔除一個(gè)變量都計(jì)為一步運(yùn)算。設(shè)R(0)經(jīng)L步所得的R(L)為

??

???

?

?????==-=-=)

()()

()

()()

()

()()()()()()(1kttktt1kt

t1kij

ktj1kt

t1ktikti1ktt1ktj1kti1kijkij1/rrrrrrrr/rrrrr)(tj,ti==

對于每一步,R(L)均同樣按式(2)變換成R(L+1)。設(shè)引入或剔除的變量為Xg(g為

該變量的下標(biāo)),按式(2)作變換Lg,則R(L)成R(L+1)時(shí),兩矩陣中的各元素rij,有如下關(guān)系式:

(三)選自變量。

1.引入未選量。按式(3)計(jì)算各未選量的偏回歸平方和Vj(L+1),

找出其中最大者,記作Va(L+1),就它所對應(yīng)的自變量Xa按式(4)作F檢驗(yàn):

式中m′為已引入變量的個(gè)數(shù)。當(dāng)F1>F*時(shí)引入變量X

a

,并對R(L)按式(2)作變

換La,得R(L+1);當(dāng)F

1

≤F*時(shí)挑選變量工作就此結(jié)束。

2.剔除已選量。引入新變量后,對原先引入的已選量分別計(jì)算其偏回歸平方和Vj(L):

3.找出V

j(L)中最小者,記作Vb(L)。就Vb(L)所對應(yīng)的自變量X

b

按式(6)作F檢驗(yàn)。

當(dāng)F

2≤F*時(shí),剔除X

b

,并對R(L)按式(2)作變換L

b

得R(L+1);下一步對其余已選量

再按式(5)、(6)求V

j并作F檢驗(yàn),直到已選量中沒有可剔除時(shí)為止;當(dāng)F

2

>F*時(shí),已

選量都不能被剔除,于是再考慮從未選量中能否引入新變量。如此反復(fù)進(jìn)行到第L步,若已選量都不能被剔除,未選量都不能引入時(shí),逐步運(yùn)算結(jié)束。

4.求回歸方程。由相關(guān)矩陣R(L)求得的回歸方程

稱為標(biāo)準(zhǔn)回歸方程,式中b′

j

是標(biāo)準(zhǔn)偏回歸系數(shù),按式(7)求得。

b'

j=r

j

.m+1(L)。(7)

實(shí)用中多元線性回歸方程常用變量X

j

的原單位,因此須再按式(8)求化成原單

位后X

j的偏回歸系數(shù)b

j

。

式中l(wèi)

m+1,m+1=l

YY

,即Y的離均差平方和,l

jj

為X

j

的離均差平方和?;貧w方程

的常數(shù)項(xiàng)按式(9)計(jì)算,

b0=-∑bjXj,(9)

式中j為已選量的下標(biāo)。于是得多元回歸方程為

?=b0+∑bjXj。(10)

5.回歸方程的線性假設(shè)檢驗(yàn)。按式(11)作方差分析。

回歸的剩余標(biāo)準(zhǔn)誤差s按式(12)計(jì)算。

其意義標(biāo)準(zhǔn)誤差定義為各測量值誤差的平方和的平均值的平方根,故又稱為均方誤差。

多元相關(guān)系數(shù)R按式(13)計(jì)算,R是可決系數(shù),用來表示擬合優(yōu)度。人越大,擬合效果越好。

求得多元線性回歸方程后,就可利用它來進(jìn)行預(yù)測。春天

的風(fēng)是有靈性的,依著風(fēng)的眼眸,我看到了那一株株桃花讀信的倩影,在桃林深處,紫色的青藤爬滿那個(gè)小屋。我的小城,桃花已然開成海,像是一場粉色的春夢。是否,可以赴一場最美的相逢,如是,便不負(fù)曾經(jīng)許下的約定。守住心底最美風(fēng)景,是一種風(fēng)度,一種期望。讓心,隨花兒輕舞,讓夢,隨蝶兒翩躚。

等一縷柔風(fēng)載滿詩意,落滿我的小院,好想,牽著你的手走在花開的路上,臨摹又一個(gè)春的相遇,陌上綠色蔓延,讓深情的詩句落在眉彎,打開靈魂的心門,寫盡情意綿綿。春雨如絲,暖了一季寒涼露出溫暖,碧水映藍(lán)天,云朵兒似乎摸到嫩草尖尖?;ㄏ闶铮迪阌?。我們微笑著,不說話,就十分美好。

生命里,總會有一些人,漸行漸遠(yuǎn),偶爾想起,卻只是停留在文字里,那一抹淡淡的回憶。唯有春天,總那么詩意明亮,始終暈染著眉心,讓澀澀的往事隨風(fēng),讓一些溫暖的記憶溫潤著心房。珍惜眼前的幸福,緊握手中的暖意,面向青山綠水,一路微笑,一路行走

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論