數(shù)學(xué)建模:spss統(tǒng)計分析_第1頁
數(shù)學(xué)建模:spss統(tǒng)計分析_第2頁
數(shù)學(xué)建模:spss統(tǒng)計分析_第3頁
數(shù)學(xué)建模:spss統(tǒng)計分析_第4頁
數(shù)學(xué)建模:spss統(tǒng)計分析_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

SPSS統(tǒng)計軟件SPSS是軟件英文名稱的首字母縮寫,原意為StatisticalPackagefortheSocialSciences,即“社會科學(xué)統(tǒng)計軟件包”。但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”,標(biāo)志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。

2023/12/72非專業(yè)統(tǒng)計人員的首選統(tǒng)計軟件SPSS采用類似EXCEL表格的方式輸入與管理數(shù)據(jù),數(shù)據(jù)接口較為通用,能方便的從其他數(shù)據(jù)庫中讀入數(shù)據(jù)。其統(tǒng)計過程包括了常用的、較為成熟的統(tǒng)計過程,完全可以滿足非統(tǒng)計專業(yè)人士的工作需要。2023/12/73SPSS的功能樣本數(shù)據(jù)的描述和預(yù)處理;假設(shè)檢驗(包括參數(shù)檢驗、非參數(shù)檢驗及其他檢驗);方差分析相關(guān)分析回歸分析聚類分析判別分析因子分析時間序列分析可靠性分析2023/12/74應(yīng)用廣泛的應(yīng)用于統(tǒng)計、應(yīng)用數(shù)學(xué)、經(jīng)濟、市場營銷、心理、衛(wèi)生統(tǒng)計、生物、企業(yè)管理、氣象、社會學(xué)等領(lǐng)域。其分析過程包括:調(diào)查設(shè)計、數(shù)據(jù)收集、數(shù)據(jù)存取和管理、數(shù)據(jù)分析、數(shù)據(jù)檢驗、數(shù)據(jù)挖掘、數(shù)據(jù)展示等。還有一系列附加模塊和獨立模塊產(chǎn)品以加強它的分析功能。它的圖形窗口界面使其非常簡單易用但卻具有滿足各種分析要求的數(shù)據(jù)管理、統(tǒng)計分析功能及各種報表方法。2023/12/75SPSS的窗口類型數(shù)據(jù)編輯窗口程序編輯窗口輸出窗口簡式輸出窗口2023/12/761、數(shù)據(jù)編輯窗口:(1)啟動SPSS直接進入

(2)文件→新建→數(shù)據(jù)文件

File/New/Data2023/12/772、程序編輯窗口:文件→新建→語句文件

File/New/Syntax2023/12/783、輸出窗口:

現(xiàn)實統(tǒng)計方法運行輸出的結(jié)果,對輸出結(jié)果可以進行模塊裁剪、編輯、存檔等2023/12/79第1節(jié)描述統(tǒng)計設(shè)變量X有一組觀測數(shù)據(jù)x1,,x2,…,xn,常用的描述統(tǒng)計量有:(1)中心趨勢:平均值、中位數(shù)、眾數(shù)、和(2)離中趨勢:方差、標(biāo)準(zhǔn)差、最大最小值、極差(3)百分位數(shù):四分位數(shù)、給定間距的等間距分位數(shù)(4)分布度統(tǒng)計量:偏態(tài)度、峰態(tài)度2023/12/710利用頻數(shù)分析可以方便地對數(shù)據(jù)按組進行歸納整理,對變量的數(shù)據(jù)有一個整體上的認識。(1)建立數(shù)據(jù)文件:例1.sav(2)選擇統(tǒng)計方法:Analyze→DescriptiveStatistics→Frequencies,送入變量,點擊確定(3)輸出結(jié)果:例1:對某大學(xué)10名學(xué)生測量他們的血壓x,得到如下數(shù)據(jù):120120120134128102130132126126第2節(jié)頻數(shù)分析2023/12/711其他:描述統(tǒng)計分析Descriptive等

,圖表

2023/12/712SPSS統(tǒng)計圖2023/12/713SPSS統(tǒng)計圖1單個變量的頻數(shù)統(tǒng)計圖例2:測量30株小麥的株高x得到如下數(shù)據(jù)(單位:cm):例2.sav(1)頻數(shù)直方圖(加上一條正態(tài)曲線,直觀比較頻數(shù)圖與正態(tài)分布的差異程度。)(2)頻數(shù)連線圖:簡單2兩個變量的統(tǒng)計圖對兩個變量(x,y)的樣本,作圖觀察兩個變量的關(guān)系例3某研究所對200只北京鴨進行實驗,得到的周齡(x)與平均日增重(y)的數(shù)據(jù),對(x,y)作出散點圖,擬合線Smoother2023/12/714條圖散點圖線圖直方圖餅圖面積圖箱式圖正態(tài)Q-Q圖正態(tài)P-P圖質(zhì)量控制圖Pareto圖自回歸曲線圖高低圖

交互相關(guān)圖序列圖頻譜圖誤差線圖

統(tǒng)計圖匯總2023/12/715

第3節(jié)

參數(shù)檢驗與置信區(qū)間提出原假設(shè):選擇統(tǒng)計方法:Analyze→Means→One-simpleTtest,在底部Testvalue框輸入檢驗值100具體判斷:根據(jù)t分布計算出顯著性概率(在許多書中稱為P值),SPSS中為sig.對于給定的顯著性水平,若sig.<,則拒絕原假設(shè),即認為打包機的工作不正常。否則,接受原假設(shè),認為工作正常。例4

某糖廠用自動包裝機裝糖,其裝糖量服從正態(tài)分布,且每包標(biāo)準(zhǔn)重量為100kg.某天開工后,需對打包機工作進行鑒定,測得9包糖的重量(kg)為:數(shù)據(jù)例4.sav(1)這天打包機的工作是否正常?()

(2)求這天打包機平均裝糖重量的置信區(qū)間2023/12/716單一樣本T檢驗結(jié)果分析樣本個數(shù)9,樣本均值99.978,樣本標(biāo)準(zhǔn)差1.2122,

樣本均值標(biāo)準(zhǔn)誤差0.4041顯著性概率0.957>0.05,接受H0;

平均差95%的置信區(qū)間為(-0.954,0.910),則均值的95%置信區(qū)間為(100-0.954,100+0.910)2023/12/717均數(shù)間的比較-CompareMeans菜單詳解1

Means過程求分類變量的綜合描述統(tǒng)計量,目的在于比較2

One-SamplesTTest過程檢驗單個變量的均值是否與給定的常數(shù)之間存在差異。3

Independent-SamplesTTest過程

檢驗兩個不相關(guān)的樣本來自具有相同均值的總體,例如想知道購買某產(chǎn)品的顧客與不購買該產(chǎn)品的顧客的平均收入是否相同。4

Paired-SamplesTTest過程檢驗兩個相關(guān)的樣本是否來自具有相同均值的總體。常用與被觀測對象在實驗前后是否有差異。5

One-WayANOVA過程單因素方差分析,在下節(jié)介紹。2023/12/718第4節(jié)方差分析2023/12/719方差分析概述

一個事物的變化總是某些因素影響的結(jié)果。例如,某種農(nóng)作物的收獲量受到種子品種、土質(zhì)、施肥量以及氣候等因素的影響。在眾多因素中,有些因素影響大些,有些則小些。在現(xiàn)實生活中常常要找到有顯著影響的那些因素,以便更有效地組織生產(chǎn)。

方差分析從分析數(shù)據(jù)的差異入手,分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要因素.

2023/12/720方差分析概述

方差分析正是要分析觀測變量的變動主要是由控制因素造成的還是由隨機因素造成的,以及控制變量的各個水平是如何對觀測變量造成影響的.相關(guān)概念:

(1)觀測變量:作為觀測的對象(如:畝產(chǎn)量、推銷量等).

(2)控制因素:人為可以控制的因素(如:施肥量、品種、推銷策略、價格、包裝方式等),在方差分析中稱為控制因素.將控制變量的不同情況稱為控制變量的不同水平.

(3)隨機因素:人為很難控制的因素(如:氣候、推銷人員的形象、抽樣誤差等),方差分析中主要指抽樣誤差。2023/12/721核心問題從數(shù)據(jù)差異角度看:觀測變量的數(shù)據(jù)差異(ST)=控制因素不同水平造成(組間差異SB)+隨機因素造成(組內(nèi)差異SW)當(dāng)控制因素對實驗結(jié)果有顯著影響時,和隨機因素共同作用必然使觀測變量產(chǎn)生顯著變動;反之,觀測變量的變動較小,將歸結(jié)為隨機性造成的(這里指抽樣誤差造成的).2023/12/722方差分析概述方差分析的類型單因素方差分析:只考慮一個控制因素的影響多因素方差分析:考慮兩個以上的控制因素和它們的交互作用對觀測變量的影響協(xié)方差分析:在盡量排除其他因素的影響下,分析單個或多個控制因素對觀測變量的影響.(引入?yún)f(xié)變量)2023/12/723例5用四種飼料喂豬,共19頭豬分為4組,每組用一種飼料。一段時間后沉重,豬體重增加數(shù)據(jù)(見下表)比較四種飼料對豬體重增加的作用有無不同。

觀測變量:豬體重增加量;控制因素:飼料該問題是考察飼料這一個控制因素的變化對豬體重增加是否有顯著性影響。通常把飼料因素A

的四個不同的變化,分別記為A1、A2、A3、A4,成為A的4個不同水平。把觀測變量記為X,而第i種飼料在第j次試驗下增加的體重記為xij,即因素的第i個水平的第j次觀測(試驗)值為xij,問因素A的變化對觀測變量X的變化是否有顯著性影響?2023/12/724…ni………………x3k

x33x32x313x2k…x32x22x212x1k…x31x21觀測值x11j=1Ak…A3A2水平A12023/12/7251、基本原理設(shè)表示在水平下觀測值的真實平均值,則在下每次觀測結(jié)果應(yīng)該是在真實平均值的左右隨機波動,這個隨機波動量記為,因此,方差分析的數(shù)學(xué)模型為,;其中相互獨立且,是在每個水平下重復(fù)進行試驗的次數(shù),為未知。研究因素A的影響是否顯著,歸結(jié)不同水平下的總體是否具有相同的均值,也即要檢驗統(tǒng)計假設(shè):拒絕則認為不同水平有顯著性差異。具體判斷:根據(jù)F分布計算出顯著性概率sig.若sig.<

顯著性水平,則拒絕原假設(shè)。2023/12/726~F(k-1,n-k)總均值:其中:第i種水平組均值:總偏差平方和:組間偏差平方和:自由度為:組內(nèi)偏差平方和:自由度為:2023/12/727假設(shè)檢驗P值判別法F值臨界值F

值P值臨界值法:F>F

,拒絕原假設(shè)H0P值法:P<,拒絕原假設(shè)H0P值法更靈活2023/12/728一維方差分析步驟1、編輯數(shù)據(jù)文件:定義兩個數(shù)值型變量,一個為因素變量(也成為分組變量)fodder(飼料),要求是數(shù)值型變量,有四個不同水平1,2,3,4;一個為觀測變量weight(體重),輸入數(shù)據(jù)。保存為:例5.sav2、選擇統(tǒng)計方法:Analyze→CompareMeans→One-WayANOVA將weight送入因變量列框,將fodder送入因子(因素)框,點擊“確定”3、輸出結(jié)果:sig.=0.000<0.05,認為不同飼料對豬體重增加的作用有顯著不同。2023/12/729方差分析其他選項方差齊性檢驗:分析所研究的問題是否滿足方差分析模型。Sig.=0.995>0.05,認為滿足方差分析模型。2023/12/730多重比較檢驗:兩兩不同水平進行比較,看是否有顯著差異。檢驗假設(shè)為無顯著差異。選擇PostHot…按鈕當(dāng)方差齊性檢驗顯著時,選LSD;當(dāng)方差齊性檢驗不顯著時,選Tamhane’sT2,用t檢驗進行配對比較表中用*標(biāo)示的組均值在0.05水平上有顯著性差異2023/12/731例6同種三葉草被接種上不同的菌種測量三葉草植物中的含氮量。每組數(shù)據(jù)中的前面一個是菌種代碼,變量名是strain,數(shù)值型變量。后一個是含氮量nitrogen。分析不同細菌對三葉草含氮量的影響。(數(shù)據(jù)例6.sav)2023/12/7322023/12/733練習(xí)1對6種不同的農(nóng)藥在相同的條件下分別進行殺蟲試驗,試驗結(jié)果(殺蟲率)如下表:

農(nóng)藥試驗號A1A2A3A4A5A61879056559275285886248997238087958149491問殺蟲率是否因農(nóng)藥的不同而有顯著性的差異(顯著性水平為0.01)?2023/12/734數(shù)據(jù)文件:練習(xí)1.sav選擇方法:一維方差分析,方差齊性檢驗,多重比較檢驗LSD結(jié)果分析:方差是齊性的,不同農(nóng)藥的殺蟲率有顯著性差異2023/12/735單因變量多因素方差分析溫度B濃度AB1B2B3B4A121,2322,2325,2327,25A223,2526,2428,2726,24A326,2329,2724,2524,23對一個獨立變量是否受到多個因素或變量影響而進行的方差分析,在這個過程中,可以分析每一個因素的作用,也可以分析因素之間的交互作用。例7在某化工廠產(chǎn)品的生產(chǎn)過程中,對三種濃度、四種溫度的每一種搭配重復(fù)試驗2次,測得產(chǎn)量如下表。試檢驗不同的濃度,不同的溫度以及它們之間的的交互作用對產(chǎn)量有無顯著性影響.(完全隨機化設(shè)計)2023/12/736編輯數(shù)據(jù)文件:例7.sav選擇方法:Analyze→GeneralLinearModel→Univariate,送入變量結(jié)果分析:濃度A因素的sig.=0.042<0.05,認為濃度對產(chǎn)量有顯著性影響;溫度B因素sig.=0.116>0.05,認為溫度對產(chǎn)量無顯著性影響;A與B的交互作用a*b的sig.=0.016<0.05,認為交互作用對產(chǎn)量有顯著性影響。2023/12/737一般線性模型――GeneralLinearModel菜單詳解1兩因素方差分析

univarate對話框界面說明結(jié)果解釋2協(xié)方差分析分析步驟結(jié)果解釋3其他較簡單的方差分析問題4多元方差分析分析步驟結(jié)果解釋5重復(fù)測量的方差分析Repeatedmeasures對話框界面說明結(jié)果解釋

2023/12/738區(qū)組號A營養(yǎng)素B營養(yǎng)素C營養(yǎng)素150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40761.9053.0051.20842.2039.8046.20練習(xí)2對小白鼠喂以A、B、C三種不同的營養(yǎng)素,目的是了解不同營養(yǎng)素增重的效果。采用隨機區(qū)組設(shè)計方法(無重復(fù)試驗),以窩別作為劃分區(qū)組的特征,以消除遺傳因素對體重增長的影響。現(xiàn)將同品系同體重的24只小白鼠分為8個區(qū)組,每個區(qū)組3只小白鼠。三周后體重增量結(jié)果(克)列于下表,問小白鼠經(jīng)三種不同營養(yǎng)素喂養(yǎng)后所增體重有無差別?2023/12/739步驟Analyze→GeneralLinealmodel→UnivariateDependentVariable框:選入weightFixedFactors框:選入group和foodModel鈕:單擊選擇自定義Custom在BuildTerms的參數(shù)框中選擇Maineffects定義主效應(yīng),將group和food送入effectModel框單擊OK不同窩別對體重增加有顯著影響,即遺傳因素作用;不同營養(yǎng)素對體重增加無顯著性差異。2023/12/7402023/12/741協(xié)方差分析

例如考慮藥物對患者某個生化指標(biāo)變化的影響,要比較實驗組和對照組該指標(biāo)的變化均值是否有顯著性差異以確定藥物的有效性,可能要考慮患者病程的長短、年齡以及原指標(biāo)水平對療效的影響。要消除這些因素的影響,考慮藥物療效,才是科學(xué)的分析方法。

有些實驗可以考慮觀測對象的選擇,使這些條件都一致,例如選擇同品種、同一胎的大白鼠分組,在相同的飼養(yǎng)條件下進行實驗,可以相應(yīng)地避免許多混雜因素的影響。其他實驗很難避免,因此要考慮使用協(xié)方差分析方法。這些混雜因素變量稱為協(xié)變量。

協(xié)方差分析中要求因變量應(yīng)該是等間隔測量的變量(Scale型),理論上要求正態(tài)分布。因素變量是分類變量,并且相互獨立。協(xié)變量是與因變量存在一定相關(guān)關(guān)系的等間隔測量的變量,是否線性相關(guān),可以通過經(jīng)驗或作散點圖來做初步的直觀判斷。2023/12/742例8本例采用鎘作業(yè)工人年齡與肺活量的資料鎘作業(yè)工人按暴露于鎘粉塵的年數(shù)分為大于等于10年和不足10年兩組。兩組工人的年齡未經(jīng)控制(人隨著年齡的增長,肺活量也會有所下降),測量了每個工人的肺活量。數(shù)據(jù)變量:time(接觸粉塵時間分組)取值1代表大于等于10年,2代表不足10年;age(年齡);vitalcp(肺活量,單位:升)操作步驟:Analyze→GeneralLinealmodel→Univariatevitalcp選入DependentVariable作為因變量time選入FixedFactors作為因素變量age選入Covariate(s)作為協(xié)變量Options單選鈕:time移入右側(cè)框,選擇顯示參數(shù)估計在Displays欄內(nèi)選中ParameterEstimates,要求輸出年齡做自變量,肺活量做因變量的線性回歸方程的系數(shù)。OK2023/12/743結(jié)果分析方差分析表:time的sig.=0.330>0.05,age的sig.=0.000<0.001.因此得出結(jié)論,肺活量的差異是由于被試者的年齡差異所致,與被試者接觸鎘粉塵的時間是否大于10年無關(guān)。參數(shù)估計值輸出結(jié)果:age作為自變量,vitaclp作為因變量的線性回歸方程的斜率為-0.087.也符合生理常識,即成年人隨著年齡的增長,肺活量有所下降。按時間分組的肺活量均值表:10年以下的均值為3.919,10年以上的均值為4.291.協(xié)方差分析結(jié)果表明,這兩組肺活量均值無顯著差異。

2023/12/744方差分析應(yīng)用小結(jié):

單因素方差分析:只考慮一個控制因素的影響多因素方差分析:考慮兩個以上的控制因素和它們的交互作用對觀測變量的影響協(xié)方差分析:在盡量排除其他因素的影響下,分析單個或多個控制因素對觀測變量的影響.(引入?yún)f(xié)變量)2023/12/745練習(xí)數(shù)據(jù):練習(xí)3.sav是474個職工的數(shù)據(jù)。試分析銀行職員(jobcat)起始工資是否與職工的性別、民族有關(guān)?分析時考慮其他因素的影響。2023/12/746第5節(jié)回歸分析2023/12/747變量之間的聯(lián)系確定型的關(guān)系:指某一個或某幾個現(xiàn)象的變動必然會引起另一個現(xiàn)象確定的變動,他們之間的關(guān)系可以使用數(shù)學(xué)函數(shù)式確切地表達出來,即y=f(x)。當(dāng)知道x的數(shù)值時,就可以計算出確切的y值來。如圓的周長與半徑的關(guān)系:周長=2πr。非確定關(guān)系:例如,在發(fā)育階段,隨年齡的增長,人的身高會增加。但不能根據(jù)年齡找到確定的身高,即不能得出11歲兒童身高一定就是1.40米公分。年齡與身高的關(guān)系不能用一般的函數(shù)關(guān)系來表達。研究變量之間既存在又不確定的相互關(guān)系及其密切程度的分析稱為相關(guān)分析。2023/12/748回歸分析如果把其中的一些因素作為自變量,而另一些隨自變量的變化而變化的變量作為因變量,研究他們之間的非確定因果關(guān)系,這種分析就稱為回歸分析?;貧w分析是研究一個自變量或多個自變量與一個因變量之間是否存在某種線性關(guān)系或非線性關(guān)系的一種統(tǒng)計學(xué)方法。2023/12/749回歸分析線性回歸分析;曲線回歸分析;二維Logistic回歸分析;多維Logistic回歸分析;概率單位回歸分析;非線性回歸分析;權(quán)重估計分析;二階段最小二乘分析;最優(yōu)尺度回歸。2023/12/7505.1一元線性回歸基本問題

例9某公司近年來科研支出x與利潤y的統(tǒng)計資料如下表(單位:10萬元)。將x與y的數(shù)據(jù)繪制出散點圖,觀察x與y具有線性關(guān)系。計算出y關(guān)于x的線性回歸模型y=ax+b,并檢驗該模型是否顯著以及給出模型的標(biāo)準(zhǔn)誤差??蒲兄С鰔5114532利潤y3140303425202023/12/751問題分析一般地,設(shè)變量x與y適合線性回歸模型對x和y進行觀察試驗,得到n組數(shù)據(jù)(x1,y1)、(x2,y2)、…、(xn,yn).我們的任務(wù)是:(1)計算y關(guān)于x的線性回歸模型y=a+bx(2)提出假設(shè):H0:a=b=0(不是線性回歸模型)(3)計算模型的標(biāo)準(zhǔn)誤差?;驹恚焊鶕?jù)最小二乘法原理,選擇a,b,使

Q(a,b)=∑(yi-a-bxi)2

達到最小值,由此解出a,b2023/12/752選擇方法:Analyze→Regression→Linear→將y送入Dependent框,將x送入Independent(s)框→ok2023/12/753結(jié)果分析判定系數(shù)R=0.909,R2=0.826,說明y有82.6%是由變量x引起的方差分析表:對回歸模型進行顯著性檢驗,回歸顯著性概率sig.=0.012<0.05,所以回歸顯著。2023/12/754回歸模型為:y=20+2xStd.Error列為相應(yīng)回歸系數(shù)的標(biāo)準(zhǔn)誤差。鑒于模型的各項檢驗均有顯著性,可以認為該模型是一個較好的模型2023/12/755用“Statistics”按鈕設(shè)置相關(guān)參數(shù):√2023/12/756增加結(jié)果分析2023/12/7575.2多元線性回歸模型一個因變量,多個自變量的回歸模型

y^=b0+b1x1+…+bnxn

其中y^為根據(jù)所有自變量x計算出的估計值,b0為常數(shù)項,b1、b2····bn稱為y對應(yīng)于x1、x2···

xn的偏回歸系數(shù)。提出假設(shè)為:b0=b1=b2=····=bn=0

偏回歸系數(shù)表示假設(shè)在其他所有自變量不變的情況下,某一個自變量變化引起因變量變化的比率。2023/12/758篩選變量:當(dāng)模型中包含變量較多且有不重要變量時,要對變量進行篩選。變量選擇是否恰當(dāng),是選擇最佳模型的關(guān)鍵。(1)全模型法,即強行進入法,將指定的變量全部放入回歸方程中,不管變量在模型中的作用是否顯著。(2)消去法,根據(jù)設(shè)定的條件剔除部分變量(3)向前引進變量法,按顯著性大的優(yōu)選的原則選入變量(4)向后剔除變量法,與(3)相反(5)逐步回歸法,每選入一個變量,立即對前一個引進的變量進行顯著性檢驗,及時剔除不顯著的變量,再考慮引進新的變量。是一種較理想的選模方法。2023/12/759例10某水泥廠在凝固時放出的熱量y與水泥中下列四種化學(xué)成分有關(guān)。x1:3CaO·Al2O3的成分(%)x2:3CaO·SiO2的成分(%)

x3:4CaO·Al2O3·Fe2O3的成分(%)x4:2CaO·SiO2的成分(%)

觀測得數(shù)據(jù):例10.sav,試求y對x1,x2,x3,x4的最佳線性模型。選擇統(tǒng)計方法:Analyze→Regression→Linear選入因變量和自變量(1)系統(tǒng)默認強行進入法Enter

結(jié)果分析:回歸模型的顯著性概率sig.=0.000<0.01,回歸模型非常顯著。但回歸系數(shù)b1,b2,b3,b4相應(yīng)的顯著性概率分別為0.071,0.501,0.896,0.844,均>0.05,所以沒有一個變量在模型中是重要變量。因此需要對變量進行篩選。(2)改用逐步回歸法Stepwise

結(jié)果分析:第一次引進x4,第二次引進x1,引進的變量沒有被剔除第一模型為y=492.233-3.091x4,第二模型為y=431.648-2.571x4+6.029x1

相關(guān)系數(shù)有明顯提高,標(biāo)準(zhǔn)誤差有明顯減少。兩個模型的回歸檢驗均具有非常高的顯著性,回歸系數(shù)均具有非常高的顯著性,即為重要變量。沒有引進的變量均不顯著。可以認為第二模型為最好模型。2023/12/760練習(xí)3使用數(shù)據(jù):練習(xí)3.sav,建立一個以初始工資、工作經(jīng)驗、受教育年數(shù)等為自變量,當(dāng)前工資為因變量的回歸模型。2023/12/7615.3曲線回歸模型在實際中,變量與變量之間的相關(guān)關(guān)系并非一定是線性相關(guān),非線性相關(guān)關(guān)系的情形也會常常遇到。例11

某研究所對200只鴨子進行試驗,得到鴨子的周齡x與平均日增重y的數(shù)據(jù)(前例3),從散點圖看到x與y呈現(xiàn)出曲線的相關(guān)關(guān)系。我們希望計算出x與y的曲線模型y=f(x),并檢驗該模型的顯著性以及計算它的標(biāo)準(zhǔn)誤差。2023/12/762基本原理:解決曲線回歸模型的基本方法是將曲線回歸模型轉(zhuǎn)化為線性回歸模型進行計算,過程如下:(1)確定模型的形式。這是根據(jù)所研究問題相關(guān)專業(yè)知識或散點圖的形狀,選擇f(x)的具體表達形式,如上例,可以選擇f(x)為二次曲線模型,即

y=f(x)=b0+b1x+b2x2(2)將確定的模型作線性轉(zhuǎn)換,如令u=x2,則有

y=f(x)=b0+b1x+b2u

從而y關(guān)于x,u是線性回歸模型。又如對指數(shù)模型y=aebx,先兩邊去對數(shù)有l(wèi)ny=lna+bx,然后令y’=lny,a’=lna,則y’=a’+bx,于是y’關(guān)于x是線性回歸模型。(3)對轉(zhuǎn)換后的線性模型利用線性回歸模型方法進行計算、檢驗,最后回代還原為曲線模型。

2023/12/763計算過程:(1)建立數(shù)據(jù)文件:原始數(shù)據(jù):例1.sav(2)變量變換需作變換u=x2.選擇:Transform→Compute→在目標(biāo)變量框輸入變量u,在右邊框輸入計算表達式x*x→確定(3)選擇統(tǒng)計方法:線性回歸方法2023/12/764結(jié)果分析模型:y=-8.360+34.827x-3.762u回代為:y=-8.360+34.827x-3.762x2模型非常顯著,復(fù)相關(guān)系數(shù)為R=0.997,標(biāo)準(zhǔn)誤差S=2.251,回歸檢驗的顯著性概率sig.=0.000<0.01注:也可以直接使用曲線回歸的方法,選擇模型:平方2023/12/765練習(xí)牙膏的銷售量

問題建立牙膏銷售量與價格、廣告投入之間的模型

預(yù)測在不同價格和廣告費用下的牙膏銷售量

收集了30個銷售周期本公司牙膏銷售量、價格、廣告費用,及同期其它廠家同類牙膏的平均售價(數(shù)據(jù):牙膏銷售量.sav)9.260.556.804.253.70307.930.055.803.853.8029

8.510.256.754.003.7527.38-0.055.503.803.851銷售量(百萬支)價格差(元)廣告費用(百萬元)其它廠家價格(元)本公司價格(元)銷售周期2023/12/766基本模型y~公司牙膏銷售量x1~其它廠家與本公司價格差x2~公司廣告費用x2yx1yx1,x2~解釋變量(回歸變量,自變量)

y~被解釋變量(因變量)

0,1

,2,3~回歸系數(shù)

~隨機誤差(均值為零的正態(tài)分布隨機變量)2023/12/767牙膏的銷售量模型選擇方法:Analyze→Rgression→Linear將銷售量送入因變量框,將x1、x2和x22送入自變量框“Statistics”按鈕選擇結(jié)果分析:總:y的90.5%可由模型確定

Sig.遠小于

=0.05

模型從整體上看顯著分:x2對因變量y的影響不太顯著但由于x22項顯著

可將x2保留在模型中

參數(shù)參數(shù)估計值置信區(qū)間17.324[5.72828.921]1.307[0.6831.931]-3.696[-7.4990.108]0.349[0.0380.659]R2=0.905F=82.941p=0.0000

0

1

2

32023/12/768回歸預(yù)測的方法如果我們要用SPSS來預(yù)測x1=0.2,x2=6.5時y的值,需要在數(shù)據(jù)表的續(xù)后空格輸入x1,x2的值,對應(yīng)y的值為空值(缺失值)。在建立模型時SPSS會進行自動調(diào)整,只使用前面30個數(shù)據(jù)建立模型,但可以預(yù)測第31個觀測的y值。選擇Analyze

Regression

Linear,將相應(yīng)變量送入變量框,單擊對話框中的“save”按鈕,在彈出的對話框中,在PredictedValues欄中選中“Unstandardized”復(fù)選框(這樣可以得到預(yù)測值),在“PredictionIntervals”欄中選中“Means”(均值預(yù)測置信區(qū)間)和“Individual”(個值預(yù)測置信區(qū)間),單擊“Continue”返回主對話框,其它選項采用默認值,“確定”后就可以得到回歸方程和預(yù)測結(jié)果了。2023/12/7692023/12/7702023/12/771銷售量預(yù)測價格差x1=其它廠家價格x3-本公司價格x4估計x3調(diào)整x4控制價格差x1=0.2元,投入廣告費x2=650萬元銷售量預(yù)測區(qū)間為[7.82298,8.76362](置信度95%)上限用作庫存管理的目標(biāo)值下限用來把握公司的現(xiàn)金流若估計x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在7.82298

3.7

29(百萬元)以上控制x1通過x1,x2預(yù)測y(百萬支)2023/12/772模型改進不考慮x1和x2的交互作用參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.905F=82.9409p=0.000

0

1

2

3參數(shù)參數(shù)估計值置信區(qū)間29.113[13.70144.525]11.134[1.97820.291]-7.608[-12.693-2.523]0.671[0.2541.089]-1.478[-2.852-0.104]R2=0.921F=72.777p=0.000

3

0

1

2

4考慮x1和x2的交互作用所有參數(shù)都是顯著的2023/12/773兩模型銷售量預(yù)測比較(百萬支)區(qū)間[7.82298,8.76362]區(qū)間[7.88673,8.76777]

(百萬支)控制價格差x1=0.2元,投入廣告費x2=6.5百萬元預(yù)測區(qū)間長度更短(精度提高)略有增加2023/12/774交互作用影響的討論價格差x1=0.1價格差x1=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論