基于因子分析和SARIMA模型對師宗果桃產(chǎn)量影響因素分析及預(yù)測_第1頁
基于因子分析和SARIMA模型對師宗果桃產(chǎn)量影響因素分析及預(yù)測_第2頁
基于因子分析和SARIMA模型對師宗果桃產(chǎn)量影響因素分析及預(yù)測_第3頁
基于因子分析和SARIMA模型對師宗果桃產(chǎn)量影響因素分析及預(yù)測_第4頁
基于因子分析和SARIMA模型對師宗果桃產(chǎn)量影響因素分析及預(yù)測_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE2基于因子分析和SARIMA模型對師宗果桃產(chǎn)量影響因素分析及預(yù)測[摘要]果桃是近幾年師宗縣比較具有特征的種植水果,因師宗果桃種植地點(diǎn)多為農(nóng)村土地,面積廣闊、土壤肥沃,當(dāng)?shù)氐墓乙殉闪⒑献魃绠a(chǎn)業(yè)更加穩(wěn)定,所以選擇其作為研究對象。對師宗果桃的影響特征進(jìn)行問卷調(diào)查,用因子分析對影響因素分析及產(chǎn)量預(yù)測。首先確定影響因素有平均最高溫度、平均最低溫度、溫差、日照時長、降雨量、人工投入、化肥用量、產(chǎn)業(yè)投入。然后對收集問卷進(jìn)行信度、效度以及相關(guān)性分析,運(yùn)用因子分析得出綜合得分結(jié)果發(fā)現(xiàn),影響果桃產(chǎn)量的公因子共有兩個,一個為“氣象因子”,另一個為“農(nóng)業(yè)生產(chǎn)要素投入因子”。后續(xù)產(chǎn)量預(yù)測依據(jù)時間序列的季節(jié)性模型建模,并對模型進(jìn)行檢驗(yàn),進(jìn)行誤差分析,發(fā)現(xiàn)師宗果桃單產(chǎn)2023年第三季度預(yù)測值與實(shí)際值相對誤差為10.8%,擬合精度較好。后應(yīng)用此模型對2024年第二季度和第三季度果桃產(chǎn)量進(jìn)行預(yù)測。[關(guān)鍵字]影響因素;因子分析;SARIMA模型;預(yù)測

AnalysisandpredictionoffactorsaffectingShizongpeachbasedonfactoranalysisandSARIMAmodelAbstractPeachisacharacteristicfruitgrowninShizongCountyinrecentyears.BecausemostoftheplantingsitesofShizongpeachesareruralareas,thelandareaisvastandthesoilisfertileandflooded.Thelocalpeachhassetupacooperativeindustrytomakeitmorestable,soitisselectedastheresearchobject.CarryoutaquestionnairesurveyontheinfluencecharacteristicsofShizongpeach,andcarryoutfactoranalysisandyieldpredictionoftheinfluencingfactors.Firstofall,itisdeterminedthatthefactorsofsymearetheaveragemaximumtemperature,theaverageminimumtemperature,thetemperaturedifference,thedurationofthesunshine,thereductionoftwoquantities,themanualinvestmentmeeting,theamountoffertiliser,andtheindustrialinvestment.Thenanalysethecredibility,validityandcorrelationofthecollector.Usingfactoranalysistogetacomprehensivescore,itisfoundthattherearetwocommonfactorsaffectingpeachproduction,oneisthe"meteorologicalfactor"andtheotheristhe"agriculturalproductionfactorinputfactor".Thesubsequentproductionforecastismodelledaccordingtotheseasonalmodelofthetimeseries,andthemodelistestedandtheerrorisanalysed.ItisfoundthattherelativeerrorbetweenthepredictedvalueandtheactualvalueofShizongpeachproductioninthethirdquarterof2023is10.8%,andtheaccuracyofpickingisgood.Later,thismodelwasappliedtopredicttheproductionofpeachesinthethirdandthirdquartersof2024.KeyWordsInfluencingFactors;FactorAnalysis;SARIMAModel;Prediction

目錄12585第一章緒論 168861.1.研究背景 1237851.2.研究目的及意義 1237131.3.國內(nèi)研究現(xiàn)狀 24841.4.研究方法 3968第二章對師宗果桃的基本情況介紹 4195192.1.地理位置優(yōu)勢 4242902.2.自然氣候條件 480822.3.產(chǎn)業(yè)種植規(guī)模 4321672.4.化肥施用情況 595192.5.政府政策支持 517072第三章理論基礎(chǔ) 6249773.1.因子分析 6173293.1.1.因子分析的基本思想 6128573.1.2.因子分析的基本模型 6297833.1.3.因子分析的步驟 8244563.2.SARIMA模型 10146603.2.1.SARIMA模型的基本思想 1026473.2.2.SARIMA(p,d,q)×(P,D,Q)S模型 11111973.2.3.SARIMA模型的步驟 1315192第四章基于因子分析影響因素分析 15235654.1.基于因子分析影響因素 15190854.1.1.確定影響因素 1540024.1.2.問卷調(diào)查 15182564.2.實(shí)例研究 1885614.3.小結(jié) 233522第五章基于多元線性回歸及SARIMA模型的產(chǎn)量預(yù)測分析 2577185.1.多元線性回歸預(yù)測 25171955.2.SARIMA預(yù)測模型實(shí)例分析 2858385.3.SARIMA模型預(yù)測及結(jié)果 33323965.4.小結(jié) 3430225結(jié)論 3524788參考文獻(xiàn) 378253附錄 38PAGE2緒論研究背景我國是世界第一大水果生產(chǎn)國,果業(yè)對確保食物安全,生態(tài)安全,人民健康,增加農(nóng)民收入,實(shí)現(xiàn)農(nóng)業(yè)可持續(xù)發(fā)展等方面的重要性越來越突出。桃產(chǎn)業(yè)對于脫貧攻堅,鄉(xiāng)村振興建設(shè)以及滿足廣大人民群眾美好生活追求等方面,都發(fā)揮著不可忽視的作用。桃子的營養(yǎng)成分包括:蛋白質(zhì)、脂肪、碳水化合物、鈣、磷、鐵、胡蘿卜素、糖分等。鮮桃蛋白量約0.7g。特別適合低血鉀癥及缺鐵性貧血的人食用,因此人們對桃子的需求量增加。云南師宗縣因產(chǎn)業(yè)幫扶不斷深化,貧困地區(qū)的發(fā)展起到了推動作用、提高貧困農(nóng)戶收入是扶貧工作的重要內(nèi)容。以桃產(chǎn)業(yè)種植為主發(fā)展,推動群眾脫貧、產(chǎn)業(yè)增收。師宗縣曾種植冬桃、圣桃等經(jīng)濟(jì)林果,具備水果種植基礎(chǔ)條件。轄區(qū)地處中低緯度,具備水果生長適宜環(huán)境。氣候類型為亞熱帶季風(fēng)氣候,夏季高溫多雨、冬季寒冷干燥,附近有河流通過,具備水果所需水源保障。以果桃為主的特色林果業(yè)已成為該區(qū)域推動農(nóng)民可持續(xù)和快速的收入增收和農(nóng)村經(jīng)濟(jì)發(fā)展的關(guān)鍵產(chǎn)業(yè)之一。為確保產(chǎn)業(yè)持續(xù)性,先后引進(jìn)和改良品種20余個,其中黃金油桃、油蟠桃、皇后油桃、黃太子油桃、黃金蟠桃、秋黃、秋桃、九月黃桃、雪桃等廣受好評。研究目的及意義云南曲靖師宗地區(qū)果桃產(chǎn)量不斷增加,深受民眾歡迎,果桃產(chǎn)量分析、果桃影響因子分析和產(chǎn)量預(yù)測分析對促進(jìn)當(dāng)?shù)毓耶a(chǎn)業(yè)發(fā)展、促進(jìn)可持續(xù)生態(tài)農(nóng)業(yè)和提高農(nóng)民收入具有重要意義。高收益促使農(nóng)戶種植積極性增強(qiáng),同時也增加了農(nóng)業(yè)技術(shù)和物質(zhì)資源的投入,進(jìn)而提高了果桃的品質(zhì)和價格。所以對師宗縣果桃影響其產(chǎn)量的因素的研究,根據(jù)種植面積,自然氣候,施肥等這些影響因素進(jìn)行改進(jìn)與完善,進(jìn)而提出有針對性的解決方案,以此來預(yù)測未來的果桃產(chǎn)量,足以讓農(nóng)民做好充分的應(yīng)對措施。因此本文針對師宗縣果桃產(chǎn)量影響因素分析及預(yù)測這方面進(jìn)行研究是非常有必要的一件事情。產(chǎn)量影響因子和產(chǎn)量預(yù)測模型的分析,對推動果桃產(chǎn)業(yè)化的發(fā)展具有積極作用,所以研究此課題更具有實(shí)際意義[3]。國內(nèi)研究現(xiàn)狀2020年王月杏在印尼坤甸坤中中學(xué)生漢語學(xué)習(xí)心理調(diào)查研究,采用問卷法對高中學(xué)生進(jìn)行調(diào)查,評估了效度、信度和描述性統(tǒng)計結(jié)果。在此基礎(chǔ)上,運(yùn)用多變量線性回歸模型,對所得數(shù)據(jù)進(jìn)行回歸相關(guān)性檢驗(yàn)。在其模型里,相關(guān)關(guān)系強(qiáng),通過T檢驗(yàn)[1]。2023年穆凱麗的新疆特色膳食半定量食物頻率問卷的信效度分析一文中,自主設(shè)計的新疆特色膳食半定量食物頻率問卷進(jìn)行信度和效度評價,為研究新疆地區(qū)居民飲食習(xí)慣與健康相關(guān)性研究提供簡便、可靠的工具[2]。2017年任嘉穎在山西運(yùn)城蘋果產(chǎn)量預(yù)測及影響因素分析中首先將通過灰色關(guān)聯(lián)分析,得出氣溫、濕度、日照等因素與蘋果產(chǎn)量關(guān)聯(lián)度極高,運(yùn)城市臨猗縣的實(shí)際數(shù)據(jù)與2020到2016年馬爾科夫預(yù)測值進(jìn)行誤差分析。通過灰色關(guān)聯(lián)分析得到的重要?dú)夂蛞蜃优c蘋果產(chǎn)量之間的關(guān)聯(lián)度,用SPSS圖表構(gòu)建程序建立函數(shù)模型[3]。2020年\t"/kcms2/article/_blank"趙嘉寶在吐魯番市葡萄產(chǎn)量主要影響因子分析及預(yù)測基于R語言關(guān)于主成分分析、多元線性回歸模型、時間序列ARIMA模型及MATLAB的GM(1,1)模型的相關(guān)理論知識,通過對數(shù)據(jù)的預(yù)處理,并基于該數(shù)據(jù)建立主成分分析模型對影響因子進(jìn)行分析以及多元線性回歸模型、ARIMA模型和GM(1,1)模型對吐魯番市葡萄單產(chǎn)預(yù)測分析,實(shí)現(xiàn)對產(chǎn)量變化趨勢的有效預(yù)測[4]。2023年段霞以SPSS軟件的山東省糧食產(chǎn)量預(yù)測模型分析研究,對2000-2017年的糧食產(chǎn)量、種植面積、農(nóng)業(yè)機(jī)械總動力、化肥施用量和受災(zāi)面積等進(jìn)行了統(tǒng)計分析,并利用多元線性回歸方法構(gòu)建了山東省糧食總產(chǎn)量與這些因素之間的相關(guān)關(guān)系。預(yù)測精度在94%以上,回歸模型的可信度較高,后應(yīng)用回歸模型對2021年山東省糧食總產(chǎn)量進(jìn)行預(yù)測[5]。2014年楊堅爭、鄭碧霞和楊立釩基于因子分析的跨境電子商務(wù)評價指標(biāo)體系研究,通過構(gòu)建我國跨境電子商務(wù)應(yīng)用狀況評價指標(biāo)體系,明確當(dāng)前我國跨境電子商務(wù)發(fā)展應(yīng)關(guān)注的關(guān)鍵指標(biāo);并采用問卷調(diào)查的方式對我國外貿(mào)企業(yè)進(jìn)行了調(diào)查,應(yīng)用因子分析方法對評價指標(biāo)體系進(jìn)行修正,通過問卷數(shù)據(jù)分析對我國不同地區(qū)的跨境電子商務(wù)發(fā)展提出了建議[6]。2020年李璐基于因子分析教育類上市公司經(jīng)營績效研究,采用國際專業(yè)統(tǒng)計軟件SPSS因子分析對教育年面板數(shù)據(jù)進(jìn)行實(shí)證分析,同時從教育上市公司本身尋求發(fā)展的角度,借助SPSS對面板數(shù)據(jù)進(jìn)行財務(wù)指標(biāo)綜合計分排名,提供財務(wù)最新數(shù)據(jù)與分析結(jié)果參考[8]。2023年林思琪基于因子分析法的七匹狼財務(wù)績效評價及提升對策研究,選取紡織服飾行業(yè)福建七匹狼實(shí)業(yè)股份有限公司作為研究對象,基于因子分析法從盈利能力等四個維度構(gòu)建財務(wù)績效評價體系,通過選取12個財務(wù)指標(biāo),收集同行業(yè)內(nèi)32家上司企業(yè)的財務(wù)數(shù)據(jù)以及七匹狼2015-2021年七年間的數(shù)據(jù)進(jìn)行橫向、縱向?qū)Ρ确治?,結(jié)合各公共因子的評價結(jié)果,提出相應(yīng)提升對策[9]。2007年,湯巖在其研究與應(yīng)用中對時間序列進(jìn)行了較為詳盡的闡述,作者在對其性質(zhì)分析的基礎(chǔ)上,對所用方法進(jìn)行研究和模型系統(tǒng)探討。另外,作者對目前擬合參數(shù)估算討論現(xiàn)有方法的缺陷,介紹了建模的理論和流程以及線性最小方差預(yù)測的理論方法[10]。2023年南潤基于SARIMA-CNN-LSTM的車流量預(yù)測分析,根據(jù)短時交通流量數(shù)據(jù)呈現(xiàn)出的非線性、周期性、高波動性、長記憶性等特征,考慮到不同預(yù)測方法的優(yōu)缺點(diǎn)。結(jié)合SARIMA模型對于具備周期性的數(shù)據(jù)擬合效果較好,LSTM模型適合處理具備長記憶性特征的數(shù)據(jù)并且有著強(qiáng)大的非線性映射能力的優(yōu)點(diǎn),并基于車流量序列進(jìn)行了預(yù)測效果的對比,找出預(yù)測精度最高。隨后提高模型的預(yù)測精度,得到最終預(yù)測[15]。2023年龔浩基于空間自相關(guān)和SARIMA-BPNN組合模型的我國肺結(jié)核時空分布特征及預(yù)測研究,我國肺結(jié)核發(fā)病季節(jié)性特征顯著,發(fā)病高峰為春季,低谷期在冬季。使用我國2012年1月到2021年12月每月肺結(jié)核發(fā)病率數(shù)據(jù),成功建立了SARIMA(0,1,1)(0,1,1)12模型。BPNN神經(jīng)網(wǎng)絡(luò)模型、SARIMA-BPNN組合模型,對我國肺結(jié)核發(fā)病預(yù)測效果性能均較好,SARIMA-BPNN組合模型的預(yù)測效果最佳[16]。研究方法在已有文獻(xiàn)調(diào)查的基礎(chǔ)上,對農(nóng)作物領(lǐng)域進(jìn)行了分析。ARIMA模型用于對作物產(chǎn)量的預(yù)測,影響因子進(jìn)行因子分析,通過對各因素的相關(guān)性分析,找出主控因素。根據(jù)論文研究目的可以采用:文獻(xiàn)綜合研究、問卷調(diào)查和數(shù)據(jù)分析。(1)文獻(xiàn)綜合研究是利用各種方法尋找與農(nóng)作物影響因子、因子分析和時間序列預(yù)測等的文獻(xiàn)資料,進(jìn)行研究和分析,以獲取撰寫的思路、數(shù)據(jù)和理論知識。(2)問卷調(diào)查法。通過設(shè)計問卷和實(shí)地調(diào)研獲得影響產(chǎn)出的相關(guān)因子數(shù)據(jù)。(3)數(shù)據(jù)分析。對于師宗縣果桃產(chǎn)量,我們基于統(tǒng)計分析數(shù)據(jù),進(jìn)行了影響因素的分析,并篩選出了最有價值的信息,從而更具體有力地反映出了對師宗縣果桃產(chǎn)量影響更強(qiáng)的因素。對師宗果桃的基本情況介紹師宗縣在發(fā)展桃產(chǎn)業(yè)方面擁有巨大的優(yōu)勢,該產(chǎn)業(yè)具備很高的發(fā)展?jié)摿蜕仙臻g。針對師宗縣果桃產(chǎn)業(yè)在發(fā)展過程中所遇到的問題,政府部門進(jìn)行了深入探討,并明確了未來桃產(chǎn)業(yè)發(fā)展的戰(zhàn)略和措施。多年來,師宗縣的桃產(chǎn)業(yè)經(jīng)歷了長期的發(fā)展和建設(shè),逐漸達(dá)到了可觀的規(guī)模和發(fā)展水平。同時,桃產(chǎn)業(yè)也逐漸成為中國經(jīng)濟(jì)社會發(fā)展的重要支柱之一。然而,盡管得到了政府部門的扶持并迅速發(fā)展起來,雪桃等農(nóng)產(chǎn)品仍然面臨著一些問題??傮w而言,師宗縣的果桃并未真正走出去,人民品牌意識淡漠,人民消費(fèi)狀況的不斷改變,包括受各種天氣災(zāi)害和預(yù)防不及時的影響,導(dǎo)致師宗桃產(chǎn)業(yè)的發(fā)展仍然舉步維艱。所以,對果桃產(chǎn)量的預(yù)測和尋找影響因素就顯得尤為重要。地理位置優(yōu)勢桃的種植南北均有,其中云南、貴州、四川和重慶四個省市是我國西南高地果桃的第四大產(chǎn)區(qū)。云南省師宗縣有本地種植優(yōu)勢。雨柱村土地面積較大,土質(zhì)較好,主要是青沙地,大約在兩億年前就已形成。大部分地面在海拔在1900米以上,地處中低緯度。所以這里有著發(fā)展種植桃產(chǎn)業(yè)得天獨(dú)厚的條件,這里種植的桃子口感清脆,味道濃郁。桃子含有豐富的營養(yǎng)物質(zhì),水溶性固體含量高,并且能夠自然保持新鮮。果實(shí)成熟后,還能在樹上保持20-30天而不脫落。一般單果重200-350克,最大可重達(dá)1030克,所以是師宗縣果桃是栽培的最佳地區(qū)。自然氣候條件師宗縣氣候適宜四季分明,該地區(qū)日照充足,年平均氣溫為12.5℃,全年無霜期長達(dá)241天,適宜水果生長。氣候?qū)儆趤啛釒Ъ撅L(fēng)氣候,夏季炎熱多雨,冬季寒冷干燥。年降雨量在1100-1200mm之間。此地附近有河流流經(jīng),具備水果所需水源保障。發(fā)展桃產(chǎn)業(yè)有著得天獨(dú)厚的條件,是栽植的最佳地區(qū)。產(chǎn)業(yè)種植規(guī)模在十二五以前,雨柱村以煤炭產(chǎn)業(yè)為主要經(jīng)濟(jì)來源,全轄區(qū)內(nèi)有十對有證煤礦。十二五后,煤炭產(chǎn)業(yè)逐漸式微,部分人民自發(fā)種植雪桃并獲得一定經(jīng)濟(jì)利益。據(jù)研究發(fā)現(xiàn)師宗縣曾栽培冬桃、圣桃等經(jīng)濟(jì)林果,符合水果栽培的基本條件。隨著時間的流逝,種植果桃的范圍也越來越大,為果桃種植業(yè)的發(fā)展提供了機(jī)遇。師宗縣土地廣博,土壤質(zhì)量優(yōu)良,擁有豐富的土地資源,同時還具備適宜果桃種植的土壤條件,這些都是發(fā)展果桃種植產(chǎn)業(yè)的基礎(chǔ)。至今師宗縣雨柱村種植面積達(dá)3500畝。由于師宗縣的各項條件十分適合果桃的種植,且果桃為師宗縣的第一大經(jīng)濟(jì)作物,所以果桃播種面積一直呈上漲趨勢,通過播種面積的擴(kuò)大,果桃的產(chǎn)量也有所增加。化肥施用情況由于以前的種植技術(shù)落后,在果桃種植是盲目施用化肥。后借助滬滇協(xié)作項目,免費(fèi)為群眾送幼苗、教技術(shù),減少化肥用量和使用有機(jī)肥,減少不合理使用化肥用量,使化肥利用率提高,減少種植成本。并獲得綠色健康食品許可證。政府政策支持2021年和2022年,借助滬滇協(xié)作項目,雨柱村積極動員群眾,免費(fèi)為群眾送幼苗、教技術(shù),連片種植桃樹500畝,至今全村種植面積達(dá)3500畝。不但帶來了經(jīng)濟(jì)的支持同時也帶來了科技的交流,使師宗縣能夠更科學(xué)的種植。把一些傳統(tǒng)農(nóng)作物大面積的改換為種植果桃。為了推動果桃產(chǎn)業(yè)的發(fā)展,師宗縣政府與果農(nóng)之間建立了緊密的聯(lián)系,共同努力宣傳果桃的優(yōu)勢,提高銷售速度。此外,得益于國家電子商務(wù)支持政策,果農(nóng)們擁有了多樣化的銷售渠道,進(jìn)一步增加了他們的收入。為了打造出優(yōu)質(zhì)品牌,果農(nóng)們積極組成聯(lián)盟,以應(yīng)對激烈的市場競爭。他們積極搭建信息共享平臺,互相分享資源,向市場風(fēng)險發(fā)起積極的應(yīng)對。從品種、栽培、管護(hù)、營銷等方面開展標(biāo)準(zhǔn)化、規(guī)范化管理,積極打造“滇東”桃品牌。理論基礎(chǔ)因子分析查爾斯·斯皮爾曼在1904年對學(xué)生測試結(jié)果進(jìn)行研究,從而激發(fā)了人們對因素分析的思考。因子分析是從原變量中尋找對其有影響的共同因素。為了刻畫眾多指標(biāo)、因素及變量的交互作用。人們往往采用少量高分值的共同因素,這種方法能最大限度地保留原資料的精確性,便于解釋性分析。降維技術(shù)是一種有效的方法,它既能使數(shù)據(jù)簡單化,又能科學(xué)分析。其目標(biāo)是使公共因子盡可能多的包含原始指標(biāo)信息,從而達(dá)到明確觀測內(nèi)容、簡化觀測系統(tǒng)的目的,克服傳統(tǒng)評價分析方法中存在的指標(biāo)相關(guān)性等缺陷[9]。因子分析的基本思想因子分析將原變項按相關(guān)度分組,使得同組項內(nèi)有高相關(guān)度,但組間無顯著相關(guān),每個變量都是一種基本的結(jié)果,它是由一個不能被觀察到的合成變量來表達(dá),這個基本結(jié)構(gòu)也稱為公共因子。因子分析的基本模型為了便于研究,減低因觀測綱間差別以及數(shù)量級差異引起的誤差,對由n個樣品和p個指標(biāo)組成的樣本觀測數(shù)據(jù)進(jìn)行了歸一化。使其平均為0,方差為1。為使表達(dá)簡潔,將初始變量和歸一化后的變量向量均置為X表示,用F1X=(X1,X2,F=(F1,F2,?ε=(ε1,ε2,cov(ε)=Σε=σ112?0???0?σpp2 即ε的各分量之間也是相互獨(dú)立的,則模型X1=a11F1+a12F2+?+a1mFm稱為因子模型。模型的矩陣形式為:X=AF+ε (STYLEREF1\s3-SEQ(1-1)\*ARABIC\s13)式中A=a11a12a21a22?a1m?a2m??ap1ap2??共同因子F是每個變量的線性表達(dá)式中都出現(xiàn)的因子,A是因子載荷矩陣。aij稱為因子載荷,是第i個原始變量在第j個因子上的負(fù)荷;ε因子載荷aijcov(Xi,Fj)=cov(j=1maijFj+εi即aij是Xi與Fj的協(xié)方差,Xi與Fj都是均值為0,方差為1的變量,因此,aij同時也是Xi變量共同度的統(tǒng)計意義即指因子載荷矩陣中第i行元素平方和,用來對應(yīng)第i個變量:?i2=j=1maij2,(i=1,2,?,p) (STYLEREF1\s由因子分析的模型假設(shè)前提易得Var(Xi)=Var(Xi?μi)=Var(ai1F1+a因此共同度表示的是全部公共因子對變量Xi的總方差做出的貢獻(xiàn)公共因子Fj的方差貢獻(xiàn)率的統(tǒng)計意義記因子載荷陣中第j列元素的平方和為 gj2=i=1paij2,(j=1,2,?,m) (STYLEREF1\s稱為公共因子Fj對X的方差貢獻(xiàn)是公共因子相對重要性的指標(biāo)。gj2越大,表明公共因子Fj對X的貢獻(xiàn)與其影響和作用成正比。如果將因子載荷矩陣A所有因子分析的步驟在選擇研究問題時,我們會挑選適當(dāng)?shù)脑甲兞?。通過把這些將原始變量歸一化并求出各變量之間的相關(guān)性矩陣,以分析各變量間的相關(guān)性。數(shù)據(jù)的標(biāo)準(zhǔn)化處理主要是為了消除指標(biāo)之間的量綱和取值范圍差異的影響變量標(biāo)準(zhǔn)化的公式為[8]:Zij=xij?xiσ,i=1,2,…,n;j=1,2,…,p (STYLEREF1\s3-SEQ(1-1)\*ARABIC\s19xij為原始數(shù)據(jù),Zij為原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù),xi和σ每個變量的平均值和標(biāo)準(zhǔn)差分別為第j個變量的平均值和標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)化后每個變量的平均值為0經(jīng)數(shù)據(jù)處理,獲得標(biāo)準(zhǔn)化數(shù)據(jù)矩陣Zij,計算相關(guān)系數(shù)矩R=rR=r11r12?r1pr21r22?r2p????rp1r式中Rij(i=1,2,?,p)為原變量rij=k=1P(xki?xi)(xkj?xj)k=1P(x式中rii=1,rji求解初始因子及載荷矩陣。主成分法是求公共因子的方法,利用相關(guān)矩陣求解p個主成分,歸一化后得到一組不相關(guān)的變量Y。具體步驟如下:Y1=u11x1+u12x2+?+u1pxpY2其中,ui1式中的系數(shù)按以下原則進(jìn)行求解:Y1Y2是與YYp是與YYi,Yj按照上述原理決定初始變量的第一、第二、...、第p個主要成分。第一個主成分在總方差中貢獻(xiàn)最大,其它各成分在總方差中貢獻(xiàn)遞減。說明主成分綜合原變量的整合作用依次減弱。計算初等載荷矩陣,則計算相關(guān)系數(shù)矩陣R的特征值λ1≥λ2≥?≥A=[λ1u1,λ2u2,?,λpup] 因子旋轉(zhuǎn)。方差最大的正交旋轉(zhuǎn)需要尋找正交旋轉(zhuǎn)矩陣,使得B=AΓ的方差達(dá)到最大。其方差的表達(dá)式為Vj=1p2j=1mpi=1pbij4?i4?i=1設(shè)因子載荷矩陣有兩列,即m=2,那么正交矩陣形式可以設(shè)為Γ=cos??sin?sin?cos? (STYLEREF1\s3-那么AΓ=a11cos?+a12sin??a11sin?+經(jīng)過轉(zhuǎn)換,旨在使載荷矩陣每列元素盡可能集中于其平方值的最大或最小值,以實(shí)現(xiàn)二元分化,使因子貢獻(xiàn)盡可能分散。此舉旨在將變量劃分為兩個部分,一部分與第一因子主要相關(guān),另一部分與第二因子相關(guān)。就是要求b112,?,bp12,(b計算綜合得分。通過對各因素分析,計算因子得分的方法是每次抽樣所對應(yīng)的因素值,因子得分所代表的變量被稱為因子變量。第i個采樣中的第j個因子值可以表示為:Fj=wj1x1+wj2x1+?+wjpxp確定主成分,對各指標(biāo)進(jìn)行旋轉(zhuǎn)處理,得到各指標(biāo)的權(quán)重。主成分i的貢獻(xiàn)率:vi=λik=1pλp(i=1,2,…,p) (STYLEREF1\s3能夠顯示出各主要成分表現(xiàn)出信息含量及綜合能力。上一個主成分的總體貢獻(xiàn)率:i=1kvi=i=1kλki=1pλk(i=1,2,…,p) 能體現(xiàn)出前k個主元原始變量的最大信息,具有較高的綜合能力。計算綜合得分:F=v1F1+v2F2+...+vkFk 其中ek為第k個主成分的信息貢獻(xiàn)率,根據(jù)綜合得分值即可進(jìn)行評價[8]SARIMA模型QUOTEX=&X1&X2SARIMA模型的基本思想ARIMA模型全稱為差分自回歸移動平均模型,是由博克思和詹金斯于20世紀(jì)70年代初提出的著名時間序列預(yù)測方法,將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機(jī)序列,用一定的數(shù)學(xué)模型來大概描述這個序列[5]。某些非平穩(wěn)時間序列會包含周期性特征,ARIMA模型不足以提取數(shù)據(jù)中的周期性,此時通常采用季節(jié)性差分自回歸移動平均SARIMA模型[17]。SARIMA(p,d,q)×(P,D,Q)S模型符號說明表3SEQ表\*ARABIC\s11模型公式符號說明表Table3SEQTable\*ARABIC\s11Modelformulasymboldescriptiontable符號說明?差分算子d差分階數(shù)t時間點(diǎn)X在時間點(diǎn)t上的指標(biāo)數(shù)值Φ自回歸系數(shù)多項式Φ季節(jié)性自回歸多項式Θ移動平均系數(shù)多項式Θ季節(jié)性移動平均多項式B延遲算子?自回歸系數(shù)θ移動平均系數(shù)p自回歸系數(shù)對應(yīng)的滯后階數(shù)q移動平均系數(shù)對應(yīng)的滯后階數(shù)ε均值為零,方差為的殘差序列ARIMA差分運(yùn)算設(shè)時間序列Xt,t∈T計算1階差分可用于計算兩個時序值之間的差。一階差分?X以此類推,對p?1階差分再進(jìn)行一次差分運(yùn)算稱為p階差分運(yùn)算:p階差分?設(shè)時間序列Xt?kXt=Xt?Xt?k (STYLEREF1\s3-ARIMA模型差分自回歸移動平均模型(ARIMA)是把非平穩(wěn)時間序列換為平穩(wěn)時間序列,在用被解釋變量的滯后值、隨機(jī)誤差項的現(xiàn)值及滯后值相結(jié)合進(jìn)行回歸形成一種模型。ARIMA模型分為自回歸(AR)和移動平均值(MA)。這里,AR表示自回歸變量,p表示自回歸模型的滯后階;MA表示移動平均值,q表示移動平均的項數(shù);d表示時間序列轉(zhuǎn)化為平穩(wěn)序列時所做的差分次數(shù)。求和自回歸的平均模型ARIMA(p,d,q)是一種通過對原始序列進(jìn)行差分來得到平穩(wěn)序列[5],并通過ARIMA(p,d,q)擬合的方法:Φ(B)?dxt=Θ(B)εtE(εt)=0,Var(εt)=σ其中?d=(1?B)d;d階差分后序列可描述為:?dxt=i=0d(?1)i?dixt?i 式中,?di=d!i!(d?i)! (STYLEREF1\s3-即差分后序列等于原序列的若干序列值的加權(quán)和,而對它又可以擬合自回歸移動平均(ARMA)模型,所以稱它為求和自回歸移動平均模型[4]。SARIMA模型SARIMA模型是在對序列進(jìn)行d階差分后,以此差分結(jié)果為依據(jù),對具有S間距的序列值差分操作。采用d階S步差分操作,能有效消除序列的趨勢性和周期性,使得時間序列平穩(wěn),從而可以使用SARIMA(p,d,q)×(P,D,Q)S。p(非季節(jié)性回歸階數(shù)),d(非季節(jié)性差分階數(shù)),q(非季節(jié)性移動平均項階數(shù)),P(季節(jié)性回歸階數(shù)),D(季節(jié)性差分階數(shù)),Q(季節(jié)性移動平均階數(shù))[17]。SARIMA模型是建立在ARIMA模型基礎(chǔ)上的。不僅要進(jìn)行d階差分,還需要S步差分運(yùn)算,具體表達(dá)式為:?SXt=Xt?Xt?1=(1?BS)Xt 若將序列進(jìn)行d階差分處理,使其趨于穩(wěn)定,則差分后的序列可以構(gòu)成ARMA模型,則稱其為SARIMA模型。SARIMA模型這樣定義:假定d、D均為非負(fù)整數(shù),將原始序列進(jìn)行d階差分和D階S步差分,然后建立ARMA模型。可以得到隨機(jī)序列YYt?(1?B)d(1?B)DXt (STYLEREF1\s3-SEQ(1-1)\*ARABIC\s1若Yt是平穩(wěn)的ARMAΦ(B)ΦS(B)Yt=Θ(B)ΘS(B)εt (則稱Yt是周期為S的SARIMA(p,d,q)×(P,D,Q)SΦS(B)=1??1B??2B2s????pBps ΘS(B)=1?θ1B?θ2B2s???θqBqs Φ(B)與ΦS(B)分別表示非季節(jié)性與季節(jié)性自回歸多項式,Θ(B)與ΘS(B)分別表示非季節(jié)性和季節(jié)性移動平均多項式。εt為白噪聲序列。在實(shí)際應(yīng)用中,D很少大于1,而SARIMA模型的步驟數(shù)據(jù)平穩(wěn)性檢驗(yàn),模型識別當(dāng)序列具有穩(wěn)定性條件時,分別采用自回歸、移動平均或ARMA模型進(jìn)行建模;當(dāng)序列為非穩(wěn)態(tài)時,首先要一次差分,然后在對差分后的序列進(jìn)行穩(wěn)定性檢驗(yàn)。如果是穩(wěn)定的,那么表示階數(shù)為一;否則,需進(jìn)行二階差分。接著判斷序列是否具有周期性,可簡單地通過時序圖觀察,由于序列本身沒有周期性,所有無法應(yīng)用ARIMA模型的情況下,需要用SARIMA模型來進(jìn)行擬合。ARIMA模型能很好地描述序列自相關(guān)和部分自相關(guān)函數(shù),并能根據(jù)預(yù)測結(jié)果確定適當(dāng)?shù)腁RIMA模型。表32各階模型關(guān)系Table32Modelrelationshipsofeachorder模型自相關(guān)函數(shù)偏自相關(guān)函數(shù)AR(p)振蕩或指數(shù)衰減p階截尾MA(q)q階截尾振蕩或指數(shù)衰減ARMA(p,q)振蕩或指數(shù)衰減振蕩或指數(shù)衰減模型定階確定采用SARIMA模型建模后,首先需要確定SARIAM模型的參數(shù),通過兩種:第一是通過自相關(guān)/偏自相關(guān)圖(ACF/PACF)對模型進(jìn)行參數(shù)估計;第二種方法利用AIC和BIC兩個標(biāo)準(zhǔn)來確定模型選取。AIC準(zhǔn)則的數(shù)學(xué)表達(dá)式如下:AIC=?2lnL+2k (STYLEREF1\s3-SEQ(1-1)\*ARABIC\s130)其中L為似然函數(shù)值,k為未知參數(shù)個數(shù)。AIC準(zhǔn)測是根據(jù)模型的擬合精度和參數(shù)個數(shù)來評估模型的好壞,一般而言,較大的似然函數(shù)值表示模型擬合效果較好,而更多的未知參數(shù)表示模型準(zhǔn)確度較高。AIC值達(dá)到最小時視為最佳模型。通過確定階段所構(gòu)建的假設(shè)模型,來評估參數(shù)和檢驗(yàn)這些假設(shè)。模型檢驗(yàn),最后對模型的參數(shù)進(jìn)行顯著性檢驗(yàn)[13]。模型設(shè)定后,如果通過了模型檢驗(yàn),就可以使用該模型來預(yù)測?;谝蜃臃治鲇绊懸蛩胤治龌谝蜃臃治鲇绊懸蛩卮_定影響因素依據(jù)上文分別從天氣、投入兩個角度,分別選取平均最高溫度、平均最低溫度、溫差、日照時長、降雨量、人工投入、化肥用量、產(chǎn)業(yè)投入共8個指標(biāo)作為果桃產(chǎn)量的影響因素[4]。問卷調(diào)查通過設(shè)計調(diào)查問卷調(diào)查種植戶認(rèn)為影響產(chǎn)量的原因,總體而言,該調(diào)查表由三部分組成:一是填寫農(nóng)民的基本資料,包括農(nóng)民的年齡、種植年限、種植面積;第二部分為影響因素調(diào)查,共計24道題;第三部分為果子成熟狀況調(diào)查,共有5道題(附錄1)。對后期收到的303份有效問卷使用SPSS27軟件對數(shù)據(jù)進(jìn)行分析(附錄2)。第二部分使用李克特量表,根據(jù)回答的多少將問卷分成五個等級:非常不滿意、相對不滿意、中立、滿意和非常滿意。一般分值1,2,3,4,5。問卷總體信效度分析可靠性分析(ReliabilityAnalysis)是研究數(shù)據(jù)是否真實(shí)可靠的方法,主要關(guān)注數(shù)據(jù)的真實(shí)性和樣本的回答準(zhǔn)確性,同時也考察了受訪者的答題態(tài)度。信度分析—計算公式:α=KK?1(1?Si2Sx2) (STYLEREF1\s克隆巴赫系數(shù)公式中,α為信度系數(shù),K為測驗(yàn)題目數(shù),Si表示所有被試在第i題上的分?jǐn)?shù)變異,S表4SEQ表\*ARABIC\s11信度分析表Table4SEQTable\*ARABIC\s11Reliabilityanalysistable可靠性統(tǒng)計克隆巴赫Alpha基于標(biāo)準(zhǔn)化項的克隆巴赫Alpha項數(shù)0.8290.83332根據(jù)表4-1的信度分析結(jié)果顯示,本研究題目總數(shù)為32,總體信度系數(shù)是0.833,因此,不需對全部內(nèi)容維度的題目作任何調(diào)整,信度系數(shù)在0~1之間,愈接近1,表示信度越高。效度分析效度分析(ValidityAnalysis)

是對問卷內(nèi)容合理性進(jìn)行研究,考察各變量、各維度所含概念信息的合理性、以及題項設(shè)計的適當(dāng)性,從而評價問題設(shè)計的科學(xué)性。

利用探索性因素分析對測試程序進(jìn)行驗(yàn)證:表42效度分析表Table42ValidityanalysistableKMO和巴特利特檢驗(yàn)KMO取樣適切性量數(shù)。.864巴特利特球形度檢驗(yàn)近似卡方3339.350自由度351顯著性.000根據(jù)REF_Ref275031458\h表42探索性因子分析的結(jié)果可以看出,KMO檢驗(yàn)的系數(shù)結(jié)果為0.864,KMO檢驗(yàn)的系數(shù)取值范圍在0-1之間,越接近1說明問卷的效果好[6]。經(jīng)過檢驗(yàn),顯著性分析顯示,此檢驗(yàn)的顯著性幾乎為于零。則最初假定被否決??梢缘贸鼋Y(jié)論,該問卷具有良好的檢驗(yàn)效果。問卷個人情況的描述性統(tǒng)計分析表43頻率表Table43Frequencytable變量選項頻率百分比平均值標(biāo)準(zhǔn)差年齡18-255318%2.611.1826-3510735%36-457725%46-553813%56及以下289%種植年限1-3年7625%2.421.084-6年8628%7-10年7826%10年以上6321%種植規(guī)模1-1000株6822%2.451.051001-5000株9130%5001-10000株8428%10000株以上6020%REF_Ref275031458\h表43的分析結(jié)果可以看出種植戶個人情況的分布情況。均值反映的是分布的總體趨勢,而標(biāo)準(zhǔn)偏差則體現(xiàn)了分配的波動性。通過對各變量的頻數(shù)進(jìn)行了分析,發(fā)現(xiàn)各變量的分布能夠較好地滿足抽樣調(diào)查的需要。實(shí)例研究指標(biāo)選取本文共選取8個影響因素的指標(biāo):表44影響因素參數(shù)表Table44Influencingfactorparametertable影響因素參數(shù)平均最高溫度x平均最低溫度x溫差x日照時長x降雨量x人工投入x化肥用量x產(chǎn)業(yè)投入x這些指標(biāo)所反映的內(nèi)容可以概括為兩個方面:天氣、資產(chǎn)投入,這些因素對師宗果桃的成熟狀況起導(dǎo)向作用。為了分析所選指標(biāo)是否適合因子分析,進(jìn)行KMO和巴特利特檢驗(yàn)。KMO統(tǒng)計量用于對原始變量之間的相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對大小比較,Bartlett球性檢驗(yàn)相關(guān)陣中各變量間的相關(guān)性,是否為單位陣,即檢驗(yàn)各個變量是否各自獨(dú)立。表45KMO統(tǒng)計量和Bartlett形檢驗(yàn)結(jié)果Table45KMOandBartlett’stestKMO和巴特利特檢驗(yàn)KMO取樣適切性量數(shù)。0.969巴特利特球形度檢驗(yàn)近似卡方2892.394自由度36顯著性0問卷數(shù)據(jù)的8個影響因素指標(biāo)的KMO統(tǒng)計量和Bartlett形檢驗(yàn)結(jié)果見REF_Ref275031458\h表45。KMO值愈接近于1,說明表各變量間的關(guān)聯(lián)程度愈高,該表KMO值為0.969,進(jìn)行因子分析較好。同時,Bartlett球形檢驗(yàn)統(tǒng)計量為2892.394,對應(yīng)的概率Sig為0.000<0.05。由此,可看出相關(guān)系數(shù)陣和單位陣之間存在明顯不同。通過以上說明,本文所選8個影響因素指標(biāo)適合用因子分析法進(jìn)行分析。因子分析結(jié)果現(xiàn)在帶入收集的問卷數(shù)據(jù)(附錄2)構(gòu)建如下原始矩陣:X=現(xiàn)在對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理(附錄3),首先求出影響因素的均值與標(biāo)準(zhǔn)差,公式如下:x=x1+x2+...+xnn (STYLEREF1\s4S=1n(x1?x)2+(x2?x)將數(shù)據(jù)帶入上面兩個式子可以得到下表:表46描述統(tǒng)計量Table46SummaryStatisticsN平均值標(biāo)準(zhǔn)差x30313.054.394x30312.154.275x30312.834.277x30313.414.767x30313.144.329x30313.304.635x30312.114.216x30312.324.341由標(biāo)準(zhǔn)化公式Zij=xij?xxij為原始數(shù)據(jù),Zij為原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù),xi和σ計算相關(guān)系數(shù)矩R=rij,且R=式中,Rij(i=1,2,…,p)為原變量xi和rij=k=1P(xki?x根據(jù)特征方程λE?R=0,得到特征值λ1,λ表47方差貢獻(xiàn)率和累計貢獻(xiàn)率Table47Variancecontributionrateandcumulativecontributionrate總方差解釋成分初始特征值提取載荷平方和旋轉(zhuǎn)載荷平方和總計方差百分比累積%總計方差百分比累積%總計方差百分比累積%16.11076.38176.3816.11076.38176.3813.28841.10141.10120.3364.19680.5770.3364.19680.5773.15839.47680.57730.3083.85084.42640.2883.59588.02250.2663.33091.35160.2433.03594.38670.2413.01897.40480.2082.596100.000提取方法:主成分分析法。運(yùn)用SPSS27.0程序進(jìn)行因子分析,利用主成分分析法,提取出各指標(biāo)的累計貢獻(xiàn)率。通過分析得,這二種因子的累積貢獻(xiàn)率已超過了80.577%,符合因子數(shù)量對累積貢獻(xiàn)率的要求,所以可選用二種因子。其中,變量共同度反映所有因子解釋能力,?i2=j=1maij2,(i=1,2,?下REF_Ref275031458\h表48影響因素共同度都在0.75以上,每個變量共同度都較高,說明因子分析的有效性很好。表48公因子方差Table48commonfactorvariance初始提取x10.822x10.795x10.804x10.858x10.761x10.822x10.787x10.798提取方法:主成分分析法。計算初等載荷矩陣,則計算相關(guān)系數(shù)矩陣R的特征值λ1≥λ2≥?≥A=[λ1u1,λ2u2,?即可得出成分得分系數(shù)矩陣如下REF_Ref275031458\h表49:表49成分矩陣Table49ComponentMatrix成分1成分2x0.8890.064x0.886-0.039x0.885-0.123x0.878-0.229x0.867-0.325x0.8660.231x0.8610.139x0.8590.290提取方法:主成分分析法。a.提取了2個成分。根據(jù)因子分析法的得分函數(shù)公式,X=AF+ε 如上表結(jié)合成份得分系數(shù)矩陣所示,即可得出各個成分的公因子線性組合:FF后需要尋找正交旋轉(zhuǎn)矩陣,使得B=AΓ假設(shè)有兩列的因子載荷矩陣,即m=2,可以假設(shè)正交矩陣的形式為Γ=cos??sin?sin?cos? 那么AΓ=b11b12??bp1b運(yùn)用公式得出旋轉(zhuǎn)后的成分矩陣如下REF_Ref275031458\h表410:表410旋轉(zhuǎn)后的成分矩陣Table410Rotatedcompositionmatrix旋轉(zhuǎn)后的成分矩陣a成分1成分2x0.8170.393x0.7810.440x0.7130.503x0.6800.576x0.3930.839x0.4670.777x0.5470.706x0.6060.647提取方法:主成分分析法。旋轉(zhuǎn)方法:凱撒正態(tài)化最大方差法。a.旋轉(zhuǎn)在3次迭代后已收斂。根據(jù)REF_Ref275031458\h表410旋轉(zhuǎn)后的成分矩陣對公共因子命名,其中氣象因子(F1)包含變量平均最高溫度(x1)、平均最低溫度(x2)、溫差(x3)、降雨量(x5),則農(nóng)業(yè)生產(chǎn)要素投入因子(F2)包含變量日照時長(x4),人工(x6),化肥農(nóng)藥(x7想要得出綜合得分F就要對總方差解釋表進(jìn)行分析,此處因子分析用旋轉(zhuǎn)后的方差貢獻(xiàn)率做被除數(shù),根據(jù)式子可以求出綜合得分[8]:F=v1F1+v2將各旋轉(zhuǎn)后成分1和成分2的貢獻(xiàn)率41.101%,39.476%和累計方差貢獻(xiàn)率80.577%帶入式子可得因子分析的綜合得分:F表411影響因素綜合得分Table411ComprehensivescoreofinfluencingfactorsF排名F排名F排名x0.85980.29010.5801x0.88910.06440.4854x0.86660.23120.5552x0.8675-0.32580.2838x0.86170.13930.5073x0.8784-0.22970.3367x0.8862-0.03950.4335x0.8853-0.12360.3916通過上REF_Ref275031458\h表411的排名可以看出平均最高溫度(x1)、溫差(x3)、降雨量(x5)、平均最低溫度(x2)、化肥農(nóng)藥(x7)小結(jié)本章采用了因子分析方法,對師宗縣果桃產(chǎn)量主要影響因子選取的八個數(shù)據(jù)指標(biāo)進(jìn)行了分析,并通過問卷分析,最后得出了二種因子對影響產(chǎn)量的有極其明顯的關(guān)系。利用影響因子分析法,對指標(biāo)系統(tǒng)數(shù)據(jù)進(jìn)行研究,分析結(jié)果顯示,影響果桃產(chǎn)量的因素共有2個。其中一項為“氣象因子”,另一個為“農(nóng)業(yè)生產(chǎn)要素投入因子”。因此,對師宗縣果桃產(chǎn)量首要的影響因素是“氣象因子”,其次是“農(nóng)業(yè)生產(chǎn)要素投入因子”。通過分析我們對果桃產(chǎn)量的影響因素有了初步的了解,對于“氣象因子”我們無法控制,但我們可以在“農(nóng)業(yè)生產(chǎn)要素投入因子”中采取一些方法,來提升產(chǎn)量,增產(chǎn)增收,例如:加大對果桃種植產(chǎn)業(yè)的投資金額;采用配方化肥,也可以對產(chǎn)量有一定影響,既可以增收又可以保護(hù)土壤,形成可持續(xù)發(fā)展的種植業(yè),但使用農(nóng)業(yè)化學(xué)用品終將會產(chǎn)生農(nóng)業(yè)污染問題,為了預(yù)防這種問題的發(fā)生,應(yīng)采取相應(yīng)的措施與政策,需要去考慮未來如何在減少化肥施用量后依然可以有效提高產(chǎn)量[4]。除以上所述,農(nóng)業(yè)生產(chǎn)投入也包含政府政策積極回應(yīng)鼓勵農(nóng)業(yè)種植等等。筆者把師宗縣近年來興起的果桃是一種經(jīng)濟(jì)作物,其產(chǎn)量高,不但給果農(nóng)帶來較高收入,同時促進(jìn)城鎮(zhèn)經(jīng)濟(jì)發(fā)展和旅游業(yè),因此確保果桃產(chǎn)量對師宗縣具有重要意義?;诙嘣€性回歸及SARIMA模型的產(chǎn)量預(yù)測分析多元線性回歸預(yù)測通過國家氣象數(shù)據(jù)中心查找到師宗縣2018年6月-2023年9月的氣象數(shù)據(jù)如下:表51氣象數(shù)據(jù)Table51meteorologicaldata時間平均最高溫度(x1平均最低溫度(x2溫差(x32018年6月231672018年7月241682018年8月231582018年9月221482019年6月251782019年7月241772019年8月241592019年9月221392020年6月261792020年7月241772020年8月241682020年9月221572021年6月241772021年7月241682021年8月251692021年9月241592022年6月231672022年7月2616102022年8月251692022年9月221482023年6月251692023年7月261792023年8月241682023年9月24159對能夠查找到的氣象數(shù)據(jù)只有平均最高溫度,平均最低溫度和溫差。其中降雨量和化肥施用情況數(shù)據(jù)無準(zhǔn)確數(shù)據(jù)。后運(yùn)用已知數(shù)據(jù)與產(chǎn)量數(shù)據(jù)建立多元回歸模型。假設(shè)該多元線性回歸模型為:Yi=β0+β對附錄中產(chǎn)量2018年6月-2023年6月的產(chǎn)量數(shù)據(jù)和表5-1的數(shù)據(jù)用SPSS進(jìn)行多元線性回歸分析,得出下表:表52回歸分析模型摘要Table52Abstractofregressionanalysismodel非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)化系數(shù)BetatPVIFR2調(diào)整R2FB標(biāo)準(zhǔn)誤常數(shù)8.57293.422-0.0920.928-0.1730.082F=1.888P=0.180平均最高溫度1.7942.6550.0980.6760.508平均最低溫度-5.0113.106-0.245-1.6130.124溫差6.8053.5830.2751.8990.074*因變量:產(chǎn)量注:***、**、*分別代表1%、5%、10%的顯著性水平上表5-2展示了本次模型的分析結(jié)果,包括模型的標(biāo)準(zhǔn)化系數(shù)、t值、VIF值、R2、調(diào)整R2等,用于模型的檢驗(yàn),F(xiàn)檢驗(yàn)的結(jié)果分析可以得到,顯著性P值為0.180,水平上不呈現(xiàn)顯著性,不能拒絕回歸系數(shù)為0的原假設(shè)。對于變量共線性表現(xiàn),變量平均最高溫度、平均最低溫度、溫差的VIF值大于10,存在共線關(guān)系。模型的公式如下:產(chǎn)量=8.572+1.794*平均最高溫-5.011*平均最低溫度+6.805*溫差。代入公式(4-4)回歸表達(dá)式為:Y3=8.572+1.794X圖5-SEQ圖\*ARABIC\s11多元回歸產(chǎn)量預(yù)測圖Fig51Multipleregressionyieldforecastgraph上圖5-1展示了本次模型的原始數(shù)據(jù)圖、模型擬合值、模型預(yù)測值。已知2023年7-9月的平均最高溫度,平均最低溫度和溫差數(shù)據(jù)代入表達(dá)式(5-2)得出下表預(yù)測結(jié)果表53預(yù)測數(shù)據(jù)Table53predicteddata變量系數(shù)7月數(shù)據(jù)測試值8月數(shù)據(jù)測試值9月數(shù)據(jù)測試值常數(shù)8.572111平均最高溫度1.794262424平均最低溫度-5.011989溫差6.805171615預(yù)測結(jié)果125.78120.4108.58真實(shí)數(shù)據(jù)48.6121.4106.9相對誤差-158%0.8%-1.5%上表5-3計算相對誤差根據(jù)公式:δ(x)=?L?100%其中?為絕對誤差,絕對誤差等于真實(shí)值減去預(yù)測值,L為真值。由上表(5-3)的預(yù)測結(jié)果的相對誤差可知,其中2023年7月的誤差過大,而8月和9月的預(yù)測數(shù)據(jù)在誤差范圍內(nèi),此多元線性模型并不是最優(yōu)模型。SARIMA預(yù)測模型實(shí)例分析數(shù)據(jù)平穩(wěn)化處理和識別模型數(shù)據(jù)來源為2018年到2023師宗縣眾旺種植專業(yè)合作社產(chǎn)量數(shù)據(jù)(附錄4)。圖5-2展示的2018年到2023產(chǎn)量數(shù)據(jù)序列為例,通過觀察這個時序圖,可以更直接地判斷該序列的穩(wěn)定性。圖5-SEQ圖\*ARABIC\s12產(chǎn)量時序圖Fig52Timesequencechartofproduction總而言之,不考慮其他極端影響因素,師宗縣果桃產(chǎn)量逐年上升。在2017年期間師宗雨柱成立了眾旺種植專業(yè)合作社。師宗縣重點(diǎn)投資建立了大型果桃生產(chǎn)基地,擴(kuò)大果桃種植面積。而在2021年2022師宗縣果桃播種進(jìn)一步快速增加,則是借助滬滇協(xié)作項目,免費(fèi)為群眾送幼苗、教技術(shù),連片種植桃樹500畝。從圖5-2中可以明顯觀察到,數(shù)據(jù)序列并沒有呈現(xiàn)隨機(jī)波動且無界的特征,表明它是一個不具備平穩(wěn)性質(zhì)的序列。季節(jié)性數(shù)據(jù)圖4-3可以看出這列時間序列存在很明顯的周期性,且以季為周期,且季度周期為4。季度劃分為每年1月、2月、3月為第一季度,4月、5月、6月為第二季度,以此類推(附錄4)為對擬合模型精度良好的檢驗(yàn),將原序列數(shù)據(jù)產(chǎn)量單位的后續(xù)建模過程將僅采取2018年一季度到2023年二季度的數(shù)據(jù)進(jìn)行建模。后與2023年第三季度的真實(shí)值數(shù)據(jù),用于與預(yù)測值進(jìn)行比較分析。圖5-SEQ圖\*ARABIC\s13季節(jié)性數(shù)據(jù)Fig53Seasonaldata原季度數(shù)據(jù)為不平穩(wěn)序列且具有周期性。則對其進(jìn)行差分以及季節(jié)差分,直至序列滿足平穩(wěn)性為止。因此,我們必須對季度數(shù)據(jù)作差分操作,SARIMA模型是建立在ARIMA模型之上的,不僅要進(jìn)行d階差分,還需要S步差分運(yùn)算,差分公式以及季節(jié)性差分公式為: ?dxt=i=0d(?1)i?dixt?i ?SXt=Xt?Xt?1=(1?BS)Xt 我們運(yùn)用SPSS27.0統(tǒng)計分析軟件采用一次差分、一次季節(jié)差分,并對所得結(jié)果做了平穩(wěn)測試。圖5-SEQ圖\*ARABIC\s14最佳差分序列圖Fig54Thebestdifferencesequencediagram圖5-4是我們對原始數(shù)據(jù)進(jìn)行一階差分以及一階季節(jié)差分所得到的時序圖,表示各時間段差分后的產(chǎn)量值。我們這里可以直接看出差分序列圖呈現(xiàn)平緩趨勢。其中季節(jié)性ARIMA模型要求時間序列滿足平穩(wěn)性檢驗(yàn),若P<0.05,說明序列為平穩(wěn)序列。表5-4ADF檢驗(yàn)表Table54TheADFTestForm變量序列tPAIC臨界值1%5%10%產(chǎn)量1階差分-1階季節(jié)差分-17.4430.000***30.271-4.332-3.233-2.749注:***、**、*分別代表1%、5%、10%的顯著性水平上表5-4為ADF檢驗(yàn)的結(jié)果,包括變量、差分階數(shù)、T檢驗(yàn)結(jié)果、AIC值等,用于檢驗(yàn)時間序列是否平穩(wěn)。根據(jù)t值的分析結(jié)果,可得到-17.443<-4.332<-3.233<-2.749的結(jié)論,ADF檢驗(yàn)中,t統(tǒng)計量在置信水平為1%、5%、10%下都小于相應(yīng)的t統(tǒng)計量,因此可以得出結(jié)論,序列是平穩(wěn)的時間序列。序列呈現(xiàn)顯著性(P<0.05),則說明拒絕原假設(shè),該序列為一個平穩(wěn)的時間序列。模型定階采用SARIMA模型建模后,首先要確定SARIAM模型的參數(shù)。根據(jù)自相關(guān)/偏自相關(guān)圖(ACF/PACF)確定模型階數(shù)。我們運(yùn)用SPSS27.0統(tǒng)計分析軟件通過一階差分和季節(jié)差分操作,對數(shù)據(jù)進(jìn)行處理,得出了自相關(guān)圖和偏自相關(guān)圖的結(jié)果。圖5-SEQ圖\*ARABIC\s15自相關(guān)圖Fig55Self-relateddiagram如圖5-5所示,呈現(xiàn)了自相關(guān)圖(ACF)的拖尾形式,可以通過觀察自相關(guān)系數(shù)的拖尾情況來確定參數(shù)p、P。圖5-SEQ圖\*ARABIC\s16偏自相關(guān)圖Fig56Partialautocorrelationdiagram如圖5-6所示,顯示了偏自相關(guān)圖(PACF)的拖尾形式,來確定參數(shù)q、Q。表5-5模型參數(shù)值Table55ModelparametervalueSARIMA模型參數(shù)結(jié)果?參數(shù)值參數(shù)值p0P2d1D1q0Q0S4參數(shù)估計通過這個模型進(jìn)行參數(shù)估計,如表5-6。表5-6模型統(tǒng)計量表Table56ModelstatisticalscaleSARIMA模型(0,1,0)x(2,1,0,4)項符號值樣本數(shù)量N22Q統(tǒng)計量Q1(p值)0.027*Q2(p值)0.081Q3(p值)0.165Q4(p值)0.227Q5(p值)0.341Q6(p值)0.428Q7(p值)0.536Q8(p值)0.440Q9(p值)0.482信息準(zhǔn)則AIC123.131BIC125.631擬合優(yōu)度R20.932上表5-6展示本次模型檢驗(yàn)結(jié)果,包括樣本數(shù)、殘差Q統(tǒng)計量、信息準(zhǔn)則模型的適應(yīng)程度以及擬合優(yōu)度。模型輸出結(jié)果是SARIMAX(0,1,0)×(2,1,0)4模型。基于變量產(chǎn)量,通過剩余Q統(tǒng)計量進(jìn)行檢驗(yàn):得到了在水平上Q6不明顯的結(jié)論,不能推翻模型殘差為白噪聲的假設(shè),該模型是比較合理的;該模型具有0.932的R2,表明了良好的擬合效果。因此我們選擇SARIMAX(0,1,0)×(2,1,0)4模型進(jìn)行預(yù)測。參數(shù)檢驗(yàn)表5-7殘差檢驗(yàn)表Table57Residualinspectionform模型殘差檢驗(yàn)結(jié)果?LM序列檢驗(yàn)值Ljung-Box白噪聲檢驗(yàn)值F統(tǒng)計量7.293Ljung-Box值2.727p值0.121p值0.099T*R2統(tǒng)計量2.254Jarque-Bera正態(tài)性檢驗(yàn)值p值0.124JB值3.947Heteroskedasticity異方差檢驗(yàn)值p值0.139H值0.236殘差偏度Skew-0.787p值0.102殘差峰度Kurtosis4.759上表5-7展示出SARIMA模型各類殘差檢驗(yàn)指標(biāo);本文通過對殘差序列的白噪聲測試結(jié)果的分析,結(jié)果表明,各統(tǒng)計量的p值均大于0.05。這表明,擬合后的殘差序列為白噪聲序列。正態(tài)性檢驗(yàn)的p值也大于0.05。在實(shí)際應(yīng)用中,殘差序列應(yīng)滿足一系列條件,包括不存在序列相關(guān)性、符合白噪聲特性、服從正態(tài)分布,并且不存在異方差問題。SARIMA模型預(yù)測及結(jié)果如下為SARIMA模型的預(yù)測。由圖表可以看出,本模型能較好的擬合時間序列的總體趨勢。圖5-SEQ圖\*ARABIC\s17產(chǎn)量模型擬合和預(yù)測圖Fig57Yieldmodelfittingandpredictionchart這里通過觀察圖5-7,可以看出預(yù)測后三個季度的產(chǎn)值。通過圖可以清楚的看到擬合模型后的預(yù)測值區(qū)間。從預(yù)測結(jié)果來看,師宗縣果桃產(chǎn)量集中在每年的第二季度和第三季度,其中第三季度的產(chǎn)量較高。據(jù)了解,第二季度上市的果桃品種只有“皇后油桃”,而第三季度上市的果桃品種就有五種(“黃太子油桃”、秋桃、油蟠桃、毛蟠桃、雪桃)。表5-8未來季度的預(yù)測誤差表Table58Forecasterrortableforfuturequarters時間預(yù)測結(jié)果(單位:噸)真實(shí)值(單位:噸)相對誤差2023年第三季度247.02276.9410.8%2024年第二季度44.582024年第三季度299.45上表5-6計算相對誤差根據(jù)公式:δ(x)=?L?100% 代入數(shù)據(jù)可得2023年第三季度的相對誤差δ(小結(jié)本文研究先以因子分析調(diào)查的影響因素為例,采用多元線性回歸進(jìn)行預(yù)測,因無法查找到影響數(shù)據(jù)降雨量和化肥施用情況,導(dǎo)致后續(xù)7月的預(yù)測數(shù)據(jù)與真實(shí)數(shù)據(jù)的相對誤差較大,所以并不是最優(yōu)的模型。后以師宗縣果桃產(chǎn)量從2017年夏季到2023年夏季,共計22個季度的產(chǎn)量為研究對象,利用Excel,SPSS等時序分析工具,對師宗果桃未來3個月的產(chǎn)量進(jìn)行模擬與預(yù)測。從預(yù)測的結(jié)果來看,雖然預(yù)測值和實(shí)際值有一些偏差,但是這是無法避免的。對果桃產(chǎn)量的影響因素較多,而對產(chǎn)量的擬合也有一些不足之處。使用SARIMAX(0,1,0)×(2,1,0)4模型預(yù)測出的精度良好,相對誤差10.8%。根據(jù)模型預(yù)測的數(shù)據(jù)來看,在2024年夏季和秋季的產(chǎn)量是逐步提高的,但因政府推行退耕還林政策,未來的產(chǎn)量可能會減少,也可能會與2023年持平。因此,隨著時序的增長,我們需要建立新的時序,使之能更快地運(yùn)作,并建立新的預(yù)測模型,以保證更高的短期預(yù)報精度,可以幫助我們?yōu)樗贫ㄒ粋€長遠(yuǎn)的發(fā)展計劃,以便更好地發(fā)揮其優(yōu)勢,實(shí)現(xiàn)發(fā)展目標(biāo)。結(jié)論本文基于SPSS有關(guān)因子分析、時間序列SARIMA模型的有關(guān)理論知識,本研究通過調(diào)查師宗果桃產(chǎn)量的影響因素和果桃單產(chǎn)數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理后,建立了因子分析模型,分析了影響因素。同時,利用SARIMA模型對師宗果桃單產(chǎn)進(jìn)行了預(yù)測分析,并預(yù)測了其變化情況。研究結(jié)果表明:利用影響因素因子分析方法,基于問卷調(diào)查的數(shù)據(jù),對影響果桃產(chǎn)量的因素指標(biāo)進(jìn)行了研究。分析結(jié)果顯示,共存在兩個影響果桃產(chǎn)量的因子。一個是“氣象因子”,另一個為“農(nóng)業(yè)生產(chǎn)要素投入因子”。最后因子分析的綜合得分排名可以看出平均最高溫度、溫差、降雨量、平均最低溫度、化肥農(nóng)藥,這幾個指標(biāo)總體排名靠前,說明對果桃產(chǎn)量因素有著比較大的影響。因此通過分析可以發(fā)現(xiàn)在影響師宗縣果桃產(chǎn)量的影響因子中首先影響最大的是“氣象因子”,其次是“農(nóng)業(yè)生產(chǎn)要素投入因子”。以師宗縣果桃產(chǎn)量從2017年夏季到2023年夏季,共計22個季度的產(chǎn)量為研究對象,利用Excel,SPSS等時序分析工具,對師宗果桃未來3個月的產(chǎn)量進(jìn)行模擬與預(yù)測。從預(yù)測的結(jié)果來看,預(yù)測值和實(shí)際值有一些偏差,使用SARIMAX(0,1,0)×(2,1,0)4模型預(yù)測出的精度良好,相對誤差10.8%,預(yù)測出2024年第二季度和第三季度果桃產(chǎn)量為44.58噸和299.45噸??紤]果桃產(chǎn)量的影響因素較多,而對產(chǎn)量的擬合也有一些不足之處。參考文獻(xiàn)[1]王月杏.印尼坤甸坤中高中學(xué)生漢語學(xué)習(xí)心理調(diào)查研究[D].廣西民族大學(xué),2020.[2]穆凱麗.新疆特色膳食半定量食物頻率問卷的信效度分析[D].新疆醫(yī)科大學(xué),2023.[3]\t"/kcms2/article/_blank"任嘉穎.山西運(yùn)城蘋果產(chǎn)量預(yù)測及影響因素分析[D].山西農(nóng)業(yè)大學(xué),2017.[4]徐浪.化肥施用量對糧食產(chǎn)量的貢獻(xiàn)率分析[J].優(yōu)質(zhì)糧油.2002,01(77):10-13.[5]\t"/kcms2/article/_blank"趙嘉寶.吐魯番市葡萄產(chǎn)量主要影響因子分析及預(yù)測[D].塔里木大學(xué),2020.[6]段霞.基SPSS軟件的山東省糧食產(chǎn)量預(yù)測模型分析[J].\t"/kcms2/article/_blank"鄉(xiāng)村科技.\t"/kcms2/article/_blank"2021,12(12):29-31.[7]楊堅爭.基于因子分析的跨境電子商務(wù)評價指標(biāo)體系研究[N].財貿(mào)經(jīng)濟(jì),2014-9.[8]李珺.基于因子分析的多元線性回歸方法其在股價預(yù)測中的應(yīng)用[D].南京大學(xué),2014.[9]李璐.基于因子分析教育類上市公司經(jīng)營績效研究[D].華中師范大學(xué),2020.[10]林思琪.基于因子分析法的七匹狼財務(wù)績效評價及提升對策研究[D].云南師范大學(xué),2023.[11]湯巖.時間序列分析的研究與應(yīng)用[D].東北農(nóng)業(yè)大學(xué),2007.[12]李瑩.基于時間序列與多元線性回歸綜合模型的農(nóng)村卷煙銷售預(yù)測[D].云南大學(xué),2015.[13]陳聰聰.基于ARIMA模型和ARIMAX模型的山東省GDP的預(yù)測與分析[D].山東大學(xué),2016.[14]李達(dá).基于時間序列分析方法的油田產(chǎn)量預(yù)測與應(yīng)用[D].蘭州理工大學(xué),2018.[15]盧正浩.疫情視角下季節(jié)性數(shù)據(jù)預(yù)測方法及其動態(tài)結(jié)構(gòu)研究[D].紹興文理學(xué)院,2022.[16]南潤.基于SARIMA-CNN-LSTM的車流量預(yù)測分析[D].長春工業(yè)大學(xué),2023.[17]龔浩.基于空間自相關(guān)和SARIMA-BPNN組合模型的我國肺結(jié)核時空分布特征及預(yù)測研究[D].揚(yáng)州大學(xué),2023.附錄附錄1種植戶產(chǎn)量影響因素問卷第一部分:個人基本信息收集,請選擇符合您個人情況的選項1.您的年齡是?[單選題]選項小計比例18-255317.49%26-3510735.31%36-457725.41%46-553812.54%56以上289.24%本題有效填寫人次3032.您種植桃樹的經(jīng)驗(yàn)有多少年?[單選題]選項小計比例1-3年7625.08%4-6年8628.38%7-10年7825.74%10年以上6320.79%本題有效填寫人次3033.您的種植規(guī)模是?[單選題]選項小計比例1-1000株6822.44%1001-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論