版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
畢業(yè)設(shè)計(論文)文獻綜述專業(yè)信息與計算科學班級學生姓名學號題目機器學習之線性回歸模型建模策略指導(dǎo)教師摘要機器學習是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域,也是人工智能和智能計算的核心研究課題之一?,F(xiàn)有的計算機系統(tǒng)和人工智能系統(tǒng)沒有什么學習能力,至多也只有非常有限的學習能力,因而不能滿足科技和生產(chǎn)提出的新要求。對機器學習的討論和機器學習研究的進展,必將促使人工智能和整個科學技術(shù)的進一步發(fā)展。本課題研究機器學習中比較基礎(chǔ)的線性回歸模型,以及誤差分析,并將這些算法在某些領(lǐng)域中進行應(yīng)用。AbstractMachinelearningisanotherimportantresearchfieldofartificialintelligenceapplicationafterexpertsystem,anditisalsooneofthecoreresearchtopicsofartificialintelligenceandintelligentcomputing.Existingcomputersystemsandartificialintelligencesystemsdonothavetheabilitytolearn,atmost,onlyverylimitedlearningability,andthuscannotmeetthenewrequirementsoftechnologyandproduction.Thediscussionofmachinelearningandtheprogressofmachinelearningresearchwillsurelypromotethefurtherdevelopmentofartificialintelligenceandthewholescienceandtechnology.Thispaperstudiesthelinearregressionmodelinmachinelearning,andtheerroranalysis,andappliesthesealgorithmsinsomefields.第一章引言機器學習是關(guān)于理解與研究學習的內(nèi)在機制、建立能夠通過學習自動提高自身水平的計算機程序的理論方法的學科。近年來機器學習理論在諸多應(yīng)用領(lǐng)域得到成功的應(yīng)用與發(fā)展,已成為計算機科學的基礎(chǔ)及熱點之一。機器學習已經(jīng)有了十分廣泛的應(yīng)用例如搜索引擎、醫(yī)學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰(zhàn)略游戲和機器人運用。
第二章基本概念2.1機器學習的概念什么叫做機器學習(machinelearning)?至今,還沒有統(tǒng)一的“機器學習”定義,而且也很難給出一個公認的和準確的定義。為了便于進行討論和估計學科的進展,有必要對機器學習給出定義,即使這種定義是不完全的和不充分的。顧名思義,機器學習是研究如何使用機器來模擬人類學習活動的一門學科。稍為嚴格的提法是:機器學習是一門研究機器獲取新知識和新技能,并識別現(xiàn)有知識的學問。這里所說的“機器”,指的就是計算機;現(xiàn)在是電子計算機,以后還可能是中子計算機、光子計算機或神經(jīng)計算機等等。2.2線性回歸的概念線性回歸是利用數(shù)理統(tǒng)計中的回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法,運用十分廣泛。分析按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。在統(tǒng)計學中,線性回歸(LinearRegression)是利用稱為線性回歸方程的最小平方函數(shù)對一個或多個自變量和因變量之間關(guān)系進行建模的一種回歸分析。這種函數(shù)是一個或多個稱為回歸系數(shù)的模型參數(shù)的線性組合。只有一個自變量的情況稱為簡單回歸,大于一個自變量情況的叫做多元回歸。(這反過來又應(yīng)當由多個相關(guān)的因變量預(yù)測的多元線性回歸區(qū)別,而不是一個單一的標量變量。)回歸分析中,只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。2.3線性回歸的建模在線性回歸中,數(shù)據(jù)使用線性預(yù)測函數(shù)來建模,并且未知的模型參數(shù)也是通過數(shù)據(jù)來估計。這些模型被叫做線性模型。最常用的線性回歸建模是給定X值的y的條件均值是X的仿射函數(shù)。不太一般的情況,線性回歸模型可以是一個中位數(shù)或一些其他的給定X的條件下y的條件分布的分位數(shù)作為X的線性函數(shù)表示。像所有形式的回歸分析一樣,線性回歸也把焦點放在給定X值的y的條件概率分布,而不是X和y的聯(lián)合概率分布(多元分析領(lǐng)域)。線性回歸是回歸分析中第一種經(jīng)過嚴格研究并在實際應(yīng)用中廣泛使用的類型。這是因為線性依賴于其未知參數(shù)的模型比非線性依賴于其位置參數(shù)的模型更容易擬合,而且產(chǎn)生的估計的統(tǒng)計特性也更容易確定。2.4線性回歸的用途線性回歸有很多實際用途。分為以下兩大類:如果目標是預(yù)測或者映射,線性回歸可以用來對觀測數(shù)據(jù)集的和X的值擬合出一個預(yù)測模型。當完成這樣一個模型以后,對于一個新增的X值,在沒有給定與它相配對的y的情況下,可以用這個擬合過的模型預(yù)測出一個y值。給定一個變量y和一些變量X1,...,Xp,這些變量有可能與y相關(guān),線性回歸分析可以用來量化y與Xj之間相關(guān)性的強度,評估出與y不相關(guān)的Xj,并識別出哪些Xj的子集包含了關(guān)于y的冗余信息。線性回歸模型經(jīng)常用最小二乘逼近來擬合,但他們也可能用別的方法來擬合,比如用最小化“擬合缺陷”在一些其他規(guī)范里(比如最小絕對誤差回歸),或者在橋回歸中最小化最小二乘損失函數(shù)的懲罰.相反,最小二乘逼近可以用來擬合那些非線性的模型.因此,盡管“最小二乘法”和“線性模型”是緊密相連的,但他們是不能劃等號的。第三章研究背景及意義3.1研究背景及意義全球生態(tài)系統(tǒng)種類豐富,干旱地區(qū)是其中不可或缺的種類,也是當今全世界各國開發(fā)相對較晚的區(qū)域。因此,為了解決干旱區(qū)當前面臨的重要環(huán)境問題,以及防范于未然的科學決策,積極開展干旱區(qū)的生態(tài)學理論與實踐研究勢在必行,并且具有極其重要的現(xiàn)實意義。西北干旱區(qū)是我們國家三大自然區(qū)域之一,其具有規(guī)模大、高強度開發(fā)歷史短的特點,因此,與其他的自然區(qū)域相比較而言,西北干旱區(qū)境內(nèi)蘊藏了龐大的尚未開發(fā)的自然資源,使其成為我國未來經(jīng)濟建設(shè)中必須得重視的一個環(huán)節(jié),同時也具有著時代賦予的重大歷史使命[1]。所以,我們要盡可能多的去開展干旱地區(qū)的生態(tài)研究,深化課題深度與廣度,在拉動經(jīng)濟發(fā)展的同時,也要注重當?shù)氐纳鷳B(tài)環(huán)境保護工作的開展。荒漠地區(qū)具備典型的溫帶荒漠特點,同時也屬于相對脆弱的干旱生態(tài)系統(tǒng),條件惡劣,生態(tài)環(huán)境差,嚙齒動物憑借其種類多、繁衍快、個頭小等多方面優(yōu)勢,成為荒漠生態(tài)系統(tǒng)中不可或缺的一部分,是食物鏈中必不可少的消費者這一環(huán)節(jié),對于荒漠地區(qū)的保護和利用來說,具有不可代替的作用。干擾可以改變生態(tài)系統(tǒng)中各類資源的自主分配以及導(dǎo)致重組生態(tài)結(jié)構(gòu),很多生態(tài)物種的繁衍與人們的干擾有關(guān),人為的干擾越大,可能引起的破壞性就越大[2],導(dǎo)致環(huán)境異質(zhì)化。因此,本文主要就是分析西北干旱地區(qū),在過牧和輪牧干擾下,嚙齒動物生物量與植物因子之間的線性關(guān)系,通過給定的植物因子數(shù)據(jù)來預(yù)測嚙齒動物的生物量。機器學習是學習和理解內(nèi)在機制的重要機制,為計算機程序建立理論方法,可以通過自主學習提高計算水平。近年來,機器學習理論在許多應(yīng)用中得到了成功應(yīng)用和開發(fā),逐漸成為計算機科學的基礎(chǔ)之一[3]。機器學習有廣泛的應(yīng)用,如醫(yī)學診斷,搜索引擎,語音和手寫識別,信用卡欺詐檢測,DNA測序,證券市場分析,機器人和戰(zhàn)略游戲使用?;哪畢^(qū)植物因子與動物生物量這些數(shù)據(jù)龐大,人工不方便去處理如此繁雜的數(shù)據(jù),而機器學習在處理大數(shù)據(jù)方面占據(jù)著絕對的優(yōu)勢。所以依據(jù)提供的數(shù)據(jù),通過機器學習來建立數(shù)學模型,剖析荒漠區(qū)不同干擾下植物地上生物量同嚙齒動物生物量的線性關(guān)系[2],并揭示不同干擾下植物生物量與嚙齒動物生物量之間的變化趨勢,通過這些趨勢進行合理的環(huán)境保護。3.2國內(nèi)外研究現(xiàn)狀3.2.1國外研究現(xiàn)狀二十世紀時生態(tài)學已經(jīng)進入了發(fā)展階段,1903年美國年輕學者達文波特首先開展了對動物群落生態(tài)學的研究,但在其后直到五、六十年代,動物群落生態(tài)學仍把種群之間的數(shù)量變動問題作為研究重心,可是科學界對動物群落的研究力度不夠[4]。20世紀70年代和80年代,外國動物社區(qū)的生態(tài)學取得了一些進展[5],特別是在20世紀90年代初,美國生態(tài)學會提出了一個持續(xù)的生物圈計劃,并在其周圍進行了大量的動物生態(tài)研究[6]。例如:Brown(1977),Rosen-zweig(1969)研究了北美和美國西北部沙漠地區(qū)嚙齒動物群落多樣性與植物多樣性與降水之間的關(guān)系。Hallett(1982)應(yīng)用多種分析方法研究沙漠地區(qū)小型哺乳動物的物種競爭和棲息地利用,并認為這些問題在嚙齒動物物種的分布中起重要作用。Bowles(1982)采用統(tǒng)計學方法來確定沙漠地區(qū)嚙齒動物群落的共存狀態(tài)和個體大小之間的關(guān)系。他認為,個別小物種在一小部分棲息地中受到種間競爭。歐文(1988)利用iltmalns模型研究了嚙齒動物和食肉動物的多樣性和低生產(chǎn)率,生產(chǎn)率降低時,其多樣性得到改善[6]。Brown(1985)研究了增加的食物和物種遷移對社區(qū)結(jié)構(gòu)的影響。限制食物資源和種間競爭是影響沙漠地區(qū)嚙齒動物社區(qū)的主要因素之一。Borund(1989)研究了沙漠地區(qū)嚙齒動物和物種的共存機制,提出了兩個機制:環(huán)境選擇和食物效率的季節(jié)變化。Ktoler(1948)研究了沙漠地區(qū)嚙齒動物群落的結(jié)構(gòu),并認為嚙齒動物群落處于掠奪或資源的風險。當棲息地捕食風險不同時,捕食可以形成獵物社區(qū)結(jié)構(gòu),捕食者逃避風險棲息地專業(yè)化減少種間競爭,促進不同人群的共存。嚙齒動物繼承研究是社區(qū)生態(tài)研究的內(nèi)容之一,其理論與實踐研究對生態(tài)研究具有重要意義,防治嚙齒動物和嚙齒動物的防治也很重要。1.2.2國內(nèi)研究現(xiàn)狀近年來,中國生態(tài)工作者對干旱區(qū)嚙齒動物群落進行了大量的基礎(chǔ)研究,包括物種組成,結(jié)構(gòu),動植物,均勻度,相對豐度,物種多樣性,分布群體,相似系數(shù),利基,社區(qū)優(yōu)勢等等。比如著名學者周慶強(1982)研究了中國內(nèi)蒙古白銀溪萊典型草原的嚙齒動物群落的多樣性,空間布局和結(jié)構(gòu)[7]。在本文中,研究了高寒草甸地區(qū)幼蟲的多樣性。劉乃發(fā)(1990),吳曉東(1994)利用數(shù)學模型研究了干旱區(qū)嚙齒動物群落結(jié)構(gòu)與環(huán)境的關(guān)系。多樣性和植物高度和覆蓋面,土壤和降水。阿布里米提(1991)研究了新疆干旱區(qū)嚙齒動物群落結(jié)構(gòu)特征與干旱地區(qū)環(huán)境因素之間的關(guān)系曾宗勇(1994)研究了北美沙漠嚙齒動物群落變化與物種多樣性等特征的關(guān)系。從營養(yǎng),空間和利基的角度來看,社區(qū)中種間關(guān)系的重要組成部分是競爭在有限的營養(yǎng),時間和空間。競爭導(dǎo)致時間或空間位置的一些分離,一些只是部分分離,有些還沒有分離。近年來,生態(tài)學家對城市和農(nóng)田嚙齒動物群落的繼承進行了研究,但對早期干旱地區(qū)嚙齒類動物群落繼承的研究較少。只有劉繼科(1979)研究了農(nóng)田嚙齒動物群落繼代和生物量變化[7]。郭聰(1992)研究了農(nóng)村嚙齒動物群落的繼承趨勢及其在洞庭丘陵平原的繼承。丁平(1992)研究了人口遷移與養(yǎng)殖小野獸群體的關(guān)系,并討論了小型哺乳動物群落和養(yǎng)殖小野獸群落的遷移與傳播之間的關(guān)系[5]。在荒漠地區(qū)的嚙齒動物社區(qū)演變,只有張大明(1992)的部分研究工作。1.2.3干旱地區(qū)嚙齒動物群落的發(fā)展方向和趨勢科學研究的發(fā)展周期是從定性研究到定量研究。近年來,生態(tài)學研究表明,嚙齒動物種群生態(tài)學研究成功運用了數(shù)學模型,使嚙齒動物的種群生態(tài)越來越客觀越來越準確,促進了嚙齒動物種群生態(tài)成熟發(fā)育。而嚙齒動物社區(qū)生態(tài)晚期的演變,對理論和方法的了解還不成熟。但隨著動物群落生態(tài)學的發(fā)展,我們的生態(tài)學家將從定性描述到準確定量研究,進一步研究嚙齒動物群落生態(tài)學的研究,促進嚙齒動物群落生態(tài)學的成熟與發(fā)展。諸如feger(1957),梁忠禹(1964),楊春文(1991),米靜川(1990,1993)利用計算機技術(shù)和數(shù)學原理研究干旱地區(qū)嚙齒動物群落的結(jié)構(gòu)和多樣性。劉乃法(1994)采用統(tǒng)計學方法,通過電子計算機研究了沙漠地區(qū)嚙齒動物群落結(jié)構(gòu)與環(huán)境因素的關(guān)系。隨著科學的發(fā)展,電腦廣泛應(yīng)用于生態(tài)研究。我們的生態(tài)工作者還使用電腦通過多變量分析中的聚類分析和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 證券行業(yè)2025年三季報總結(jié):泛自營能力決定分化各項業(yè)務(wù)全面回暖
- 2025年南京市衛(wèi)生健康委員會、南京市機關(guān)事務(wù)管理局部分事業(yè)單位公開招聘衛(wèi)技人員備考題庫及完整答案詳解1套
- 2025貴州省重點產(chǎn)業(yè)人才“蓄水池”第四批崗位專項簡化程序公開招聘32人筆試重點題庫及答案解析
- 2025年福建海峽銀行龍巖分行誠聘英才備考題庫及答案詳解參考
- 85%鍋爐課程設(shè)計
- 2025中國科學院上海硅酸鹽研究所壓電陶瓷材料與器件課題組招聘博士后備考核心試題附答案解析
- 2025年中國光大銀行光大理財社會招聘備考題庫及完整答案詳解1套
- 《CB 3525-1993船用液壓壓力控制閥基本參數(shù)和連接尺寸》專題研究報告解讀
- 2025年鄉(xiāng)村文化節(jié)五年品牌評估與文旅產(chǎn)業(yè)發(fā)展報告
- 中山市人民政府民眾街道辦事處2025年公開招聘合同制工作人員備考題庫及1套完整答案詳解
- 河北金融學院《數(shù)字邏輯》2023-2024學年第二學期期末試卷
- 《安全生產(chǎn)法規(guī)培訓》課件
- 刑法學知到智慧樹章節(jié)測試課后答案2024年秋上海財經(jīng)大學
- 2025屆河北省石家莊市普通高中學校畢業(yè)年級教學質(zhì)量摸底檢測英語試卷(含答案解析)
- 老年護理專科護士競聘案例
- 偉大的《紅樓夢》智慧樹知到期末考試答案章節(jié)答案2024年北京大學
- AQ2059-2016 磷石膏庫安全技術(shù)規(guī)程
- 噴涂車間操作工安全操作規(guī)程模版(三篇)
- 節(jié)水型小區(qū)總結(jié)匯報
- 一年級數(shù)學重疊問題練習題
- 事業(yè)單位專業(yè)技術(shù)人員崗位工資標準表
評論
0/150
提交評論