《人工智能導論:模型與算法》全套課件_第1頁
《人工智能導論:模型與算法》全套課件_第2頁
《人工智能導論:模型與算法》全套課件_第3頁
《人工智能導論:模型與算法》全套課件_第4頁
《人工智能導論:模型與算法》全套課件_第5頁
已閱讀5頁,還剩364頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

古代哲人對智能的思考智能發(fā)謀信能賞罰仁能服眾勇能果斷嚴能立威五德皆備,然后可以為大將孫武(約公元前545年—約公元前470年)知(通智)者不惑仁者不憂勇者不懼孔子(公元前551年―公元前479年)孟子公元前372年-公元前289年惻隱之心,仁之端也羞惡之心,義之端也辭讓之心,禮之端也是非之心,智之端也荀子的智能觀:《荀子.正名》知之在人者謂之知知覺:人所固有認識外界客觀事物本能,如視覺、聽覺和觸覺等能力知有所合謂之智智慧:知覺對外界事物的認知所以能之在人者為之能本能:人身上所具用來處置事物能力能有所合謂之能智能:對外界所產生的認知和決策

荀子

戰(zhàn)國末期趙國人

(約公元前313年-公元前238年)從感知、到理解、到認知、到決策與行動

計算的誕生結繩計數(shù)上古結繩而治,后世圣人易之以書契,百官以治,萬民以察?!吨芤住は缔o》《清明上河圖》中趙太丞家藥鋪柜中的算盤

計算的誕生:從可計算到不可計算20世紀初,人們發(fā)現(xiàn)有許多問題無法找到解決的方法。于是開始懷疑,是否對這些問題來說,根本就不存在算法,即不可計算。從費馬猜想到費馬定理

費馬(PierredeFermat):法國人,律師,業(yè)余數(shù)學家(1601-1665)1621年出版的《算數(shù)(DiophantiAlexandriniArithmeticorumLibriSex)》,大約在1637年費馬用拉丁文在本書右側空白寫下:篇幅不足難以寫下證明過程計算之力從何而來MathematicalProblems(23個數(shù)學問題)LecturedeliveredbeforetheInternationalCongressofMathematiciansatParisin1900工欲善其事,必先利其器:智能之器從何而來DavidHilbert(1862-1943)德國著名數(shù)學家

問題2:

證明算術公理的相容性(thecompatibilityofthearithmeticalaxioms)完備性:所有能夠從該形式化系統(tǒng)推導出來的命題,都可以從這個形式化系統(tǒng)推導出來。一致性:一個命題不可能同時為真或為假可判定性:算法在有限步內判定命題的真?zhèn)稳绾巫C明(計算)這一問題?可用怎樣的“計算載體”來實現(xiàn)?KurtFriedrichG?del(1906-1978)哥德爾不完全性定理(1931年)任何表達力足夠強的(遞歸可枚舉)形式系統(tǒng)都不可能同時具有一致性和完備性《論數(shù)學原理及有關系統(tǒng)中不可判定命題》(OnFormallyUndecidablePropositionsofPrincipiaMathematicaandRelatedSystems)工欲善其事,必先利其器:智能之器從何而來計算之力從何而來OnComputableNumbers,withanApplicationtotheEntscheidungsproblem,1937

《論數(shù)字計算在決斷難題中的應用》圖靈機模型計算“gcd(24,16)*10+17”示意AlanTuring(1912-1954)工欲善其事,必先利其器:智能之器從何而來“判定性問題”是無法解決的,即有些數(shù)學問題是不可求解的(圖靈不可停機的)計算之力從何而來人工智能:以機器為載體的人類智能或生物智能工欲善其事,必先利其器:智能之器從何而來圖靈論題:凡是可計算的函數(shù)都可以用圖靈機計算邱奇論題:任何計算,如果存在一個有效過程,它就能被圖靈機實現(xiàn)

邱奇-圖靈論題(Church–Turingthesis,computabilitythesis)計算載體提出學者計算角度原始遞歸函數(shù)哥德爾Godel數(shù)學的形式丘奇Church數(shù)理邏輯的形式圖靈機圖靈Turing機械的形式圖靈獎:計算機界最高獎(1966年設立)AlanTuring(1912-1954)二戰(zhàn)提前五年結束的解碼器Enigma圖靈機模型使得人類得以邁入自動計算時代對智能的測試:圖靈測試摩爾定律支撐自動計算時代快速發(fā)展:

摩爾定律(計算機速度1年半增長1倍),億級晶體管、千億指令/秒人工智能的誕生ResearchProjectonArtificialIntelligence,August31,1955,

Dartmouth當年提出AI概念的建議書AI概念提出50年后,建議人合影四位學者在1955年提出了人工智能這一術語及研究范疇JohnMcCarthy(時任Dartmouth數(shù)學系助理教授,1971年度圖靈獎獲得者)MarvinLeeMinsky(時任哈佛大學數(shù)學系和神經學系JuniorFellow,1969年度圖靈獎獲得者)ClaudeShannon(BellLab,信息理論之父)NathanielRochester(IBM,第一代通用計算機701主設計師)讓機器能像人那樣認知、思考和學習,即用計算機模擬人的智能。人工智能的誕生達特茅斯會議合影(1956年)報告列舉了ArtificialIntelligence值得關注七個問題

AutomaticComputersHowCanaComputerbeProgrammedtoUseaLanguageNeuronNetsTheoryoftheSizeofaCalculationSelf-improvement:自我學習與提高Abstractions:歸納與演繹RandomnessandCreativity

人工智能(ArtificialIntelligence)是以機器為載體所展示的人類智能,因此人工智能也被稱為機器智能(MachineIntelligence)計算機課程體系的歷史發(fā)展:從EE到CSTheTechnischeUniversit?tDarmstadt(德國達姆施塔特工業(yè)大學)

foundedtheworld'sfirstdepartmentofelectricalengineeringin1882.In1885,thefirstDepartmentofElectricalEngineeringatCornellandthefirstDepartmentofElectricalinUniversityCollegeLondon.The

firstDepartment

of

ComputerSciences

intheUnitedStateswasestablishedat

Purdue

UniversityinOctober1962.

M.S.andPh.D.programsinComputerSciencestarted.FreshmenDeclaringComputerScienceastheirMajorfrom1969-1995at

Purdue

UniversityEdsgerW.Dijkstra,CommunicationwithanAutomaticComputer,PhDthesis,UniversityofAmsterdam,1959.1957年,Dijkstra結婚時填報職業(yè)信息時,其填寫programmer。但是,官方拒絕這一表述,因為荷蘭在那個時候沒有這個職業(yè)。Thefirst

Ph.D.sinComputerScienceinUnitedStates?ThefirstPh.D.sdesignatedas"ComputerScience"wereawardedbytheUniversityofPennsylvania:RichardWexelblat(December,1965),AndriesvanDam(May,1966).Inmay1965,SisterMaryKennethKelleristhefirstwomantoearnaPh.D.theComputerSciencesDepartmentattheUniversityofWisconsin(thesistitle:InductiveInferenceonComputerGeneratedPatterns)andatthesamedayIrvingC.TangearnedaD.Sc.fromtheAppliedMathematicsandComputerScienceDepartmentatWashingtonUniversityinSt.Louis.計算機課程體系的歷史發(fā)展:從EE到CS為了規(guī)范計算機課程的教學,美國計算機學會(AssociationforComputingMachinery,ACM)于1968年和1978年發(fā)布了計算機科學(ComputerScience,CS)教程體系Curriculum68和Curriculum78。

Curriculum68Curriculum78

ComputerscienceMathComputerscienceMath

基礎核心課程計算導論、計算機和程序設計、離散數(shù)學、數(shù)值計算微積分、數(shù)學分析、線性代數(shù)程序設計1、程序設計2;計算機體系、計算機結構組成、計算機文件系統(tǒng)與處理

微積分、數(shù)學分析、線性代數(shù)、概率論、離散結構(與邏輯推理有關)中間連接課程數(shù)據結構、Prolog語言、計算機組成、系統(tǒng)編程、電路交換理論、數(shù)值分析等概率論數(shù)學分析II、概率與統(tǒng)計計算機課程體系的演變計算機課程體系的演變人工智能內容在早期計算機課程體系中已經出現(xiàn),如1968年中“A9AI,heuristicprogramming”和1978年中“CS12AI”。

Curriculum68Curriculum78

ComputerscienceMathComputerscienceMath

前沿課程formallanguages(形式化語言);advancedcomputerorganization(先進計算機結構);analogandhybridcomputing(模擬與混合計算);systemssimulation(系統(tǒng)仿真);informationretrieval(信息檢索);computergraphics(計算機圖形學);

theoryofcomputability(可計算理論);large-scaleinformationsystems(大型信息系統(tǒng));

AI,heuristicprogramming(人工智能與啟發(fā)式規(guī)劃)

adv.Calculus(高級微積分)*;alg.Structures(算法結構)*;probability&staistics(概率論與統(tǒng)計)*computersandsociety(計算機與社會);OSandcomputerarchitectureII(操作系統(tǒng)與計算機體系結構);databasemanagementsystems(數(shù)據庫管理系統(tǒng));AI(人工智能);algorithms(算法);softwaredesign(軟件設計);programminglanguagetheory(編程語言理論);automata.Languages,computability(自動機、語言和可計算理論);numericalanalysis(數(shù)值分析);numericalmath(數(shù)值計算):linearalgebra(線性代數(shù))CS17numericalmath:analysisCS18numericalmath:linearalgebra*twoeachofCSandmathrequired

計算機課程體系的演變1985年,ACM和IEEE計算機協(xié)會(IEEE-CS)聯(lián)合成立了一個工作組,來制定計算機課程體系,這個工作組認為計算機專業(yè)是研究信息描述和轉換的系統(tǒng)性算法過程,包括理論、分析、設計、效率、執(zhí)行和應用。同時,工作組提出計算科學的根本問題是,“什么可以(有效地)自動化?(whatcanbeefficientlyautomated)”。1991年,這個工作組發(fā)布了計算機課程體系computingcurricula1991。SubjectArea(11個知識領域)TagAlgorithmsandDataStructures(算法與數(shù)據結構)ALArchitecture(計算機體系)ARArtificialIntelligenceandRobotics(人工智能與機器人)AIDatabaseandInformationRetrieval(數(shù)據庫和信息檢索)DBHuman-ComputerCommunication(人機交互)HUNumericalandSymbolicComputation(數(shù)字和符號計算)NUOperatingSystems(操作系統(tǒng))OSProgrammingLanguages(編程語言)PLIntroductiontoaProgrammingLanguage(optional)(編程語言導論)PRSoftwareMethodologyandEngineering(軟件方法學和工程)SESocial,Ethical,andProfessionalIssues(社會、倫理和專業(yè)實踐)SPACM和IEEE-CS發(fā)布的1991版計算機課程體系計算機課程體系分為11個知識領域,其中將人工智能內容單列為“ArtificialIntelligenceandRobotics(AI)。計算機課程體系的演變2001年,ACM和IEEE-CS聯(lián)合工作組發(fā)布了計算機課程體系ComputingCurricula2001。ComputingCurricula2001將計算機課程體系分為14個知識領域,其中將人工智能內容單列為“IntelligentSystem(AI)。AI的相關內容被分為13個分支,分別為智能系統(tǒng)基礎、搜索與優(yōu)化、知識表達和推理、學習、智能體、計算機視覺、自然語言處理、模式識別、先進機器學習、機器人、知識系統(tǒng)、神經網絡和遺傳算法。Discretestructures

(離散數(shù)學,DS)

IS1:Fundamentalissuesinintelligentsystems(智能系統(tǒng)基礎)Human-ComputerInteraction(人機交互,HC)IS2:Searchandoptimizationmethods(搜索與優(yōu)化)ProgrammingFundamentals(編程基礎,PF)IS3:Knowledgerepresentationandreasoning(知識表達和推理)GraphicsandVisualComputing(圖形學與可視計算,GV)AlgorithmsandComplexity(算法與復雜性,AL)IS4:Learning(學習)IS5:Agents(智能體)IntelligentSystems(智能系統(tǒng),IS)IS6:Computervision(計算機視覺)ArchitectureandOrganization(體系與組織,AR)

IS7:Naturallanguageprocessing(自然語言處理)InformationManagement(信息管理,IM)IS8:Patternrecognition(模式識別)OperatingSystems(操作系統(tǒng),OS)IS9:Advancedmachinelearning(先進機器學習)SocialandProfessionalIssues(社會問題與專業(yè)實踐,SP)IS10:Robotics(機器人)Net-CentricComputing(網絡計算,NC)IS11:Knowledge-basedsystems(知識系統(tǒng))SoftwareEngineering(軟件工程,SE)IS12:Neuralnetworks(神經網絡)ProgrammingLanguages(編程語言,PL)IS13:Geneticalgorithms(遺傳算法)ComputationalScience(計算科學,CN)14個知識領域AI的13個分支計算機課程體系的演變2013年,ACM和IEEE-CS聯(lián)合工作組發(fā)布了計算機課程體系ComputingCurricula2013。在ComputingCurricula2013中,計算機課程體系被稱為為一個“大篷”(bigtent),其知識領域被拓展為18個。在這個課程體系中,人工智能“IntelligentSystem(AI)”相關內容被分為12個分支。AL-AlgorithmsandComplexity(算法與復雜度)

Fundamentalissues(智能基本問題)AR-ArchitectureandOrganization

(計算機結構體系與組織)CN-ComputationalScience(計算科學)BasicSearchStrategies(搜索策略基礎)DS-DiscreteStructures(離散數(shù)學)BasicKnowledgeBasedReasoning(知識表示和推理基礎)GV-GraphicsandVisualization(圖形與可視化)HCI-Human-ComputerInteraction(人機交互)BasicMachineLearning(機器學習基礎)IAS-InformationAssuranceandSecurity(信息保障與安全)IM-InformationManagement(信息管理)AdvancedSearch(高級搜索)IS-IntelligentSystems(智能系統(tǒng))AdvancedRepresentationandReasoning(高級知識表達和推理)

NC-NetworkingandCommunications(網絡與通訊)

ReasoningUnderUncertainty(不確定下推理)OS-OperatingSystems(操作系統(tǒng))PDB-Platform-basedDevelopment(基于平臺的開發(fā))Agents(智能體)PD-ParallelandDistributedComputing(并行與分布式計算)NaturalLanguageProcessing(自然語言處理)PL-Programminglanguages(程序設計語言)SDF-SoftwareDevelopmentFundamentals(軟件開發(fā)基本原理)

AdvancedMachineLearning(高級機器學習)SE-softwareEngineering(軟件工程)SF-SystemsFundamental(系統(tǒng)基本原理)Robotics(機器人)SP-SocialIssuesandProfessionalPractice(社會問題與專業(yè)實踐)PerceptionandComputerVision(感知與機器視覺)18個知識領域AI的12個分支計算機課程體系的演變從2008年和2013年計算機課程體系可以看出:計算機課程體系這個“大篷”隨時間不斷擴展,如基于平臺的開發(fā)、并行與分布式計算、系統(tǒng)基本原理等是2013年中新增加內容。人工智能知識點逐漸變得明晰,在2013年計算機課程體系中明確指出人工智能是一門研究難以通過傳統(tǒng)方法去解決實際問題的學問之道,其通過非傳統(tǒng)方法解決問題需要利用常識或領域知識的表達機制、解決問題的能力以及學習技巧。為此,需要研究感知(如語音識別、自然語言理解、計算機視覺)、問題求解(如搜索和規(guī)劃)、行動(如機器人)以及支持任務完成的體系架構(如智能體和多智能體)。從1968年計算機課程體系到2013年計算機課程體系可看出,人工智能知識體系的著重點走過了從強調程序設計(programming)、到算法研究(model)以及功能實現(xiàn)(function)的不同歷史階段。匯報提綱二、課程內容概要一、人工智能歷史與課程體系中國人工智能人才培養(yǎng)載體人才培養(yǎng)載體設置情況人工智能交叉學科目前浙江大學、武漢大學和華中科技大學三所高校設立了人工智能交叉學科人工智能本科專業(yè)目前215所高校設立了人工智能本科專業(yè)世界一流大學建設36所高校(A類)中有28所高校開設了人工智能本科專業(yè)世界一流大學建設6所高校(B類)中有1所高校開設了人工智能本科專業(yè)世界一流學科建設95所高校中有34所高校開設了人工智能本科專業(yè)中國邁向新一代人工智能,自然子刊《機器智能》,2020,312–316中國邁向新一代人工智能的挑戰(zhàn)和機遇培育本土人工智能人才規(guī)范人工智能倫理培育人工智能生態(tài)(AIEcosystem)潘云鶴院士擔任編委會主任,鄭南寧院士、高文院士、吳澄院士、陳純院士和林金安副總編輯擔任編委會副主任委員新一代人工智能系列教材特點:權威一流的編委會;來自科研教學一線、朝氣勃勃的作者團隊;緊扣前沿、富有時代特色的系列教材內容。以教材建設為核心的人才培養(yǎng):新一代人工智能系列教材潘云鶴院士為系列教材撰寫的序言:具有中國特色的人工智能一流教材體系:人工智能基礎理論、算法模型、技術系統(tǒng)、硬件芯片和倫理安全以及“智能+”學科交叉等方面內容,在線開放共享課程,各具優(yōu)勢、銜接前沿、涵蓋完整、交叉融合。希望“新一代人工智能系列教材”的出版能夠為人工智能各類型人才培養(yǎng)做出應有貢獻。以教材建設為核心的人才培養(yǎng):新一代人工智能系列教材(19本)教材名主編出版時間人工智能導論:模型與算法(978-7-04-053466-5)吳飛2020年5月可視化導論(978-7-04-052182-5)陳為、張嵩、魯愛東、趙燁智能產品設計孫凌云自然語言處理劉挺、秦兵、趙軍、黃萱菁、車萬翔2020年模式識別周杰、郭振華、張林2020年自主智能運動系統(tǒng)薛建儒2020年人臉圖像合成與識別高新波、王楠楠2020年機器感知黃鐵軍2020年人工智能芯片與系統(tǒng)王則可、李璽、李英明2020年物聯(lián)網安全徐文淵2020年教材名主編出版時間神經認知學唐華錦

潘綱2021年人工智能倫理與安全秦湛、潘恩榮、任奎2021年金融科技概論鄭小林2021年媒體計算韓亞洪2021年人工智能邏輯廖備水2021年人工智能生物醫(yī)學信息處理沈紅斌2021年數(shù)字不經濟:人工智能與區(qū)塊鏈吳超2021年人工智能倫理古天龍2021年賦能:“人工智能+”數(shù)字經濟王延峰2021年從教材到課程建設:人工智能在線課程、微課程12多萬人選課第一期:2018.11.5-2019.1.11共有21109人選課https:///course/ZJU-1003377027

第二期2019.3.4-2019.6.3共有17238人選課人工智能概述搜索求解邏輯與推理統(tǒng)計機器學習深度學習強化學習人工智能博弈中國大學MOOC課程:人工智能:模型與算法第三期2019.9.23-2020.1.7共有18879人選課中國大學MOOC開設《人工智能:模型與算法》第四期2020.2.15-2020.6.9目前29191人選課人工智能基礎(數(shù)學方法、物理模型)

機器學習

知識表示與處理

機器視覺

自然語言處理

模式識別人工智能芯片與軟硬件智能系統(tǒng)與應用新型和交叉的人工智能仿生智能類腦機制人工智能安全基礎推動手段應用

生物、醫(yī)學、化學、材料、地學……復雜理論與系統(tǒng)國家自然科學基金委員會信息學部人工智能學科代碼提綱二、教材內容概要一、人工智能歷史與課程體系人工智能基本研究內容人工智能:以機器為載體實現(xiàn)的人類智能或生物智能從模擬人類智能角度而言,人工智能應具備如下能力:具備視覺感知和語言交流的能力。即能夠識別和理解外界信息(計算機視覺研究范疇)、能夠與人通過語言交流(自然語言理解研究范疇)。具備推理與問題求解能力。即基于已有知識,對所見事物和現(xiàn)象進行演繹推理以解決問題。具備協(xié)同控制能力。即將視覺(看)、語言(說)、推理(悟)等能力統(tǒng)一協(xié)調,加以控制,這是常見的機器人研究領域內容。知其意,悟其理,守其則,踐其行人工智能基本研究內容人工智能:以機器為載體實現(xiàn)的人類智能或生物智能從模擬人類智能角度而言,人工智能應具備如下能力:具備遵守倫理道德能力。即模擬人類智能的智能體在社會環(huán)境中要遵從一定的倫理道德。阿西莫夫在科幻小說中按照優(yōu)先級定義了機器人需要遵從的三條倫理原則:不得傷人,或棄人于危難;需服從人;在不違反上述兩條原則情況下,保護機器人自己。具備從數(shù)據中進行歸納總結的能力。即需要從數(shù)據中進行知識、規(guī)律和模式學習的模型和方法,這是機器學習研究范疇。知其意,悟其理,守其則,踐其行《人工智能導論:模型與算法》:第一章緒論可計算思想起源與發(fā)展人工智能的發(fā)展簡史人工智能研究的基本內容人工智能概述

“我們必須知道,我們必將知道”(大衛(wèi)希爾伯特,DavidHilbert)《人工智能導論:模型與算法》:第一章緒論手段與方法特點以符號主義為核心的邏輯推理將概念(如命題等)符號化,從若干判斷(前提)出發(fā)得到新判斷(結論)以問題求解為核心的探尋搜索探尋搜索依據已有信息來尋找滿足約束條件的待求解問題的答案以數(shù)據驅動為核心的機器學習從數(shù)據中發(fā)現(xiàn)數(shù)據所承載語義(如概念)的內在模式以行為主義為核心的強化學習根據環(huán)境所提供的獎罰反饋來學習所處狀態(tài)可施加的最佳行動,在“探索(未知空間)-利用(已有經驗)(explorationvs.exploitation)”之間尋找平衡,完成某個序列化任務,具備自我學習能力以博弈對抗為核心的群體智能(兩人及以上)從“數(shù)據擬合”優(yōu)化解的求取向“均衡解”的求取邁進這里的“擢”即抽引,表示從一個典型個別事例中抽引出一個一般命題(慮),這種歸納推理的方式不用懷疑,因為其理由或根據是“與典型事例同類的事物聯(lián)系是存在,還是不存在”邏輯與推理命題邏輯謂詞邏輯知識圖譜推理因果推理擢慮不疑,說在有無

《墨辨·經下》《人工智能導論:模型與算法》:第二章邏輯與推理啟發(fā)式搜索對抗搜索(Minimax及Alpha-Beta剪枝搜索)蒙特卡洛樹搜索搜索求解搜索算法通過模擬智能體的一系列動作,按照一定規(guī)則探索智能體的所有可能行動,直到找到一種滿足約束限制的解法,以此來指導智能體的行動。《人工智能導論:模型與算法》:第三章搜索求解故記誦者,學問之舟車也清章學誠《文史通義》化繁為簡、大巧不工RonaldAylmerFisher機器學習基本概念回歸分析、決策樹

線性判別分析、AdaBoosting支持向量機、生成學習模型統(tǒng)計機器學習監(jiān)督學習從標注數(shù)據到概念空間的映射《人工智能導論:模型與算法》:第四章機器學習:監(jiān)督學習物以類聚,人以群分《戰(zhàn)國策·齊策三》統(tǒng)計機器學習非監(jiān)督學習學習無標注數(shù)據的分布K均值聚類主成分分析特征人臉方法潛在語義分析期望極大算法(EM)《人工智能導論:模型與算法》基本內容:第五章統(tǒng)計機器學習:無監(jiān)督學習深度學習端到端學習數(shù)據的區(qū)別性表達前饋神經網絡(誤差后向傳播)卷積神經網絡循環(huán)神經網絡深度生成學習自然語言理解與視覺分析《人工智能導論:模型與算法》基本內容:第六章深度學習Neuronsthatfiretogether,wiretogether(DonaldHebb)強化學習強化學習定義基于價值的強化學習基于策略的強化學習深度強化學習的應用通過平衡“探索未知空間與利用已有經驗”(explorationvs.exploitation)”與環(huán)境進行交互,獲得回報,從而序貫地作出決策通過動作施加影響反饋環(huán)境狀態(tài)的變化智能主體環(huán)境動作的收益(reward)《人工智能導論:模型與算法》基本內容:第七章強化學習謀定而后動,知止而有得人工智能博弈博弈相關概念(納什均衡)博弈策略求解博弈規(guī)則設計非完全信息博弈的實際應用兩害相權取其輕,兩利相權取其重博弈行為是多個帶有相互競爭性質的主體,為了達到各自目標和利益,采取的帶有對抗性質的行為。現(xiàn)代博弈論主要研究博弈行為中最優(yōu)的對抗策略及其穩(wěn)定局勢,協(xié)助對弈者在一定規(guī)則范圍內尋求最合理的行為方式。《人工智能導論:模型與算法》基本內容:第八章人工智能博弈未來發(fā)展與趨勢類腦計算自動化機器學習神經網絡模型壓縮人工智能芯片量子機器學習人工智能倫理與治理人工智能算法開發(fā)框架凡是過往、皆為序章(莎士比亞)《人工智能導論:模型與算法》基本內容:第九章未來發(fā)展和趨勢“智?!毙乱淮斯ぶ悄芸平唐脚_將以人才培育、科技創(chuàng)新為使命,深度聚焦深度聚焦AI技術創(chuàng)新、AI人才培養(yǎng)與生態(tài)建設,匯聚國內外前沿技術和產業(yè)資源,聯(lián)動校、企、政力量,搭建開源、開放、互通的新一代人工智能生態(tài)體系,推動中國社會經濟的智能化建設。AI賦能、教育先行:“智海:新一代人工智能科教平臺”寓意:有智之能,方可驅動時代變革,有海之容,便可賦能萬物更新具能、使能和賦能吾生也有涯、而知也無涯2016驗證引力波、2017年獲得諾貝爾物理獎:一個13億年前的聲音經過漫長星際旅行終于抵達地球,被我們“聽到”了愛因斯坦于1918年在論文《論引力波(On

Gravitational

Waves)》預言了引力波存在人類智能與機器智能存在巨大不同人類大腦機器智能self-learninglearningbyexamples

adaptationroutinecommonsenseNointuitionlogic……見一葉落,而知歲之將暮;審堂下之陰,而知日月之行,陰陽之變;見瓶水之冰,而知天下之寒,魚鱉之藏也《淮南子說山訓》

大數(shù)據、小任務;小數(shù)據、大任務莫拉維克悖論(Moravec’sparadox):困難的問題是易解的,容易的問題是難解的使能技術、賦能社會:人工智能是引領這一輪科技革命、產業(yè)變革和社會發(fā)展的戰(zhàn)略性技術,具有溢出帶動性很強的頭雁效應,其作始也簡,其將畢也必巨致天下之治者在人才,成天下之才者在教化,教化之所本者在學校

邏輯與推理

《人工智能導論:模型與算法》提綱二、謂詞邏輯一、命題邏輯三、知識圖譜推理四、因果推理邏輯與推理是人工智能的核心問題邏輯是探索、闡述和確立有效推理原則的學科,提出了演繹推理中“三段論”方法的古希臘學者亞里士多德被譽為“邏輯學之父”。一般而言,邏輯是用數(shù)學方法來研究關于推理和證明等問題的研究。亞里士多德(Aristotle公元前384-前322,古代先哲、古希臘人)邏輯與推理是人工智能的核心問題墨翟(尊稱為墨子)被認為是東方邏輯學的奠基人。墨子提出了名、辭、說三種基本思維形式和由故、理、類三物構成的邏輯推理。墨子也提出了一些幾何思想,如“平,同高也(兩平行線或兩平行平面間距離處處相等)”、“

圓,一中同長也”。墨子(生卒年不詳,名翟(dí),東周春秋末期戰(zhàn)國初期宋國人)邏輯與推理是人工智能的核心問題人類思維活動一個重要功能是邏輯推理,即通過演繹和歸納等手段對現(xiàn)有觀測現(xiàn)象進行分析,得出判斷。在人工智能發(fā)展初期,脫胎于邏輯推理的符號主義人工智能(symbolicAI)是人工智能研究的一種主流學派。在符號主義人工智能中,所有概念均可通過人類可理解的“符號”及符號之間的關系來表示。例如:如果使用符號A來表示對象概念、IsCar()來表示某個對象是否為“汽車”,那么IsCar(A)表示“A是一輛轎車”這樣的概念。注意IsCar(A)由對象A和IsCar()兩部分所構成。如果A是轎車,則IsCar(A)為正確描述、否則為錯誤描述。符號主義人工智能方法基于如下假設:可通過邏輯方法來對符號及其關系進行計算,實現(xiàn)邏輯推理,辨析符號所描述內容是否正確。命題邏輯(PropositionalLogic)

命題邏輯(propositionlogic)是應用一套形式化規(guī)則對以符號表示的描述性陳述進行推理的系統(tǒng)。在命題邏輯中,一個或真或假的描述性陳述被稱為原子命題,對原子命題的內部結構不做任何解析。若干原子命題可通過邏輯運算符來構成復合命題。命題邏輯

命題邏輯

命題連接符號表示形式意義與(and)或(or)非(not)條件(conditional)雙向條件(bi-conditional)命題邏輯

通過真值表來計算復合命題的真假。FalseFalseTrueFalseFalseTrueTrueFalseTrueTrueFalseTrueTrueFalseTrueFalseFalseFalseTrueFalseFalseTrueTrueFalseTrueTrueTrueTrue命題邏輯

“條件”命題聯(lián)結詞中前提為假時命題真假取值

命題邏輯

命題邏輯

邏輯等價的例子命題邏輯:若干邏輯等價命題的解釋

命題邏輯中的推理規(guī)則假言推理(ModusPonens)與消解(And-Elimination)與導入(And-Introduction)命題邏輯中的推理規(guī)則雙重否定(Double-NegationElimination)單項消解或單項歸結(UnitResolution)消解或歸結(Resolution)應用歸結法進行證明(1)Knowledgebase

1231已知22進行蘊涵消除33進行蘊涵消除451和2進行歸結62和4進行歸結73和4進行歸結85和7進行歸結9應用歸結法進行證明(2)Knowledgebase證明如上命題集是不可滿足的12341已知2已知3已知4已知51和2進行歸結63和4進行歸結提綱二、謂詞邏輯一、命題邏輯三、知識圖譜推理四、因果推理從命題邏輯到謂詞邏輯

從命題邏輯到謂詞邏輯

個體的性質(是)、個體和個體之間的關系(最大)在謂詞邏輯中,將原子命題進一步細化,分解出個體、謂詞和量詞,來表達個體與總體的內在聯(lián)系和數(shù)量關系,這就是謂詞邏輯研究內容。謂詞邏輯中三個核心概念:個體、謂詞(predicate)和量詞(quantifier)謂詞邏輯

謂詞邏輯:謂詞與個體

謂詞邏輯:量詞謂詞邏輯:量詞

謂詞邏輯:量詞

謂詞邏輯:函數(shù)與謂詞的區(qū)別

謂詞邏輯:謂詞演算的合式公式

若干謂詞邏輯的推理規(guī)則

謂詞邏輯的推理例子

謂詞邏輯的推理例子

自然語言的形式化

自然語言的形式化

專家系統(tǒng)的構成對某個領域的自然語言、文本語句等信息進行邏輯化答案輸出數(shù)據知識服務推理機(專家系統(tǒng))問題邏輯化(機器可理解)提綱二、謂詞邏輯一、命題邏輯三、知識圖譜推理四、因果推理知識圖譜可視為包含多種關系的圖。在圖中,每個節(jié)點是一個實體(如人名、地名、事件和活動等),任意兩個節(jié)點之間的邊表示這兩個節(jié)點之間存在的關系。一般而言,可將知識圖譜中任意兩個相連節(jié)點及其連接邊表示成一個三元組(triplet),即(left_node,relation,right_node),例:(David,Father,Mike)。知識圖譜:基本概念知識圖譜推理知識圖譜中存在連線的兩個實體可表達為形如<left_node,relation,right_node>的三元組形式,這種三元組也可以表示為一階邏輯(firstorderlogic,FOL)的形式,從而為基于知識圖譜的推理創(chuàng)造了條件。例如從<奧巴馬,出生地,夏威夷>和<夏威夷,屬于,美國>兩個三元組,可推理得到<奧巴馬,國籍,美國>。一個簡單的家庭關系知識圖譜

一個簡單的家庭關系知識圖譜知識圖譜推理知識圖譜推理

一個簡單的家庭關系知識圖譜如果能夠學習得到這條規(guī)則,該有多好?(從具體例子中學習,這是歸納推理的范疇)

知識圖譜推理:歸納學習歸納邏輯程序設計(ILP)是機器學習和邏輯程序設計交叉領域的研究內容。ILP使用一階謂詞邏輯進行知識表示,通過修改和擴充邏輯表達式對現(xiàn)有知識歸納,完成推理任務。作為ILP的代表性方法,F(xiàn)OIL(FirstOrderInductiveLearner)通過序貫覆蓋實現(xiàn)規(guī)則推理。歸納邏輯程序設計(inductivelogicprogramming,ILP)算法知識圖譜推理:FOIL(FirstOrderInductiveLearner)

目標謂詞(已知)前提約束謂詞(學習得到)

一個簡單的家庭關系知識圖譜

知識圖譜推理:FOIL(FirstOrderInductiveLearner)一個簡單的家庭關系知識圖譜

知識圖譜推理:FOIL(FirstOrderInductiveLearner)

目標謂詞(已知)前提約束謂詞(學習得到)

知識圖譜推理:FOIL(FirstOrderInductiveLearner)

目標謂詞(已知)前提約束謂詞(學習得到)哪些謂詞好呢?可以作為目標謂詞的前提約束謂詞?

FOIL中信息增益值(informationgain)知識圖譜推理:FOIL(FirstOrderInductiveLearner)

目標謂詞(已知)前提約束謂詞(學習得到)依次將謂詞加入到推理規(guī)則中作為前提約束謂詞,并計算所得到新推理規(guī)則的FOIL增益值?;谟嬎闼肍OIL增益值來選擇最佳前提約束謂詞。

知識圖譜推理:FOIL(FirstOrderInductiveLearner)

目標謂詞(已知)前提約束謂詞(學習得到)背景知識樣例集合目標謂詞訓練樣例集合知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值目標謂詞前提約束謂詞正例反例信息增益值空集NANANANANA0.32NANANANANA0.74NA1.32NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值目標謂詞前提約束謂詞正例反例信息增益值空集NANANANANA0.32NANANANANA0.74NA1.32NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值目標謂詞前提約束謂詞正例反例信息增益值空集NANANANANA0.32NANANANANA0.74NA1.32NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值目標謂詞前提約束謂詞正例反例信息增益值空集NANANANANA0.32NANANANANA0.74NA1.32NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值目標謂詞前提約束謂詞正例反例信息增益值空集NANANANANA0.32NANANANANA0.74NA1.32NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值目標謂詞前提約束謂詞正例反例信息增益值空集NANANANANA0.32NANANANANA0.74NA1.32NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)

Back-groundknowledgePositiveandnegativesamples知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值現(xiàn)有規(guī)則擬加入前提約束謂詞正例反例信息增益值1.32NANANANANA1NANANANANANANA0NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)推理規(guī)則推理規(guī)則涵蓋的正例和反例數(shù)FOIL信息增益值現(xiàn)有規(guī)則擬加入前提約束謂詞正例反例信息增益值1.32NANANANANA1NANANANANANANA0NANANANA

知識圖譜推理:FOIL(FirstOrderInductiveLearner)

目標謂詞(已知)前提約束謂詞(學習得到)

背景知識樣例集合目標謂詞訓練樣例集合給定目標謂詞,F(xiàn)OIL算法從實例(正例、反例、背景樣例)出發(fā),不斷測試所得到推理規(guī)則是否還包含反例,一旦不包含負例,則學習結束,展示了“歸納學習”能力。知識圖譜推理:FOIL(FirstOrderInductiveLearner)知識圖譜推理:FOIL(FirstOrderInductiveLearner)給定目標謂詞,F(xiàn)OIL算法從實例(正例、反例、背景知識樣例)出發(fā),不斷測試所得推理規(guī)則是否還包含反例,一旦不包含,則學習結束,由此充分展示了“歸納學習”的能力。在學得推理規(guī)則后,再給推理規(guī)則中的變量賦予具體例子,經過“演繹”得到新的知識提綱二、謂詞邏輯一、命題邏輯三、知識圖譜推理四、因果推理公雞打鳴與太陽升起“力,形之所以奮也”(墨經)從關聯(lián)到因果計算的可解釋:因果是現(xiàn)象加解釋,是一種人類文化,即人類在與自然的反復觀察、預報、檢驗中得到的很好考驗。因果推理(CausalInference):Simpson’sParadox(辛普森悖論)1973年伯克利本科生錄取率PeterJ.Bickel,EugeneA.Hammel,O’Connell,J.W,Sexbiasingraduateadmissions:DatafromBerkeley,Science,187(4175):398-404,1975男生女生申請數(shù)錄取率申請數(shù)錄取率整體844244%432135%學院男生女生申請數(shù)錄取率申請數(shù)錄取率A82562%10882%B56063%2568%C32537%59334%D41733%37535%E19128%39324%F3736%3417%男生錄取率(44%)遠高于女生(35%)六個最大的院系中,4個院系女生錄取率大于男生。如果按照這樣的分類,女生實際上比男生的錄取率還高一點點。女生更愿意申請那些競爭壓力很大的院系(比如英語系),但是男生卻更愿意申請那些相對容易進的院系(比如工程學系)。傳統(tǒng)以統(tǒng)計建模為核心的推理手段JudeaPearl,Causality:models,reasoning,andinference(secondedition),CambridgeUniversityPress,2009JudeaPearl,MadelynGlymour,NicholasP.Jewell,Causalinferenceinstatistics:aprimer,JohnWiley&Sons,2016DataInferenceQ(P)(AspectsofP)JointDistributionP購買了A商品的顧客是否會購買B商品(對A和B的聯(lián)合分布建模)Q

=P(B|A)“Theobjectofstatisticalmethodsisthereductionofdata”(Fisher1922).因果推理(CausalInference):Simpson’sParadox(辛普森悖論)從統(tǒng)計建模推斷到因果推理DataQ(P′)(AspectsofP′)changeJointDistribution

PJointDistribution

P′Inference如果商品價格漲價一倍,預測銷售量P′(sales)的變化如果放棄吸煙,預測癌癥P′(cancer)的概率數(shù)據分布從P變換到P′因果推理(CausalInference):Simpson’sParadox(辛普森悖論)關聯(lián)(association):

直接可從數(shù)據中計算得到的統(tǒng)計相關

反事實(counterfactual):某個事情已經發(fā)生了,則在相同環(huán)境中,這個事情不發(fā)生會帶來怎樣的新結果

介入(intervention):無法直接從觀測數(shù)據就能得到關系,如“某個商品漲價會產生什么結果”可觀測性問題WhatifweseeA(whatis?)決策行動問題WhatifwedoA(whatif?)反事實問題(Counterfactual)WhatifwedidthingsdifferentlyOptions:withwhatprobability從關聯(lián)到推理:因果推理搜索與求解

《人工智能導論:模型與算法》提綱二、對抗搜索一、啟發(fā)搜索三、蒙特卡洛樹搜索人工智能中的搜索你見,或者不見我我就在那里不悲不喜

---扎西拉姆多多海量信息源問題求解器約束條件額外信息問題所對應答案搜索算法的形式化描述:

<狀態(tài)、動作、狀態(tài)轉移、路徑/代價、目標測試〉對智能體和環(huán)境當前情形的描述。例如,在最短路徑問題中,城市可作為狀態(tài)。將原問題對應的狀態(tài)稱為初始狀態(tài)。狀態(tài)從當前時刻所處狀態(tài)轉移到下一時刻所處狀態(tài)所進行操作。一般而言這些操作都是離散的。動作問題:尋找從城市A到城市K之間行駛時間最短路線?智能體選擇了一個動作之后,其所處狀態(tài)的相應變化狀態(tài)轉移一個狀態(tài)序列。該狀態(tài)序列被一系列操作所連接。如從A到K所形成的路徑。路徑/代價評估當前狀態(tài)是否為所求解的目標狀態(tài)。目標測試搜索算法的形式化描述:

<狀態(tài)、動作、狀態(tài)轉移、路徑/代價、目標測試〉問題:尋找從城市A到城市K之間行駛時間最短路線?在搜索的過程中利用與所求解問題相關的輔助信息,其代表算法為貪婪最佳優(yōu)先搜索(Greedybest-firstsearch)和A*搜索。

搜索算法:啟發(fā)式搜索(有信息搜索)問題:尋找從城市A到城市K之間行駛時間最短路線?

搜索算法:啟發(fā)式搜索(有信息搜索)輔助信息(啟發(fā)函數(shù)):任意一個城市與終點城市K之間的直線距離輔助信息所求解問題之外、與所求解問題相關的特定信息或知識評價函數(shù)(evaluationfunction)f(n)啟發(fā)函數(shù)(heuristicfunction)h(n)問題:尋找從城市A到城市K之間行駛時間最短路線?貪婪最佳優(yōu)先搜索(Greedybest-firstsearch):評價函數(shù)f(n)=啟發(fā)函數(shù)h(n)

搜索算法:貪婪最佳優(yōu)先搜索輔助信息(啟發(fā)函數(shù)):任意一個城市與終點城市K之間的直線距離問題:尋找從城市A到城市K之間行駛時間最短路線?貪婪最佳優(yōu)先搜索(Greedybest-firstsearch):評價函數(shù)f(n)=啟發(fā)函數(shù)h(n)

搜索算法:A*算法

輔助信息:任意一個城市與終點城市K之間的直線距離問題:尋找從城市A到城市K之間行駛時間最短路線?

搜索算法:A*算法輔助信息:任意一個城市與終點城市K之間的直線距離問題:尋找從城市A到城市K之間行駛時間最短路線?

提綱二、對抗搜索一、啟發(fā)搜索三、蒙特卡洛樹搜索對抗搜索對抗搜索(AdversarialSearch)也稱為博弈搜索(GameSearch)在一個競爭的環(huán)境中,智能體(agents)之間通過競爭實現(xiàn)相反的利益,一方最大化這個利益,另外一方最小化這個利益。狹路相逢勇者勝勇者相逢智者勝智者相逢德者勝德者相逢道者勝智能體目標對手最大化利益最小化利益對抗搜索最小最大搜索(MinimaxSearch):

最小最大搜索是在對抗搜索中最為基本的一種讓玩家來計算最優(yōu)策略的方法.Alpha-Beta剪枝搜索(PruningSearch):一種對最小最大搜索進行改進的算法,即在搜索過程中可剪除無需搜索的分支節(jié)點,且不影響搜索結果。.蒙特卡洛樹搜索(Monte-CarloTreeSearch):通過采樣而非窮舉方法來實現(xiàn)搜索。對抗搜索本書主要討論在確定的、全局可觀察的、競爭對手輪流行動、零和游戲(zero-sum)下的對抗搜索兩人對決游戲(MAXandMIN,MAX先走)可如下形式化描述,從而將其轉換為對抗搜索問題狀態(tài)動作狀態(tài)轉移終局狀態(tài)檢測終局得分注:所謂零和博弈是博弈論的一個概念,屬非合作博弈。指參與博弈的各方,在嚴格競爭下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和永遠為“零”,雙方不存在合作的可能。與“零和”對應,“雙贏博弈”的基本理論就是“利己”不“損人”,通過談判、合作達到皆大歡喜的結果。對抗搜索:最小最大搜索

對抗搜索:Alpha-Beta剪枝搜索alpha-beta剪枝搜索算法在Minimax算法中可減少被搜索的節(jié)點數(shù),即在保證得到與原Minimax算法同樣的搜索結果時,剪去了不影響最終結果的搜索分枝。

圖中MIN選手所在的節(jié)點C下屬分支4和6與根節(jié)點最終優(yōu)化決策的取值無關,可不被訪問。對抗搜索:Alpha-Beta剪枝搜索對抗搜索:Alpha-Beta剪枝搜索基于MIN節(jié)點反饋收益進行剪枝(alpha剪枝)

MAX

…MINMAXMIN

已被訪問后繼分支節(jié)點未被訪問后繼分支節(jié)點被剪枝…

提綱二、對抗搜索一、啟發(fā)搜索三、蒙特卡洛樹搜索對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

(3.4.3)

對抗搜索:蒙特卡洛樹搜索

選擇(selection):選擇指算法從搜索樹的根節(jié)點開始,向下遞歸選擇子節(jié)點,直至到達葉子節(jié)點或者到達具有還未被擴展過的子節(jié)點的節(jié)點L。這個向下遞歸選擇過程可由UCB1算法來實現(xiàn),在遞歸選擇過程中記錄下每個節(jié)點被選擇次數(shù)和每個節(jié)點得到的獎勵均值。擴展(expansion):如果節(jié)點L不是一個終止節(jié)點(或對抗搜索的終局節(jié)點),則隨機擴展它的一個未被擴展過的后繼邊緣節(jié)點M。模擬(simulation):從節(jié)點M出發(fā),模擬擴展搜索樹,直到找到一個終止節(jié)點。模擬過程使用的策略和采用UCB1算法實現(xiàn)的選擇過程并不相同,前者通常會使用比較簡單的策略,例如使用隨機策略。反向傳播(BackPropagation):用模擬所得結果(終止節(jié)點的代價或游戲終局分數(shù))回溯更新模擬路徑中M以上(含M)節(jié)點的獎勵均值和被訪問次數(shù)。對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

對抗搜索:蒙特卡洛樹搜索

在圖3.4.6(b)中,算法隨機擴展了L的子節(jié)點C,將其總分數(shù)和被訪問次數(shù)均初始化為0。注意,為了清晰地展示算法選擇擴展的節(jié)點,圖3.4.6(b)畫出了L的其他未被擴展的子節(jié)點,并標記其UCB值為正無窮大,以表示算法下次訪問到L時必然擴展這些未被擴展的節(jié)點。圖3.4.6(c)中采用隨機策略模擬游戲直至完成游戲。當游戲完成時,終局得分為3。對抗搜索:蒙特卡洛樹搜索

在圖3.4.6(d)中C節(jié)點的總分被更新為-3,被訪問次數(shù)被更新為1;L節(jié)點的總分被更新為13,被訪問次數(shù)被更新為2;根節(jié)點的總分被更新為-18,被訪問次數(shù)被更新為3。在更新時,會將MIN層節(jié)點現(xiàn)有總分加上終局得分分數(shù),MAX層節(jié)點現(xiàn)有總分減去終局得分分數(shù)。這是因為在對抗搜索中,玩家MIN總是期望最小化終局得分,因此在MIN層選擇其子節(jié)點時,其目標并非選取獎勵最大化的子節(jié)點,而是選擇獎勵最小化的節(jié)點,為了統(tǒng)一使用UCB1算法求解,算法將MIN層的子節(jié)點(即MAX層節(jié)點)的總分記為其相反數(shù)。機器學習:監(jiān)督學習

《人工智能導論:模型與算法》提綱二、線性回歸一、機器學習基本概念三、AdaBoosting機器學習:從數(shù)據中學習知識

圖像數(shù)據文本數(shù)據PersonDog…

喜悅憤怒…類別分類情感分類

}機器學習的分類

監(jiān)督學習(supervisedlearning)數(shù)據有標簽、一般為回歸或分類等任務無監(jiān)督學習(un-supervisedlearning)

數(shù)據無標簽、一般為聚類或若干降維任務強化學習(reinforcementlearning)序列數(shù)據決策學習,一般為與從環(huán)境交互中學習半監(jiān)督學習(semi-supervisedlearning)機器學習:分類問題

人員數(shù)學好身體好會編程嗓門大程序員AYesNoYesYes作家ANoNoYesNo程序員BYesYesNoNo……………醫(yī)生AYesYesYesYes程序員CYesYesYesYes程序員DYesYesYesNo從數(shù)據中學習

映射函數(shù)模式類別標簽數(shù)據監(jiān)督學習的重要元素如何學習得到映射模型標注數(shù)據學習模型標識了類別信息的數(shù)據如何對學習結果進行度量損失函數(shù)監(jiān)督學習:損失函數(shù)

監(jiān)督學習:損失函數(shù)典型的損失函數(shù)

損失函數(shù)名稱損失函數(shù)定義0-1損失函數(shù)平方損失函數(shù)絕對損失函數(shù)對數(shù)損失函數(shù)/對數(shù)似然損失函數(shù)監(jiān)督學習:訓練數(shù)據與測試數(shù)據

監(jiān)督學習:經驗風險與期望風險

經驗風險(empiricalrisk

)訓練集中數(shù)據產生的損失。經驗風險越小說明學習模型對訓練數(shù)據擬合程度越好。期望風險(expectedrisk):當測試集中存在無窮多數(shù)據時產生的損失。期望風險越小,學習所得模型越好。

映射函數(shù)訓練目標:經驗風險最小化(empiricalriskminimization,

ERM)

選取一個使得訓練集所有數(shù)據損失平均值最小的映射函數(shù)。這樣的考慮是否夠?映射函數(shù)訓練目標:期望風險最小化(expectedriskminimization)

期望風險是模型關于聯(lián)合分布期望損失,經驗風險是模型關于訓練樣本集平均損失。根據大數(shù)定律,當樣本容量趨于無窮時,經驗風險趨于期望風險。所以在實踐中很自然用經驗風險來估計期望風險。由于現(xiàn)實中訓練樣本數(shù)目有限,用經驗風險估計期望風險并不理想,要對經驗風險進行一定的約束。監(jiān)督學習:經驗風險與期望風險監(jiān)督學習:“過學習(over-fitting)”與“欠學習(under-fitting)”經驗風險?。ㄓ柧毤媳憩F(xiàn)好)期望風險?。y試集上表現(xiàn)好)泛化能力強經驗風險?。ㄓ柧毤媳憩F(xiàn)好)期望風險大(測試集上表現(xiàn)不好)過學習(模型過于復雜)經驗風險大(訓練集上表現(xiàn)不好)期望風險大(測試集上表現(xiàn)不好)欠學習經驗風險大(訓練集上表現(xiàn)不好)期望風險?。y試集上表現(xiàn)好)“神仙算法”或“黃粱美夢”

經驗風險最小化期望風險最小化監(jiān)督學習:結構風險最小

經驗風險最小化:僅反映了局部數(shù)據期望風險最小化:無法得到全量數(shù)據結構風險最小化(structuralriskminimization):為了防止過擬合,在經驗風險上加上表示模型復雜度的正則化項(regulatizer)或懲罰項(penaltyterm):

模型復雜度經驗風險在最小化經驗風險與降低模型復雜度之間尋找平衡監(jiān)督學習兩種方法:判別模型與生成模型監(jiān)督學習方法又可以分為生成方法(generativeapproach)和判別方法(discriminativeapproach)。所學到的模型分別稱為生成模型(generativemodel)和判別模型(discriminativemodel).

人臉

=0.99

監(jiān)督學習兩種方法:判別模型與生成模型監(jiān)督學習

分類識別推薦…提綱二、線性回歸一、機器學習基本概念三、AdaBoosting線性回歸(linearregression)在現(xiàn)實生活中,往往需要分析若干變量之間的關系,如碳排放量與氣候變暖之間的關系、某一商品廣告投入量與該商品銷售量之間的關系等,這種分析不同變量之間存在關系的研究叫回歸分析,刻畫不同變量之間關系的模型被稱為回歸模型。如果這個模型是線性的,則稱為線性回歸模型。一旦確定了回歸模型,就可以進行預測等分析工作,如從碳排放量預測氣候變化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論