人工智能通識(基礎、技術(shù)、前沿、倫理與實踐)-課件 第1-5章 人工智能概述- 計算機視覺_第1頁
人工智能通識(基礎、技術(shù)、前沿、倫理與實踐)-課件 第1-5章 人工智能概述- 計算機視覺_第2頁
人工智能通識(基礎、技術(shù)、前沿、倫理與實踐)-課件 第1-5章 人工智能概述- 計算機視覺_第3頁
人工智能通識(基礎、技術(shù)、前沿、倫理與實踐)-課件 第1-5章 人工智能概述- 計算機視覺_第4頁
人工智能通識(基礎、技術(shù)、前沿、倫理與實踐)-課件 第1-5章 人工智能概述- 計算機視覺_第5頁
已閱讀5頁,還剩454頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

人工智能通識——基礎、技術(shù)、前沿、倫理與實踐第1章人工智能概述01什么是人工智能目錄02人工智能的發(fā)展歷程03人工智能的影響04世界各國的人工智能發(fā)展戰(zhàn)略05人工智能關(guān)鍵技術(shù)06人工智能應用07人工智能產(chǎn)業(yè)08人工智能底層的信息化基礎設施09人工智能思維01什么是人工智能Partone1.1什么是人工智能什么是智能人工智能的定義人工智能的要素人工智能的類型智能是一個復雜的概念,它涉及到多個方面和層次。一般來說,智能是指生物一般性的精神能力,指人認識、理解客觀事物并運用知識、經(jīng)驗等解決問題的能力,包括記憶、觀察、想象、思考、判斷等。智能也包括一些更高級的能力,如理解、分析、推理、學習、規(guī)劃和自我改進等方面的能力多元智能理論是由美國教育學家和心理學家霍華德·加德納(HowardGardner)博士提出的一種全新的人類智能結(jié)構(gòu)的理論。這一理論認為,智能是一種創(chuàng)造力和解決問題的能力的體現(xiàn),而智能本身是多元化的,每個人身上都存在著很多種類型的智能。根據(jù)多元智能理論,每個人至少有七種智能語言智能數(shù)理邏輯智能音樂智能空間智能身體運動智能人際關(guān)系智能人際關(guān)系智能1.1.1什么是智能人工智能目前還沒有統(tǒng)一的定義麥卡錫(McCarthy)認為,人工智能就是要讓機器的行為看起來像是人所表現(xiàn)出的智能行為一樣尼爾遜(Nilsson)認為,人工智能是關(guān)于人造物的智能行為,包括知覺、推理、學習、交流和在復雜環(huán)境中的行為1.1.2人工智能的定義巴爾(Barr)和費根鮑姆(Feigenbaum)認為,人工智能屬于計算機科學的一個分支,旨在設計智能的計算機系統(tǒng),也就是說,對照人類在自然語言理解、學習、推理問題求解等方面的智能行為,設計的系統(tǒng)應呈現(xiàn)出與之類似的特征本書認為人工智能是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應用系統(tǒng)的一門新的技術(shù)科學。人工智能知識體系涉及多個學科,包括數(shù)學、邏輯學、歸納學、統(tǒng)計學、系統(tǒng)學、控制學、計算機科學等1.1.2人工智能的定義人工智能的四個要素包括數(shù)據(jù)、算力、算法和場景。人工智能的智能都蘊含在大數(shù)據(jù)中,數(shù)據(jù)量越大,智能程度越高;算力為人工智能提供了基本的計算能力的支撐;算法是實現(xiàn)人工智能的根本途徑,是挖掘數(shù)據(jù)智能的有效方法;大數(shù)據(jù)、算力、算法作為輸入,只有在實際的場景中進行輸出,才能體現(xiàn)出實際價值(1)數(shù)據(jù)。數(shù)據(jù)是人工智能的基礎因為機器學習算法需要大量的數(shù)據(jù)進行訓練和優(yōu)化。數(shù)據(jù)的質(zhì)量、數(shù)量和多樣性,對人工智能的性能和準確性至關(guān)重要。為了獲得更好的結(jié)果,需要收集和整合各種來源的數(shù)據(jù),并進行預處理和清洗,以確保數(shù)據(jù)的準確性和一致性1.1.3人工智能的要素(2)算力。算力是指計算機的處理能力,包括CPU、GPU、TPU等硬件設備人工智能需要大量的計算資源來處理和分析數(shù)據(jù),因此,算力是人工智能發(fā)展的重要因素之一。隨著技術(shù)的不斷發(fā)展,計算機的算力不斷提高,為人工智能的發(fā)展提供了更好的支持1.1.3人工智能的要素(3)算法。算法是人工智能的核心,它是指引計算機如何處理和分析數(shù)據(jù)的指令它是指引計算機如何處理和分析數(shù)據(jù)的指令。不同的算法適用于不同的任務和數(shù)據(jù)類型,因此,需要根據(jù)具體的應用場景選擇合適的算法。同時,算法也需要不斷優(yōu)化和改進,以提高人工智能的性能和準確性1.1.3人工智能的要素(4)場景。場景是指人工智能應用的具體環(huán)境和使用場景不同場景下的人工智能應用需要不同的技術(shù)和解決方案。例如,在醫(yī)療領域,人工智能可以用于疾病診斷和治療方案的制定;在交通領域,人工智能可以用于交通管理和優(yōu)化;在教育領域,人工智能可以用于教學輔助和學生評估等。因此,場景的選擇和使用對于人工智能的發(fā)展和應用至關(guān)重要1.1.3人工智能的要素強人工智能強人工智能是指能夠完全取代人類工作的人工智能,它具有自我思考和學習能力,能夠模仿人類的決策和行為強人工智能的目標是創(chuàng)造能夠像人類一樣思考和感知的智能機器強人工智能特點學習適應性創(chuàng)造性自主性處理復雜的問題并提供創(chuàng)新的解決方案算法和技術(shù)機器學習深度學習自然語言處理計算機視覺模擬人類的思維和行為1.1.4人工智能的類型弱人工智能弱人工智能是指不能制造出真正地推理和解決問題的智能機器,這些機器只不過看起來像是智能的,但并不具備真正的智能和自主意識弱人工智能有許多應用,包括問題求解、邏輯推理與定理證明、自然語言理解、專家系統(tǒng)、機器學習、人工神經(jīng)網(wǎng)絡、機器人學、模式識別、機器視覺等在圖像識別領域,基于深度學習的人臉識別、物體識別、行為識別等,在醫(yī)療、交通、教育等行業(yè)都有廣泛的用途,能夠有效提高安全防范水平,打擊犯罪和恐怖主義,懲治交通違法行為,提升交通安全水平等“深度學習+數(shù)據(jù)”模式甚至在文學創(chuàng)作、司法審判、新聞編輯、音樂和美術(shù)作品創(chuàng)作等方面,也有驚人的表現(xiàn),能夠極大地提升工作效率和質(zhì)量,降低人類的工作強度,激發(fā)人類的創(chuàng)作靈感,創(chuàng)作出更好的作品1.1.4人工智能的類型通用人工智能和超級人工智能1.1.4人工智能的類型AGI(ArtificialGeneralIntelligence),即通用人工智能,是一種能夠執(zhí)行與人類相當或超越人類的廣泛認知任務的人工智能系統(tǒng)。與專注于特定任務的窄人工智能(NarrowAI,也被稱為“弱人工智能”)不同,AGI的目標是具備廣泛的認知能力,能夠在多種不同的任務和環(huán)境中表現(xiàn)出高度的靈活性和適應性。AGI被認為是強人工智能的一種形式,旨在實現(xiàn)類人智能和自學能力,使其能夠執(zhí)行訓練或開發(fā)目的之外的任務。簡而言之,AGI是人工智能的目前階段追求目標,即創(chuàng)造出一臺能在各種領域思考和學習的機器,讓它像人類一樣聰明。ASI(ArtificialSuperIntelligence),即超級人工智能,是人工智能領域中的巔峰之作。它指的是一種智力水平遠超人類的機器智能,具備前所未有的自主學習、創(chuàng)新能力和問題解決能力。ASI不僅擁有比人類更強大的計算能力、學習能力,還能在創(chuàng)造力、情感理解等方面超越人類。這一概念最早在人工智能技術(shù)的發(fā)展過程中被提出,旨在探索并實現(xiàn)機器智能的終極形態(tài)。ASI的實現(xiàn)將意味著機器智能在各個方面都大大超過人類,包括推理、創(chuàng)新、情感理解等,甚至可能具備意識或超越人類的情感理解,并在與人類的互動中發(fā)揮巨大影響。不同人工智能類型之間的關(guān)系1.1.4人工智能的類型弱人工智能是實現(xiàn)通用人工智能和超級人工智能的基礎。通過設計和訓練弱人工智能系統(tǒng),可以逐步提高其性能和能力,最終實現(xiàn)更高級別的智能。強人工智能包括通用人工智能和超級人工智能兩個階段。通用人工智能是弱人工智能向超級人工智能過渡的中間階段,它具備了更廣泛的智能能力,但仍未達到超越人類智能的水平。超級人工智能則是通用人工智能發(fā)展的一個可能結(jié)果,代表了人工智能技術(shù)的最高水平,是人工智能發(fā)展的終極形態(tài)。02人工智能的發(fā)展歷程Parttwo1.2人工智能的發(fā)展歷程圖靈測試人工智能的誕生人工智能的發(fā)展階段未來人工智能發(fā)展的五個級別1950年,“計算機之父”和“人工智能之父”艾倫·圖靈(AlanM.Turing)發(fā)表了論文《計算機器與智能》,這篇論文被譽為人工智能科學的開山之作。在論文的開篇,圖靈提出了一個引人深思的問題:“機器能思考嗎?”。這個問題激發(fā)了人們無盡的想象,同時也奠定了人工智能的基本概念和雛形在這篇論文中,圖靈提出了鑒別機器是否具有智能的方法,這就是人工智能領域著名的“圖靈測試”。如圖所示,其基本思想是測試者在與被測試者(一個人和一臺機器)隔離的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。進行多次測試后,如果被測試者機器讓平均每個測試者做出超過30%的誤判,那么這臺機器就通過了測試,并被認為具有人類智能1.2.1圖靈測試人工智能的誕生可以追溯到20世紀50年代。當時,計算機科學剛剛起步,人們開始嘗試通過計算機程序來模擬人類的思維和行為。在這個背景下,一些杰出的科學家和工程師們開始研究如何使計算機具備更高級的功能1956年8月,在美國達特茅斯學院舉辦的人工智能夏季研討會,是人工智能領域具有里程碑意義的一次重要會議。這次會議匯聚了眾多杰出的科學家和工程師,他們共同探討和研究人工智能的發(fā)展和應用前景這次會議的主題圍繞著人工智能的定義、研究方法和應用場景展開。與會者們深入探討了人工智能的基本概念、算法和技術(shù),以及其在各個領域的應用潛力。他們共同認識到,人工智能的研究和發(fā)展將為人類帶來巨大的變革和進步1.2.2人工智能的誕生在這次會議上,“人工智能”這個詞匯被約翰.麥卡錫(JohnMcCarthy)首次提出。與會者們不僅對人工智能的研究和應用前景進行了深入探討,還提出了許多重要的觀點和思路,為人工智能的發(fā)展奠定了基礎。這次會議的召開標志著人工智能作為一個獨立學科的正式誕生,因此,達特茅斯會議被稱為“人工智能的開端”,1956年也被稱為“人工智能元年”。這次會議不僅為人工智能的研究和發(fā)展奠定了基礎,還為人類帶來了巨大的變革和進步1.2.2人工智能的誕生從1956年人工智能元年至今,人工智能的發(fā)展歷程經(jīng)歷了漫長的歲月,大致可以劃分為以下6個階段1.2.3人工智能的發(fā)展階段1.2.4未來人工智能發(fā)展的五個級別DeepSeekR103人工智能的影響Partthree1.3人工智能的影響人工智能對工作、生活等方面的影響人工智能開啟科學研究“第五范式”人工智能開啟“人機共生”新時代1.3.1人工智能對工作、生活等方面的影響生活方式的變革工作模式的轉(zhuǎn)變教育領域的革新經(jīng)濟結(jié)構(gòu)的優(yōu)化與產(chǎn)業(yè)升級環(huán)境保護與可持續(xù)發(fā)展社會倫理與隱私保護1.3.1人工智能對工作、生活等方面的影響會用AI的人會逐漸淘汰不會用AI的人AI將極大提升人類獲取信息的效率AI手機開始普及,AI語音助理成為標配AI眼鏡會成為最時髦的可穿戴設備自動駕駛成為汽車的標配AI智能管家走入千家萬戶AI補課老師普及,補課不用再去上補習班更多的人開始利用AI創(chuàng)造收入圖靈獎獲得者、著名數(shù)據(jù)庫專家JimGray博士觀察并總結(jié)人類自古以來,在科學研究上,先后歷經(jīng)了實驗、理論、計算和數(shù)據(jù)四種范式實驗理論計算數(shù)據(jù)1.3.2人工智能開啟科學研究“第五范式”科學研究第一種范式:實驗伽利略伽利略在比薩斜塔做兩個鐵球同時落地實驗1.3.2人工智能開啟科學研究“第五范式”科學研究第二種范式:理論幾何理論牛頓三大定律1.3.2人工智能開啟科學研究“第五范式”科學研究第三種范式:計算1.3.2人工智能開啟科學研究“第五范式”科學研究第四種范式:數(shù)據(jù)大數(shù)據(jù)時代,以數(shù)據(jù)為中心1.3.2人工智能開啟科學研究“第五范式”1.3.2人工智能開啟科學研究“第五范式”圖2-52024年諾貝爾獎官方插畫——物理獎及化學獎獲得者在科學研究上,AI展現(xiàn)出了令人矚目的應用成果,極大程度幫助了科研工作者提升科研工作的質(zhì)效,預示著“AIforScience”(或稱為“智能科學”)正在成為賦能科學研究的“第五范式”(即利用人工智能加速科學發(fā)現(xiàn)的新方法)。與前四種范式(經(jīng)驗、理論、計算和數(shù)據(jù))不同,AIforScience不僅充分運用已有的經(jīng)驗、理論和數(shù)據(jù),而且生成全新的科學假設和逼真的自然現(xiàn)象,推導出未知的結(jié)論,提高科學研究的速度和準確性,探索更廣闊的可能性空間。1.3.3人工智能開啟“人機共生”新時代根據(jù)財新智庫聯(lián)合上海交通大學發(fā)布的報告,在人工智能新一輪大發(fā)展的浪潮之下,人們需要建立起新型的“三線”人機關(guān)系觀人機協(xié)作是基準線人機共生是趨勢線“人在機器之上”是底線04世界各國的人工智能發(fā)展戰(zhàn)略Partfour1.4世界各國的人工智能發(fā)展戰(zhàn)略美國中國歐盟其他國家1.4.1美國加大投資力度推動技術(shù)創(chuàng)新促進產(chǎn)業(yè)發(fā)展加強人才培養(yǎng)注重倫理治理圖2-62025年1月21日美國特朗普總統(tǒng)宣布“星際之門”計劃1.4.2中國出臺政策法規(guī)推動產(chǎn)業(yè)融合加強基礎設施建設培養(yǎng)專業(yè)人才注重應用場景1.4.3歐盟制定倫理準則推動技術(shù)創(chuàng)新加強國際合作增加投資力度1.4.4其他國家俄羅斯強調(diào)自主研發(fā)人工智能技術(shù)的重要性,以維護國家主權(quán)和安全1韓國希望利用人工智能鞏固和擴大其在信息通信等領域的產(chǎn)業(yè)優(yōu)勢,加大人工智能芯片研發(fā)投入2日本希望通過人工智能解決養(yǎng)老、教育等國家難題,重點布局機器人、類腦科學、自動駕駛等領域3英國注重數(shù)據(jù)科學、智能能源等領域的研發(fā),推動人工智能技術(shù)在醫(yī)療、教育等領域的應用4其他國家的人工智能戰(zhàn)略05人工智能關(guān)鍵技術(shù)Partfive1.5人工智能關(guān)鍵技術(shù)機器學習知識圖譜人機交互計算機視覺自然語言處理生物特征識別機器學習強調(diào)三個關(guān)鍵詞:算法、經(jīng)驗、性能。在數(shù)據(jù)的基礎上,通過算法構(gòu)建出模型并對模型進行評估。評估的性能如果達到要求,就用該模型來測試其他的數(shù)據(jù);如果達不到要求,就要調(diào)整算法來重新建立模型,再次進行評估。如此循環(huán)往復,最終獲得滿意的模型來處理其他數(shù)據(jù)1.5.1機器學習傳統(tǒng)機器學習模型階段深度學習模型階段超大規(guī)模深度學習模型階段機器學習模型的三個發(fā)展階段處理大規(guī)模數(shù)據(jù)能力強處理復雜問題能力強具有更高的準確率和性能大模型的優(yōu)點1.5.1機器學習知識圖譜(KnowledgeGraph)又稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發(fā)展進程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系1.5.2知識圖譜自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法自然語言處理的應用包羅萬象,例如:機器翻譯、手寫體和印刷體字符識別、語音識別、信息檢索、信息抽取與過濾、文本分類與聚類、輿情分析和觀點挖掘等1.5.3自然語言處理人機交互是一門研究系統(tǒng)與用戶之間的交互關(guān)系的學科。系統(tǒng)可以是各種各樣的機器,也可以是計算機化的系統(tǒng)和軟件人機交互界面通常是指用戶可見的部分。用戶通過人機交互界面與系統(tǒng)交流,并進行操作人機交互是與認知心理學、人機工程學、多媒體技術(shù)、虛擬現(xiàn)實技術(shù)等密切相關(guān)的綜合學科1.5.4人機交互1.5.4人機交互人機交互具有廣泛的應用場景,比如,我國某高校已經(jīng)成功研發(fā)了大指令集、高速、無創(chuàng)“腦-機接口打字系統(tǒng)”,使用者只需頭戴腦電帽,雙眼盯著電腦屏幕,就能用意念打字在國內(nèi),杭州強腦科技也在腦機接口領域取得了顯著進展,成為比肩Neuralink的全球知名腦機接口企業(yè),并且已經(jīng)成功研制出了智能頭環(huán)、智能康復系統(tǒng)、智能仿生手、新型智能膝關(guān)節(jié)假肢等產(chǎn)品,這些產(chǎn)品整合了腦機接口技術(shù)與人工智能算法,能夠?qū)崟r監(jiān)測用戶腦電波信號,并將其轉(zhuǎn)化為控制指令強腦科技——杭州“六小龍”之一計算機視覺是一門研究如何使機器“看”的科學,更進一步地說,是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量的機器視覺,并進一步做圖形處理,成為更適合人眼觀察或傳送給儀器檢測的圖像1.5.5計算機視覺生物特征識別技術(shù)涉及的內(nèi)容十分廣泛,包括指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多種生物特征,其識別過程涉及到圖像處理、計算機視覺、語音識別、機器學習等多項技術(shù)1.5.6生物特征識別06人工智能應用Partsix智能制造(IntelligentManufacturing,IM)是一種由智能機器和人類專家共同組成的人機一體化智能系統(tǒng),它在制造過程中能進行智能活動,諸如分析、推理、判斷、構(gòu)思和決策等1.6.1智能制造智能家居通過物聯(lián)網(wǎng)技術(shù)將家中的各種設備(如音視頻設備、照明系統(tǒng)、窗簾控制、空調(diào)控制、安防系統(tǒng)、數(shù)字影院系統(tǒng)、影音服務器、影柜系統(tǒng)、網(wǎng)絡家電等)連接到一起,提供家電控制、照明控制、電話遠程控制、室內(nèi)外遙控、防盜報警、環(huán)境監(jiān)測、暖通控制、紅外轉(zhuǎn)發(fā)以及可編程定時控制等多種功能和手段1.6.2智能家居智能獲客身份識別大數(shù)據(jù)風控智能投資顧問智能客服金融云1.6.3智能金融智能交通是未來交通系統(tǒng)的發(fā)展方向,它是將先進的信息技術(shù)、數(shù)據(jù)通訊傳輸技術(shù)、電子傳感技術(shù)、控制技術(shù)及計算機技術(shù)等有效地集成運用于整個地面交通管理系統(tǒng)而建立的一種在大范圍內(nèi)、全方位發(fā)揮作用的,實時、準確、高效的綜合交通運輸管理系統(tǒng)1.6.4智能交通1.6.4智能交通2024年,百度公司無人駕駛出租車“蘿卜快跑”開始上路運行問界M9采用華為全自動駕駛技術(shù)智能安防是兼顧了整體城市管理系統(tǒng)、環(huán)保監(jiān)測系統(tǒng)、交通管理系統(tǒng)、應急指揮系統(tǒng)等應用的綜合體系特別是車聯(lián)網(wǎng)的興起,在公共交通管理上、車輛事故處理上、車輛偷盜防范上可以更加快捷準確的跟蹤定位處理還可以隨時隨地的通過車輛獲取更加精準的災難事故信息、道路流量信息、車輛位置信息、公共設施安全信息、氣象信息等等信息來源1.6.5智能安防借助于物聯(lián)網(wǎng)/云計算技術(shù)、人工智能的專家系統(tǒng)、嵌入式系統(tǒng)的智能化設備,可以構(gòu)建起完善的物聯(lián)網(wǎng)醫(yī)療體系,使全民平等地享受頂級的醫(yī)療服務,解決或減少由于醫(yī)療資源缺乏,導致看病難、醫(yī)患關(guān)系緊張、事故頻發(fā)等現(xiàn)象1.6.6智能醫(yī)療1.6.6智能醫(yī)療圖

清華大學AI醫(yī)院上線使用智能搜索、推理規(guī)劃、計算機視覺以及智能機器人等技術(shù),實現(xiàn)貨物運輸過程的自動化運作和高效率優(yōu)化管理,提高物流效率京東智能分揀1.6.7智能物流人工智能在零售領域的應用已經(jīng)十分廣泛,無人便利店、智慧供應鏈、客流統(tǒng)計等等都是的熱門方向1.6.8智能零售07人工智能產(chǎn)業(yè)Partseven智能芯片智能傳感器分布式計算框架1.7.1智能基礎設施建設在人工智能數(shù)據(jù)采集、存儲、處理和分析方面的企業(yè)主要有兩種企業(yè)類型數(shù)據(jù)采集、存儲、處理和分析綜合性廠商數(shù)據(jù)集提供商1.7.2智能信息及數(shù)據(jù)平臺與模型提供人工智能的技術(shù)平臺和算法模型解決方案提供人工智能的整體解決方案在線服務提供人工智能在線服務1.7.3智能技術(shù)服務智能技術(shù)服務智能機器人智能運載工具智能終端自然語言處理計算機視覺生物特征識別VR/AR人機交互1.7.4智能產(chǎn)品08人工智能底層的信息化基礎設施Parteight1.8人工智能底層的信息化基礎設施網(wǎng)絡設施算力設施空間設施電力設施1.8.1網(wǎng)絡設施我國移動通信網(wǎng)絡發(fā)展水平全球領先。我國4G網(wǎng)絡已經(jīng)實現(xiàn)了全面覆蓋城鄉(xiāng)的目標,截至2024年年底,我國4G基站數(shù)量已達711萬個,占據(jù)全世界的60%以上,4G網(wǎng)絡規(guī)模全球第一。5G網(wǎng)絡作為新一代移動通信技術(shù),具有以下特點:高速率低時延大連接......對于推動數(shù)字經(jīng)濟和各行各業(yè)數(shù)字化轉(zhuǎn)型具有重要意義。我國高度重視5G網(wǎng)絡建設,近年來取得了顯著進展。我國的華為公司,是全球領先的5G設備供應商,也為我國自己的5G網(wǎng)絡建設提供了強有力的支撐。據(jù)工信部最新數(shù)據(jù)(截至2024年12月底):425萬個我國已累計建成5G基站數(shù)量+60%我國已建成5G基站數(shù)量全球占比+60%我國用戶普及率1.8.2算力設施截至2024年9月底,數(shù)據(jù)中心規(guī)模已達到880萬標準機架,全國一體化大數(shù)據(jù)中心體系加快構(gòu)建,8個國家算力樞紐節(jié)點啟動建設,算力總規(guī)模近五年年均增速超過25%,表明我國算力設施正處于快速發(fā)展階段截至2024年9月底,中國算力總規(guī)模已達到268EFLOPS(每秒浮點運算次數(shù)),智能算力規(guī)模更是達到70EFLOPS,增速超過70%在“東數(shù)西算”戰(zhàn)略的推動下,西部地區(qū)利用豐富的能源和土地資源,建設了一批大型數(shù)據(jù)中心和算力中心1.8.3空間設施1.8.4電力設施建設現(xiàn)狀截至2024年12月底,全國累計發(fā)電裝機容量約33.5億千瓦,同比增長14.6%,其中,太陽能發(fā)電裝機容量約8.9億千瓦,同比增長45.2%,風電裝機容量約5.2億千瓦,同比增長18.0%2023年美國發(fā)電量達4.4萬億度,印度僅有1.9萬億度,而中國竟然高達9.4萬億度,占全球發(fā)電量30%。1.8.4電力設施電力即國力根據(jù)咨詢機構(gòu)麥肯錫2024年的最新研究,AI對算力需求的拉動將直接帶動數(shù)據(jù)中心建設規(guī)模提速,同時帶來對電力需求的爆發(fā)式增長。保守估算,到2030年,全球數(shù)據(jù)中心服務器的能耗將高達390GW,而其中70%是被AI算力所消耗碳能源(如煤、石油、天然氣等)已經(jīng)難以支撐起智能化時代大廈的基座,而以“中國新能源七子”為代表的硅能源逐漸脫穎而出中國新能源七子是指一群在新能源領域具有顯著影響力和技術(shù)實力的企業(yè)(包括通威股份、協(xié)鑫科技、隆基綠能、天合光能、新特能源、晶澳科技、晶科能源),?它們在光伏、?新能源汽車等多個新能源子領域內(nèi)取得了重要進展,?甚至在某些方面已經(jīng)超越了傳統(tǒng)的石油公司,撼動了20世紀“石油七姊妹”的地位(包括埃克森、美孚、雪佛龍、德士古、海灣、殼牌和BP)09人工智能思維Partnine1.9人工智能思維了解每個人都應了解人工智能的基礎運行模式區(qū)分具備區(qū)分人的能力和機器的能力協(xié)作擁有和人工智能協(xié)作的能力,懂得如何運用人工智能1.10本章小結(jié)本章全方位闡述了人工智能這一前沿領域。從概念上看,人工智能是模擬、延伸和擴展人類智能的理論、方法、技術(shù)及應用系統(tǒng),其發(fā)展歷經(jīng)多個階段,從早期的理論探索到如今的蓬勃發(fā)展,深刻影響著社會生活的方方面面,改變著人們的生產(chǎn)和生活方式。01在發(fā)展戰(zhàn)略上,世界各國高度重視,紛紛布局。美國憑借強大的科研實力和完善的產(chǎn)業(yè)生態(tài)走在前列;我國積極推動人工智能與實體經(jīng)濟深度融合,出臺多項政策支持產(chǎn)業(yè)發(fā)展。在關(guān)鍵技術(shù)方面,機器學習、深度學習等技術(shù)不斷突破,推動人工智能實現(xiàn)質(zhì)的飛躍。人工智能產(chǎn)業(yè)正蓬勃興起,在醫(yī)療、交通、教育等領域廣泛應用,創(chuàng)造巨大價值。盡管仍面臨技術(shù)瓶頸、倫理挑戰(zhàn)等問題,但人工智能的發(fā)展前景依舊廣闊,未來有望持續(xù)為人類社會帶來更多變革與驚喜。02謝謝觀看!附錄B:大數(shù)據(jù)學習路線圖大數(shù)據(jù)學習路線圖訪問地址:/post/10164/附錄C:林子雨大數(shù)據(jù)系列教材了解全部教材信息:/post/bigdatabook/謝謝!林子雨副教授廈門大學人工智能通識——基礎、技術(shù)、前沿、倫理與實踐第2章人工智能編程語言基礎01Python簡介目錄02搭建Python開發(fā)環(huán)境03Python規(guī)范04Python基礎語法知識01Python簡介Partthree2.1

Python簡介發(fā)展到今天,Python已經(jīng)成為最受歡迎的程序設計語言之一在Python開發(fā)領域流傳著這樣一句話:“人生苦短,我用Python”Python(發(fā)音[?pa?θ?n])是1989年由荷蘭人吉多·范羅蘇姆(GuidovanRossum)發(fā)明的一種面向?qū)ο蟮慕忉屝透呒壘幊陶Z言0103Python的第一個公開發(fā)行版于

1991

年發(fā)行,在

2004

年以后,Python

的使用率呈線性增長,并獲得“2024年TIOBE最佳年度語言”稱號,這是Python第6次被評為“TIOBE最佳年度語言”0502Python的設計哲學是“優(yōu)雅”“明確”“簡單”0402搭建Python開發(fā)環(huán)境Partsecond2.2搭建Python開發(fā)環(huán)境安裝Python設置當前工作目錄使用交互式執(zhí)行環(huán)境運行代碼文件使用IDLE編寫代碼安裝和使用Python擴展模塊2.2.1

安裝Python請到Python官方網(wǎng)站下載與自己計算機操作系統(tǒng)匹配的安裝包python-3.12.2-amd64.exe運行安裝包開始安裝,在安裝過程中,要注意選中“Addpython.exetoPATH”復選框2.2.1

安裝Python安裝完成以后,需要檢測是否安裝成功。可以打開Windows操作系統(tǒng)的cmd命令界面,然后執(zhí)行如下命令打開Python解釋器:>cdC:\python312>python如果出現(xiàn)圖2-3所示信息,則說明Python已經(jīng)安裝成功:2.2.2設置當前工作目錄Python的當前工作目錄是指Python解釋器當前正在使用的目錄。當我們在cmd命令界面中使用“python”命令打開Python解釋器時,在哪個目錄下執(zhí)行“python”命令,該目錄就會成為Python的當前工作目錄,比如,在cmd命令界面中執(zhí)行如下命令:>cdC:\>python這時,進入Python解釋器以后,當前工作目錄就是“C:\”。再比如,在cmd命令界面中執(zhí)行如下命令:>cdC:\python312>python這時,進入Python解釋器以后,當前工作目錄就是“C:\python312”。2.2.2設置當前工作目錄進入Python解釋器以后,可以使用Python的os模塊來查看當前工作目錄:>>>importos>>>print(os.getcwd())C:\python312雖然Python的當前工作目錄在大多數(shù)情況下都是有用的,但在編寫可移植和可維護的代碼時,最好使用絕對路徑或相對于某個固定點的相對路徑來引用文件,而不是依賴于當前工作目錄。2.2.3使用交互式執(zhí)行環(huán)境>>>print("HelloWorld")HelloWorld>>>1+23>>>2*(3+4)14上圖呈現(xiàn)的界面就是一個交互式執(zhí)行環(huán)境(或稱為“解釋器”),可以在Python命令提示符“>>>”后面輸入各種Python代碼,回車后就會立即看到執(zhí)行結(jié)果,比如:2.2.4運行代碼文件假設在Windows操作系統(tǒng)的Python安裝目錄下已經(jīng)存在一個代碼文件hello.py,該文件里面只有如下一行代碼:print("HelloWorld")現(xiàn)在我們要運行這個代碼文件??梢源蜷_Windows操作系統(tǒng)的cmd命令界面,并在命令提示符后面輸入如下語句:>pythonC:\python312\hello.py執(zhí)行結(jié)果如圖所示。2.2.5使用IDLE編寫代碼Python安裝成功以后,會自帶一個集成式開發(fā)環(huán)境IDLE,它是一個PythonShell,程序開發(fā)人員可以利用PythonShell與Python交互在Windows操作系統(tǒng)的“開始”菜單中找到“IDLE(Python3.12

64-bit)”,單擊進入IDLE主窗口,如圖所示,窗口左側(cè)會顯示Python命令提示符“>>>”,在提示符后面輸入Python代碼,回車后就會立即執(zhí)行并返回結(jié)果2.2.5使用IDLE編寫代碼如果要創(chuàng)建一個代碼文件,可以在IDLE主窗口的頂部菜單欄中選擇“File→NewFile”然后就會彈出圖所示的文件窗口,可以在里面輸入Python代碼,最后,在頂部菜單欄中選擇“File→SaveAs…”,把文件保存為hello.py2.2.5使用IDLE編寫代碼如果要運行代碼文件hello.py,可以在IDLE的文件窗口的頂部菜單欄中選擇“Run→RunModule”(或者直接使用快捷鍵“F5”),這時就會開始運行程序。程序運行結(jié)束后,會在IDLEShell窗口顯示執(zhí)行結(jié)果,如圖所示需要注意的是,除了Python自帶的IDLE以外,我們還可以選擇第三方開發(fā)工具進行Python編程,比如PyCharm、Eclipse、JupyterNotebook、IntelliJIDEA等。2.2.6安裝和使用Python擴展模塊Python的強大之處在于它擁有非常豐富的第三方模塊(或第三方庫),可以幫我們方便、快捷地實現(xiàn)網(wǎng)絡爬蟲、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化和科學計算等功能。為了便于安裝和管理第三方庫和軟件,Python提供了一個擴展模塊(或擴展庫)管理工具pip,Python3.12.2在安裝的時候會默認安裝pip。表2-1

常用pip命令的說明pip命令說明pipinstallSomePackage安裝SomePackage模塊piplist列出當前已經(jīng)安裝的所有模塊pipinstall--upgradeSomePackage升級SomePackage模塊pipuninstallSomePackage卸載SomePackage模塊2.2.6安裝和使用Python擴展模塊例如,Matplotlib是著名的Python繪圖庫,它提供了一整套和Matlab相似的應用程序編程接口(ApplicationProgrammingInterface,API),十分適合交互式地進行制圖??梢允褂萌缦旅畎惭bMatplotlib:>pipinstallmatplotlib安裝成功以后,使用如下命令就可以看到安裝的Matplotlib:>piplist可以在程序中使用import語句導入模塊,語法格式如下:importmodulename[asalias]比如,導入Matplotlib的繪圖模塊可以使用如下語句:>>>import

matplotlib.pyplot

as

plt03Python規(guī)范Partthree2.3Python規(guī)范注釋規(guī)則代碼縮進2.3.1注釋規(guī)則單行注釋Python中使用“#”表示單行注釋。單行注釋可以作為單獨的一行放在被注釋代碼行之上,或者也可以放在語句或表達式之后?!纠?-1】單行注釋作為單獨的一行放在被注釋代碼行之上。pi=3.14r=2#使用面積公式求出圓的面積area=pi*r*rprint(area)當單行注釋作為單獨的一行放在被注釋代碼行之上時,為了保證代碼的可讀性,建議在“#”后面添加一個空格,再添加注釋內(nèi)容。2.3.1注釋規(guī)則單行注釋【例2-2】單行注釋放在語句或表達式之后。length=3#矩形的長width=5#矩形的寬area=length*width#求出矩形的面積print(area)當單行注釋放在語句或表達式之后時,同樣為了保證代碼的可讀性,建議注釋和語句(或注釋和表達式)之間至少要有兩個空格。2.3.1注釋規(guī)則多行注釋當注釋內(nèi)容過多,導致一行無法顯示時,就可以使用多行注釋。Python中使用三個單引號或三個雙引號表示多行注釋。【例2-3】使用三個單引號的多行注釋。'''文件名:area.py用途:用于求解矩形的面積創(chuàng)建日期:2025年8月1日創(chuàng)建人:XMU'''2.3.2代碼縮進Python和其他編程語言(比如C和Java)很不一樣的地方在于,Python采用代碼縮進和冒號來區(qū)分代碼之間的層次,而Java和C語言則采用大括號來分隔代碼塊01如果我們有其他語言(如C或者Java)的編程經(jīng)驗,那么Python的強制縮進一開始會讓我們很不習慣。但是,如果習慣了Python的縮進語法,就會覺得它非常優(yōu)雅02縮進可以使用空格或者Tab鍵來實現(xiàn)(建議使用空格作為縮進)。當使用空格作為縮進時,建議使用4個空格作為一個縮進量032.3.2代碼縮進【例2-4】Python的縮進語法。length=3#矩形的長width=5#矩形的寬area=length*width#矩形的面積ifarea>10:print("大矩形")常用的集成式開發(fā)環(huán)境(比如IDLE、PyCharm、Eclipse等)都具有自動縮進的機制,比如輸入“:”號之后,按“回車”會自動進行縮進。04Python基礎語法知識Partfour2.4Python基礎語法知識基本數(shù)據(jù)類型組合數(shù)據(jù)類型控制結(jié)構(gòu)函數(shù)2.4.1基本數(shù)據(jù)類型數(shù)字在Python中,數(shù)字類型包括整數(shù)(int)、浮點數(shù)(float)、布爾類型(bool)和復數(shù)(complex),而且,數(shù)字類型變量可以表示任意大的數(shù)值。整數(shù)整數(shù)類型用來存儲整數(shù)數(shù)值。在Python中,整數(shù)包括正整數(shù)、負整數(shù)和0。按照進制的不同,整數(shù)類型還可以劃分為十進制整數(shù)、八進制整數(shù)、十六進制整數(shù)和二進制整數(shù)布爾類型Python中的布爾類型主要用來表示“真”或“假”的值,每個對象天生具有布爾類型的True或False值??諏ο?、值為零的任何數(shù)字或者對象None的布爾值都是False。在Python3.x中,布爾值是作為整數(shù)的子類實現(xiàn)的,布爾值可以轉(zhuǎn)換為數(shù)值,True的值為1,F(xiàn)alse的值為0,可以進行數(shù)值運算浮點數(shù)浮點數(shù)也稱為“小數(shù)”,由整數(shù)部分和小數(shù)部分構(gòu)成,比如3.14、0.2、-1.648、5.8726849267842等。浮點數(shù)也可以用科學計數(shù)法表示,比如1.3e4、-0.35e3、2.36e-3等復數(shù)復數(shù)由實數(shù)部分和虛數(shù)部分構(gòu)成,可以用a+bj或者complex(a,b)表示,復數(shù)的實部a和虛部b都是浮點型。例如,一個復數(shù)的實部為2.38,虛部為18.2j,則這個復數(shù)為2.38+18.2j2.4.1基本數(shù)據(jù)類型字符串字符串是Python中最常用的數(shù)據(jù)類型,它是連續(xù)的字符序列,一般使用單引號('')、雙引號("

")或三引號('''

'''或"""""")進行界定。其中,單引號和雙引號中的字符序列必須在一行上,而三引號內(nèi)的字符序列可以分布在連續(xù)的多行上,從而可以支持格式較為復雜的字符串。例如,'xyz'、'123'、'廈門'、"hadoop"、'''spark'''、"""flink"""都是合法字符串,空字符串可以表示為''、"

"或'''

'''。定義要點舉例2.4.2組合數(shù)據(jù)類型列表列表是最常用的Python數(shù)據(jù)類型,列表的數(shù)據(jù)項不需要具有相同的類型。在形式上,只要把逗號分隔的不同的數(shù)據(jù)項使用方括號括起來,就可以構(gòu)成一個列表,例如:['hadoop','spark',2021,2010][1,2,3,4,5]["a","b","c","d"]['Monday','Tuesday','Wednesday','Thursday','Friday','Saturday','Sunday']2.4.2組合數(shù)據(jù)類型列表同其他類型的Python變量一樣,在創(chuàng)建列表時,也可以直接使用賦值運算符“=”將一個列表賦值給變量。例如,以下都是合法的列表定義:student=['小明','男',2010,10]num=[1,2,3,4,5]motto=["自強不息","止于至善"]list=['hadoop',

'年度暢銷書',[2020,12000]]可以看出,列表里面的元素仍然可以是列表。需要注意的是,盡管一個列表中可以放入不同類型的數(shù)據(jù),但是,為了提高程序的可讀性,一般建議在一個列表中只出現(xiàn)一種數(shù)據(jù)類型。2.4.2組合數(shù)據(jù)類型元組Python中的列表適合存儲在程序運行時變化的數(shù)據(jù)集。列表是可以修改的,這對要存儲一些要變化的數(shù)據(jù)而言至關(guān)重要。但是,也不是任何數(shù)據(jù)都要在程序運行期間進行修改,有時候需要創(chuàng)建一組不可修改的元素,此時可以使用元組。元組的創(chuàng)建和列表的創(chuàng)建很相似,不同之處在于,創(chuàng)建列表時使用的是方括號,而創(chuàng)建元組時則需要使用圓括號。元組的創(chuàng)建方法很簡單,只需要在圓括號中添加元素,并使用逗號隔開即可,具體實例如下:>>>tuple1=('hadoop','spark',2008,2009)>>>tuple2=(1,2,3,4,5)>>>tuple3=('hadoop',2008,("大數(shù)據(jù)","分布式計算"),["spark","flink","storm"])2.4.2組合數(shù)據(jù)類型字典字典也是Python提供的一種常用的數(shù)據(jù)結(jié)構(gòu),它用于存放具有映射關(guān)系的數(shù)據(jù)。字典相當于保存了兩組數(shù)據(jù),其中一組數(shù)據(jù)是關(guān)鍵數(shù)據(jù),被稱為“鍵”(key);另一組數(shù)據(jù)可通過鍵來訪問,被稱為“值”(value)。字典具有如下特性:字典是無序的對象集合,列表是有序的對象集合,兩者之間的區(qū)別在于,字典當中的元素是通過鍵來存取的,而不是通過偏移量存取字典的元素是“鍵值對”,由于字典中的鍵是非常關(guān)鍵的數(shù)據(jù),而且程序需要通過鍵來訪問值,因此字典中的鍵不允許重復,必須是唯一值,而且鍵必須不可變字典不支持索引和切片,但可以通過“鍵”查詢“值”030102字典是可變的,并且可以任意嵌套042.4.2組合數(shù)據(jù)類型字典字典用大括號{}標識。在使用大括號語法創(chuàng)建字典時,大括號中應包含多個“鍵值對”,鍵與值之間用英文冒號隔開,多個鍵值對之間用英文逗號隔開。具體實例如下:>>>grade={"語文":67,"數(shù)學":91,"英語":78}

#鍵是字符串>>>grade{'語文':67,'數(shù)學':91,'英語':78}2.4.2組合數(shù)據(jù)類型集合集合(set)是一個無序的不重復元素序列。集合中的元素必須是不可變類型。在形式上,集合的所有元素都放在一對大括號“{}”中,兩個相鄰的元素之間使用逗號分隔。可以直接使用大括號{}創(chuàng)建集合,實例如下:>>>dayset={'Monday','Tuesday','Wednesday','Thursday','Friday','Saturday','Sunday'}>>>dayset{'Tuesday','Monday','Wednesday','Saturday','Thursday','Sunday','Friday'}在創(chuàng)建集合時,如果存在重復元素,Python只會自動保留一個,實例如下:>>>numset={2,5,7,8,5,9}>>>numset{2,5,7,8,9}2.4.3控制結(jié)構(gòu)結(jié)構(gòu)化程序設計的概念最早由艾茲格·迪科斯徹(E.W.Dijkstra)在1965年提出。該概念的提出是軟件發(fā)展的一個重要里程碑,它的主要觀點是采用“自頂向下、逐步求精”及模塊化的程序設計方法。在結(jié)構(gòu)化程序設計中,主要使用3種基本控制結(jié)構(gòu)來構(gòu)造程序,即順序結(jié)構(gòu)、選擇結(jié)構(gòu)和循環(huán)結(jié)構(gòu)。使用結(jié)構(gòu)化程序設計方法編寫出來的程序在結(jié)構(gòu)上具有以下特點:以控制結(jié)構(gòu)為單位,每個模塊只有一個入口和一個出口01能夠以控制結(jié)構(gòu)為單位,從上到下順序地閱讀程序文本02由于程序的靜態(tài)描述與執(zhí)行時的控制流程容易對應,所以閱讀者能夠方便、正確地理解程序的動作032.4.3控制結(jié)構(gòu)Python程序的控制結(jié)構(gòu)Python程序具有三種典型的控制結(jié)構(gòu):2.4.3控制結(jié)構(gòu)選擇語句選擇語句也稱為“條件語句”,就是對語句中不同條件的值進行判斷,從而根據(jù)不同的條件執(zhí)行不同的語句。選擇語句可以分為以下3種形式:簡單的if語句if…else語句if…elif…else多分支語句0201032.4.3控制結(jié)構(gòu)選擇語句【例2-5】使用if語句求出兩個數(shù)的較小值。01

#two_number.py02

a,b,c=4,5,003

ifa>b:04

c=b05

ifa<b:06

c=a07

print("兩個數(shù)的較小值是:",c)【例2-6】判斷一個數(shù)是奇數(shù)還是偶數(shù)。01

#odd_even.py02

a=503

ifa%2==0:04

print("這是一個偶數(shù)。")05

else:06

print("這是一個奇數(shù)。")2.4.3控制結(jié)構(gòu)選擇語句【例2-7】判斷每天上課的內(nèi)容。01

#lesson.py02

day=int(input("請輸入第幾天課程:"))03

ifday==1:04

print("第1天上數(shù)學課")05

elifday==2:06

print("第2天上語文課")07

else:08

print("其他時間上計算機課")2.4.3控制結(jié)構(gòu)循環(huán)語句循環(huán)語句就是重復執(zhí)行某段程序代碼,直到滿足特定條件為止。在Python語言中,循環(huán)語句有以下兩種形式:for循環(huán)語句02while循環(huán)語句012.4.3控制結(jié)構(gòu)循環(huán)語句【例2-8】用while循環(huán)實現(xiàn)計算1~99的整數(shù)和。01

#int_sum.py02

n=103

sum=004

while(n<=99):05

sum+=n06

n+=107

print("1~99的整數(shù)和是:",sum)【例2-9】用for循環(huán)實現(xiàn)計算1~99的整數(shù)和。01

#int_sum_for.py02

sum=003

forninrange(1,100):#range(1,100)用于生成1到100(不包括100)的整數(shù)04

sum+=n05

print("1到99的整數(shù)和是:",sum)2.4.4函數(shù)函數(shù)是可以重復使用的用于實現(xiàn)某種功能的代碼塊。與其他語言類似,在Python中,函數(shù)的優(yōu)點也是提高程序的模塊性和代碼復用性?!纠?-10】定義一個帶有參數(shù)的函數(shù)。01#i_like.py02#定義帶有參數(shù)的函數(shù)03deflike(language):04'''打印喜歡的編程語言!'''05print("我喜歡{}語言!".format(language))06return07#調(diào)用函數(shù)08like("C")09like("C#")10like("Python")上面代碼的執(zhí)行結(jié)果如下:我喜歡C語言!我喜歡C#語言!我喜歡Python語言!本章小結(jié)人工智能程序設計需要借助于計算機語言,比如高級編程語言C、C++、Java、Python等01近年來,Python的受歡迎程度越來越高,Python的簡單語法以及解釋型語言的本質(zhì),使它成為多數(shù)平臺上寫腳本和快速開發(fā)應用的首選編程語言02本章詳細介紹了Python語言的基礎知識,通過這些內(nèi)容,讀者可以順利開展后續(xù)章節(jié)的人工智能實驗林子雨副教授謝謝觀看!廈門大學謝謝!林子雨副教授廈門大學人工智能通識——基礎、技術(shù)、前沿、倫理與實踐第3章機器學習目錄01機器學習基本概念02sklearn簡介03監(jiān)督學習04無監(jiān)督學習05強化學習06人工神經(jīng)網(wǎng)絡和深度學習01機器學習基本概念Partone3.1機器學習基本概念什么是機器學習機器學習的四大類型機器學習的基本過程3.1.1什么是機器學習機器學習是人工智能領域中的一項關(guān)鍵技術(shù),它指的是計算機系統(tǒng)通過學習和經(jīng)驗積累來不斷提升其性能的過程簡單來說,機器學習就是讓計算機具備自我學習和改進的能力,從而模擬人類的思考和行為。機器學習涉及多個學科領域,包括統(tǒng)計學、概率論、優(yōu)化算法等。機器學習的核心在于構(gòu)建一個能夠從數(shù)據(jù)中學習的模型。這個模型通常是通過訓練數(shù)據(jù)來構(gòu)建的,訓練數(shù)據(jù)包含已知的輸入和輸出,機器學習算法會利用這些數(shù)據(jù)進行模型的參數(shù)調(diào)整和優(yōu)化,使得模型能夠更好地擬合數(shù)據(jù)的內(nèi)在規(guī)律。機器學習算法從大量數(shù)據(jù)中自動提取特征、發(fā)現(xiàn)規(guī)律根據(jù)規(guī)律對新數(shù)據(jù)進行預測或決策3.1.2機器學習的四大類型(有標簽)(有評級標簽)(無標簽)(有部分標簽)有監(jiān)督學習無監(jiān)督學習半監(jiān)督學習增強學習3.1.3機器學習的基本過程數(shù)據(jù)探索性分析模型訓練數(shù)據(jù)預處理建立模型特征工程交叉驗證模型評估02機器學習工具包sklearnParttwo3.2機器學習工具包sklearnsklearn是一個Python的第三方模塊,可以使用如下命令安裝sklearn:基于sklearn的機器學習的一般流程為:數(shù)據(jù)獲取—>數(shù)據(jù)預處理—>模型訓練—>模型評估—>模型優(yōu)化>pipinstallscikit-learn-i/simple/3.2機器學習工具包sklearn數(shù)據(jù)獲取可以導入內(nèi)部數(shù)據(jù)集、計算機生成的數(shù)據(jù)集、網(wǎng)絡上的數(shù)據(jù)集和文件中的數(shù)據(jù)集等。這里導入sklearn自帶的鳶尾花數(shù)據(jù)集,具體代碼如下:importnumpyasnpimportpandasaspdfromsklearnimportdatasetsiris=datasets.load_iris()#導入鳶尾花數(shù)據(jù)集iris.data#數(shù)據(jù)集iris['target']#標簽#利用DataFrame做可視化分析df=pd.DataFrame(iris.data,columns=iris.feature_names)#用鳶尾花的特征做列名df['target']=iris.target#把標簽集插入最后一列print(df.head())#顯示數(shù)據(jù)前五行3.2機器學習工具包sklearn數(shù)據(jù)預處理數(shù)據(jù)預處理包括:fromsklearnimportpreprocessingscaler=preprocessing.MinMaxScaler()#MinMaxScaler把樣本縮放到0~1之間scaler.fit(iris.data)#fit()函數(shù)可以找到數(shù)據(jù)的整體指標,如平均值、方差等data=scaler.transform(iris.data)#根據(jù)數(shù)據(jù)的整體指標對數(shù)據(jù)進行歸一化print(data)數(shù)據(jù)的標準化數(shù)據(jù)的歸一化數(shù)據(jù)的二值化非線性轉(zhuǎn)換數(shù)據(jù)特征編碼處理缺失值具體代碼如下:3.2機器學習工具包sklearn模型的訓練需要根據(jù)問題特點,選擇適當?shù)哪P汀.斍暗膯栴}是根據(jù)特征預測鳶尾花的類型,屬于帶標簽的分類問題,并且樣本個數(shù)為150個,小于100000,所以,可以選擇Linear_SVC模型進行分類。具體代碼如下:fromsklearn.model_selectionimporttrain_test_split#把樣本劃分為訓練集和測試集X_train,X_test,y_train,y_test=train_test_split(data,iris.target,test_size=1/3)print(len(X_train))print(len(X_test))#查看訓練集和測試集的樣本數(shù)量fromsklearnimportsvmclf=svm.SVC(kernel='linear',C=1.0,probability=True)#linear表示線性核函數(shù),probability表示是否采用概率估計clf.fit(X_train,y_train)#用訓練集訓練模型clf.predict(X_test)#預測測試集clf.get_params()#查看參數(shù)clf.predict_proba(X_test)#查看樣本屬于每個類型的概率print(clf.score(X_test,y_test))#查看模型預測的準確率,對不同類型的模型有不同的評分算法,由score方法內(nèi)部定義3.2機器學習工具包sklearn模型的評估模型的評估和模型的優(yōu)化相關(guān)功能在sklearn.model_selection中。除了使用estimator的score()函數(shù)簡單粗略地評估模型的質(zhì)量之外,sklearn.metrics模塊針對不同的問題類型提供了各種評估指標,并且可以創(chuàng)建用戶自定義的評估指標??梢圆捎媒徊骝炞C方法評估模型的泛化能力,有效地避免過度擬合。交叉驗證的基本思想是將原始數(shù)據(jù)進行分組,一部分做為訓練集來訓練模型,另一部分做為測試集來評價模型。交叉驗證用于評估模型的預測性能,尤其是訓練好的模型在新數(shù)據(jù)上的表現(xiàn),可以在一定程度上減小過擬合,還可以從有限的數(shù)據(jù)中獲取盡可能多的有效信息。使用sklearn.metrics模塊進行評估的代碼如下:fromsklearn.metricsimportclassification_reportprint(classification_report(iris.target,clf.predict(data),target_names=iris.target_names))#對全體數(shù)據(jù)集進行評估3.2機器學習工具包sklearn模型的評估采用k折交叉驗證方法評估模型的泛化能力的代碼如下:fromsklearn.model_selectionimportcross_val_score#cross_val_score可以用來做交叉驗證scores=cross_val_score(clf,data,iris.target,cv=5)#采用五折交叉驗證print(scores)#輸出每次評分3.2機器學習工具包sklearn模型的優(yōu)化優(yōu)化模型的方法包括:網(wǎng)格搜索法隨機搜索法模型特定交叉驗證信息準則優(yōu)化等網(wǎng)格搜索法在指定的超參數(shù)空間中對每一種可能的情況進行交叉驗證評分并選出最好的超參數(shù)組合。具體代碼如下:fromsklearnimportsvmfromsklearn.model_selectionimportGridSearchCVsvc=svm.SVC()#定義模型param_grid=[{'C':[0.1,1,10,100,1000],'kernel':['linear']},{'C':[0.1,1,10,100,1000],'gamma':[0.001,0.01],'kernel':['rbf']}]#超參數(shù)空間scoring='accuracy'#評分函數(shù)clf=GridSearchCV(svc,param_grid,scoring=scoring,cv=10)#得到一個優(yōu)化后的分類器clf.fit(X_train,y_train)#用數(shù)據(jù)訓練分類器print(clf.best_score_)#查看最優(yōu)得分03監(jiān)督學習Partthree3.3監(jiān)督學習回歸算法分類算法支持向量機KNN3.3.1回歸算法回歸算法線性回歸嶺回歸套索回歸彈性網(wǎng)絡回歸3.3.1回歸算法——1.線性回歸線性回歸(LinearRegression)是最為人熟知的一種建模技術(shù),是人們在學習預測模型時首選的技術(shù)之一。線性回歸本來是統(tǒng)計學里的概念,現(xiàn)在經(jīng)常被用在機器學習中。在這種技術(shù)中,因變量是連續(xù)的,自變量可以是連續(xù)的也可以是離散的,回歸線的性質(zhì)是線性的。定義對于線性回歸而言,如果2個或者多個變量之間存在“線性關(guān)系”,那么我們就可以通過歷史數(shù)據(jù),摸清變量之間的關(guān)系,建立一個有效的模型,來預測未來的變量結(jié)果?!熬€性關(guān)系”建模速度快,不需要很復雜的計算,在數(shù)據(jù)量大的情況下依然運行速度很快,并且可以根據(jù)系數(shù)給出每個變量的理解和解釋。它的缺點是不能很好地擬合非線性數(shù)據(jù),所以需要先判斷變量之間是否是線性關(guān)系。優(yōu)點3.3.1回歸算法——1.線性回歸模型原理3.3.1回歸算法——1.線性回歸模型原理3.3.1回歸算法——1.線性回歸模型原理即找到一條直線使得它盡可能擬合數(shù)據(jù)的分布(如圖所示),從而有一個新的樣本點時,可以利用學習到的這條直線進行預測。線性回歸用直線擬合散點3.3.1回歸算法——1.線性回歸模型原理既然是用直線擬合散點,就會存在多條直線都可以擬合數(shù)據(jù)的分布,畢竟數(shù)據(jù)不是真的落在一條直線上,而是分布在直線周圍。因此,就要找到一個評判標準,用于評價哪條直線的擬合程度是最高的,這時就要用到“損失函數(shù)”。損失函數(shù)是衡量回歸模型誤差的函數(shù),也就是判斷哪條“直線”擬合效果更好的評價標準。這個函數(shù)的值越小,說明直線越能擬合數(shù)據(jù)分布。3.3.1回歸算法——1.線性回歸模型原理3.3.1回歸算法——1.線性回歸sklearn實現(xiàn)sklearn提供了sklearn.linear_model.LinearRegression類來實現(xiàn)線性回歸,其定義如下:LinearRegression(*,fit_intercept=True,normalize=False,copy_X=True,n_jobs=None,positive=False)LinearRegression類的常用參數(shù)、方法分別如表所示。參數(shù)名稱含義fit_intercept是否計算該模型的截距。默認為True,如果使用中心化的數(shù)據(jù),可以考慮設置為False,不考慮截距normalize默認為False。當fit_intercept設置為False的時候,這個參數(shù)會被自動忽略。如果為True,模型會標準化輸入?yún)?shù)copy_X可選參數(shù),默認值為True;如果為True,x將被復制;否則被重寫n_jobs可選參數(shù),默認值為1;如果設為1,將啟動所有CPUpositive默認為False。如果positive=True,則強制將系數(shù)設為正數(shù)LinearRegression類的常用參數(shù)3.3.1回歸算法——1.線性回歸sklearn實現(xiàn)方法功能fit(X,y,[sample_weight])擬合線性模型,即訓練模型predict(X)利用訓練好的模型進行預測,返回預測的函數(shù)值score(X,y,[sample_weight])返回模型的得分,分數(shù)不超過1,越接近1說明模型預測效果越好LinearRegression類的常用方法3.3.1回歸算法——1.線性回歸實驗1:使用線性回歸模型預測房價這里利用sklearn提供的LinearRegression類構(gòu)建一個簡單的線性回歸模型,用于預測房價。具體代碼如下:fromsklearn.linear_modelimportLinearRegressionimportnumpyasnp#構(gòu)造樣本數(shù)據(jù)x=np.array([2014,2015,2016,2017,2018,2019,2020,2021,2022,2023])y=np.array([248000,306000,267000,312000,288000,261000,342000,331000,312000, 274000])#將樣本數(shù)據(jù)reshape為二維數(shù)組x=x.reshape((-1,1))#創(chuàng)建線性回歸模型model=LinearRegression()#將模型擬合到樣本數(shù)據(jù)上model.fit(x,y)#使用模型進行預測x_test=np.array([2024]).reshape((-1,1))y_predict=model.predict(x_test)#輸出預測結(jié)果print("預測房價為:",y_predict)3.3.1回歸算法——1.線性回歸實驗1:使用線性回歸模型預測房價下面我們采用繪圖的方式更加直觀地呈現(xiàn)預測結(jié)果,具體代碼如下:importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.linear_modelimportLinearRegression#生成樣本數(shù)據(jù)x=np.array([2014,2015,2016,2017,2018,2019,2020,2021,2022,2023])y=np.array([248000,306000,267000,312000,288000,261000,342000,331000,312000,274000])model=LinearRegression()#創(chuàng)建線性回歸模型model.fit(x.reshape(-1,1),y)#訓練模型y_predict=model.predict(x.reshape(-1,1))#預測結(jié)果plt.scatter(x,y,color='blue')#繪制散點圖plt.plot(x,y_predict,color='red')#繪制回歸線圖plt.xlabel('Year')#設置橫軸的名稱plt.ylabel('Price')#設置縱軸的名稱plt.show()#顯示圖形,如圖所示3.3.1回歸算法——1.線性回歸實驗2:對糖尿病數(shù)據(jù)集進行線性回歸分析下面再給出一個稍微復雜一點的應用實例,這里將使用sklearn庫中自帶的糖尿病數(shù)據(jù)集diabetes進行線性回歸分析。這個糖尿病數(shù)據(jù)集主要包括442行數(shù)據(jù),共有10個屬性值,分別是Age(年齡)、性別(Sex)、Bodymassindex(體質(zhì)指數(shù))、AverageBloodPressure(平均血壓)、S1(一年后疾病級數(shù)指標)、S2(一年后疾病級數(shù)指標)、S3(一年后疾病級數(shù)指標)、S4(一年后疾病級數(shù)指標)、S5(一年后疾病級數(shù)指標)、S6(一年后疾病級數(shù)指標)。數(shù)據(jù)集的目標變量是一年后患疾病的定量指標,因此,適合于線性回歸分析。3.3.1回歸算法——1.線性回歸實驗2:對糖尿病數(shù)據(jù)集進行線性回歸分析importnumpyasnpimportmatplotlib.pyplotaspltx=np.random.randn(10)y=x*2+1plt.plot(x,y)#繪圖plt.xlabel('X軸')#設置x軸的名稱plt.ylabel('Y軸')#設置y軸的名稱plt.xlim((-5,5))#設置x軸范圍plt.ylim((-5,10))#設置y軸范圍plt.rcParams['axes.unicode_minus']=Falseplt.show()fromsklearnimportdatasetsimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt3.3.1回歸算法——1.線性回歸實驗2:對糖尿病數(shù)據(jù)集進行線性回歸分析#導入diabetes數(shù)據(jù)集diabetes=datasets.load_diabetes()#將數(shù)據(jù)集轉(zhuǎn)換為DataFrame格式diabetes_df=pd.DataFrame(data=diabetes.data,columns=diabetes.feature_names)diabetes_df['target']=diabetes.target#查看數(shù)據(jù)集的前幾行print(diabetes_df.head())#準備自變量和因變量X=diabetes.datay=diabetes.targetprint(X[0],'\n',y[0])#把數(shù)據(jù)集分割成訓練集和測試集fromsklearn.model_selectionimporttrain_test_splitX_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)#test_size=0.2指定了測試集占總數(shù)據(jù)集的20%,剩余的80%將用作訓練集#random_state=42確保了每次代碼運行時數(shù)據(jù)集劃分的方式都相同,這有助于實驗的可重復性print(X_train.shape,X_test.shape,y_train.shape,y_test.shape)3.3.1回歸算法——1.線性回歸實驗2:對糖尿病數(shù)據(jù)集進行線性回歸分析#導入線性回歸模型fromsklearn.linear_modelimportLinearRegression#創(chuàng)建線性回歸模型對象model=LinearRegression()#在訓練集上擬合模型model.fit(X_train,y_train)#在測試集上進行預測y_predict=model.predict(X_test)print(y_predict.shape)print(y_predict[:10])#計算模型的均方誤差(MeanSquaredError)fromsklearn.metricsimportmean_squared_errormse=mean_squared_error(y_test,y_predict)print('均方誤差:',mse)plt.rcParams['font.sans-serif']=['FangSong']#設置中文字體#繪制預測值與真實值的散點圖plt.scatter(y_test,y_predict,color='blue')plt.plot([y_test.min(),y_test.max()],[y_test.min(),y_test.max()],'--k')plt.xlabel('真實值')plt.ylabel('預測值')plt.title('線性回歸')plt.show()#顯示圖形,如下頁圖所示3.3.1回歸算法——1.線性回歸實驗2:對糖尿病數(shù)據(jù)集進行線性回歸分析3.3.1回歸算法——2.嶺回歸模型原理3.3.1回歸算法——2.嶺回歸sklearn實現(xiàn)sklearn提供了sklearn.linear_model.Ridge類來實現(xiàn)嶺回歸,其定義如下:Ridge(alpha=1.0,fit_intercept=True,normalize=False,copy_X=True,max_iter=None,tol=0.001,solver='auto', random_state=None)3.3.1回歸算法——2.嶺回歸sklear

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論