2024人工智能研究框架_第1頁(yè)
2024人工智能研究框架_第2頁(yè)
2024人工智能研究框架_第3頁(yè)
2024人工智能研究框架_第4頁(yè)
2024人工智能研究框架_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

奔赴人工智能的星辰大?!斯ぶ悄苎芯靠蚣?024年08月16日人工智能研究框架培訓(xùn)目錄/CONTENTS01人工智能旨在利用計(jì)算機(jī)模擬和執(zhí)行各領(lǐng)域的智能任務(wù)人工智能發(fā)展史:人工智能發(fā)展已歷經(jīng)三次浪潮202算力是人工智能的基礎(chǔ)設(shè)施,算法是人工智能的靈魂03人工智能技術(shù)的應(yīng)用前景廣闊04人工智能研究框架培訓(xùn)01人工智能旨在利用計(jì)算機(jī)模擬和執(zhí)行各領(lǐng)域的智能任務(wù)3人工智能研究框架培訓(xùn)從日常生活中可以隨處瞥見(jiàn)人工智能的影子01人工智能在生活中的常見(jiàn)應(yīng)用:人臉識(shí)別考勤系統(tǒng)+APP智能推送人臉識(shí)別打卡人臉識(shí)別打卡是一種快速、高效的考勤方式,相比傳統(tǒng)的打卡方式,具有以下優(yōu)勢(shì):準(zhǔn)確率高:人臉識(shí)別技術(shù)可以在不同光線、角度、表情等情況下,準(zhǔn)確地識(shí)別員工的面部信息,避免了手工打卡時(shí)出現(xiàn)的誤差和作弊行為。安全性強(qiáng):人臉識(shí)別技術(shù)通過(guò)人臉特征識(shí)別,確保只有正式員工才能進(jìn)行考勤,防止了非法人員的進(jìn)入和作弊行為。便捷性高:人臉識(shí)別打卡無(wú)需員工攜帶打卡卡片或密碼,只需要站在識(shí)別設(shè)備前進(jìn)行識(shí)別即可,方便快捷。APP智能推送智能推送是一種機(jī)器學(xué)習(xí)方法,可以識(shí)別和預(yù)測(cè)各種用戶(hù)的興趣或偏好,從而有針對(duì)性地、及時(shí)地向用戶(hù)主動(dòng)推送所需信息,以滿(mǎn)足不同用戶(hù)的個(gè)性化需求。4人工智能研究框架培訓(xùn)人工智能旨在利用計(jì)算機(jī)能夠模擬和執(zhí)行各領(lǐng)域的智能任務(wù)01人工智能根據(jù)人類(lèi)經(jīng)驗(yàn)制定規(guī)則,讓計(jì)算機(jī)學(xué)習(xí)并預(yù)測(cè)未知

優(yōu)勢(shì):計(jì)算能力和存儲(chǔ)容量遠(yuǎn)超人類(lèi)腦力水平,可以處理海量

數(shù)據(jù)弊端:現(xiàn)實(shí)生活中很多經(jīng)由人類(lèi)經(jīng)驗(yàn)解決的問(wèn)題難以制定規(guī)則,也就無(wú)法轉(zhuǎn)換成機(jī)器語(yǔ)言讓其學(xué)習(xí)通過(guò)輸入大量資料數(shù)據(jù),讓計(jì)算機(jī)學(xué)習(xí)算法,總結(jié)出模型,之后再輸入相似樣本時(shí),就可以識(shí)別結(jié)果優(yōu)勢(shì):模仿人類(lèi)經(jīng)驗(yàn)學(xué)習(xí)的過(guò)程,無(wú)需人為制定規(guī)則現(xiàn)如今計(jì)算機(jī)的計(jì)算能力已非常強(qiáng)大,信息管理也越來(lái)越數(shù)據(jù)化,積累的資料越來(lái)越多,使我們有足夠多的數(shù)據(jù)可以喂給計(jì)算機(jī)進(jìn)行學(xué)習(xí)。正是這兩個(gè)因素的成熟,才使得當(dāng)下是人工智能爆發(fā)的時(shí)代。機(jī)器學(xué)習(xí)算法人工智能(Artificial

Intelligence,簡(jiǎn)稱(chēng)AI)是一門(mén)研究如何使計(jì)算機(jī)能夠模擬和執(zhí)行人類(lèi)智能任務(wù)的科學(xué)和技術(shù)領(lǐng)域。通俗來(lái)說(shuō)就是,先讓計(jì)算機(jī)進(jìn)行學(xué)習(xí),然后讓計(jì)算機(jī)預(yù)測(cè)未知。圖1:機(jī)器學(xué)習(xí)等算法和自我迭代是AI區(qū)別于傳統(tǒng)計(jì)算機(jī)傳統(tǒng)計(jì)算機(jī)程序

能力的主要因素5數(shù)據(jù)來(lái)源:國(guó)泰君安證券研究自我迭代人工智能研究框架培訓(xùn)人工智能涵蓋四大主要的功能維度01計(jì)算智能指對(duì)數(shù)據(jù)的基礎(chǔ)邏輯計(jì)算和統(tǒng)計(jì)分析;感知智能指基于視覺(jué)、聽(tīng)覺(jué)的信號(hào),對(duì)目標(biāo)進(jìn)行模式識(shí)別與分類(lèi);認(rèn)知智能指實(shí)現(xiàn)對(duì)信息的認(rèn)知、理解、推理和決策,并實(shí)現(xiàn)人、物、企業(yè)等智慧實(shí)體的認(rèn)知與協(xié)同;智能創(chuàng)造指利用人工智能技術(shù)進(jìn)行文學(xué)、藝術(shù)等方面的創(chuàng)造性創(chuàng)作以及工業(yè)領(lǐng)域的智能制造。它的出現(xiàn)不僅改變了傳統(tǒng)的創(chuàng)作方式、思維方式和工業(yè)模式,也為拓寬人類(lèi)的能力邊界增添了新的可能性。計(jì)算智能感知智能6認(rèn)知智能智能創(chuàng)造人工智能的功能維度從“計(jì)算→感知→認(rèn)知→創(chuàng)造”層層遞進(jìn)圖2:人工智能經(jīng)歷了四個(gè)能力維度的進(jìn)階人工智能研究框架培訓(xùn)計(jì)算智能是人工智能的基礎(chǔ)性功能,賦能產(chǎn)業(yè)領(lǐng)域較廣01人工智能在計(jì)算智能領(lǐng)域的實(shí)際應(yīng)用能帶來(lái)巨大產(chǎn)業(yè)價(jià)值計(jì)算智能,通常指基于清晰規(guī)則的數(shù)值運(yùn)算,比如數(shù)值加減、微積分、矩陣分解等。計(jì)算智能得益于計(jì)算機(jī)存儲(chǔ)與硬件的快速發(fā)展,已給互聯(lián)網(wǎng)、金融和工業(yè)等多個(gè)領(lǐng)域帶來(lái)產(chǎn)業(yè)價(jià)值。計(jì)算智能也面臨顯著困境。以金融場(chǎng)景為例,計(jì)算智能受限于指定的數(shù)據(jù)邏輯規(guī)則,雖計(jì)算智能可以高性能地計(jì)算

股票的統(tǒng)計(jì)特征,但無(wú)法運(yùn)用專(zhuān)家知識(shí),也難以進(jìn)行深度、動(dòng)態(tài)和啟發(fā)式的推理,對(duì)投資、博弈等業(yè)務(wù)貢獻(xiàn)的價(jià)值有限。計(jì)算智能所需的高性能硬件和網(wǎng)絡(luò)支持等,也給企業(yè)帶來(lái)了巨大的成本壓力。圖3:AI在計(jì)算智能領(lǐng)域的應(yīng)用可以賦能各大產(chǎn)業(yè)7人工智能研究框架培訓(xùn)感知智能開(kāi)始讓AI具備了模擬人類(lèi)的感知能力01智能交通通過(guò)感知交通狀況和行車(chē)習(xí)慣,智能交通系統(tǒng)可以提高交通效率和安全性智能家居通過(guò)感知用戶(hù)的行為和需求,智能家居可以自動(dòng)調(diào)整室溫、照明等設(shè)備,提高生活的舒適度智能醫(yī)療AI感知設(shè)計(jì)可以幫助醫(yī)療設(shè)備更好地理解患者的病情,從而提高醫(yī)療效率和安全性人工智能在感知智能領(lǐng)域的實(shí)際應(yīng)用開(kāi)始涉及到與人類(lèi)的交互感知智能,其核心在于模擬人的視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)等感知能力。感知智能目前用于完成人可以簡(jiǎn)單完成的重復(fù)度較高的工作,比如人臉識(shí)別、語(yǔ)音識(shí)別等。感知智能的核心業(yè)務(wù)目標(biāo)是提高效率且降低成本。圖4:AI的感知智能能夠針對(duì)人類(lèi)交互相關(guān)的產(chǎn)業(yè)領(lǐng)域產(chǎn)生巨大變革8人工智能研究框架培訓(xùn)認(rèn)知智能在前兩者基礎(chǔ)上,提升了對(duì)各類(lèi)信息的處理能力01智能客服通過(guò)語(yǔ)音或文字的方式與用戶(hù)交互并提供幫助智能搜索根據(jù)用戶(hù)的需求,從海量數(shù)據(jù)中精準(zhǔn)獲取相關(guān)信息智能翻譯將一種自然語(yǔ)言翻譯成另一種自然語(yǔ)言智能影像對(duì)腫瘤、病變等醫(yī)學(xué)圖像進(jìn)行分析和判斷智能駕駛利用視覺(jué)技術(shù)和傳感器管理車(chē)輛行駛?cè)斯ぶ悄茉谡J(rèn)知智能領(lǐng)域的實(shí)際應(yīng)用進(jìn)一步拓寬認(rèn)知智能需要具有對(duì)采集的信息進(jìn)行處理、存儲(chǔ)和轉(zhuǎn)化的能力,在這一階段需要運(yùn)用計(jì)算智能、感知智能的數(shù)據(jù)清洗、圖像識(shí)別能力。認(rèn)知智能需要擁有對(duì)業(yè)務(wù)需求的理解及對(duì)分散數(shù)據(jù)、知識(shí)的治理能力。認(rèn)知智能需要能夠針對(duì)業(yè)務(wù)場(chǎng)景進(jìn)行策略構(gòu)建和決策,提升人與機(jī)器、人與人、人與業(yè)務(wù)的協(xié)同、共享和博弈等能力。圖5:認(rèn)知智能的主要應(yīng)用場(chǎng)景如下所示9人工智能研究框架培訓(xùn)智能創(chuàng)造開(kāi)始讓AI具備了自主“生成式”(AIGC)的能力01人工智能的智能創(chuàng)造本質(zhì)上是一種“生成式”能力人工智能創(chuàng)造是指利用計(jì)算機(jī)程序和算法等技術(shù),讓計(jì)算機(jī)自動(dòng)地生成具有一定藝術(shù)性、創(chuàng)造性的作品,包括音樂(lè)、詩(shī)歌、繪畫(huà)、小說(shuō)等;AI創(chuàng)作的基礎(chǔ)是數(shù)據(jù)分析和模型訓(xùn)練。首先需要收集和整理有關(guān)主題、情感、語(yǔ)言等信息的數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法進(jìn)行訓(xùn)練,使得機(jī)器能夠自動(dòng)完成創(chuàng)作任務(wù)。這種方式不僅提高了創(chuàng)作效率,而且還能夠創(chuàng)造出更加精準(zhǔn)、深刻、個(gè)性化的作品。人工智能可以模仿人類(lèi)的創(chuàng)作過(guò)程,產(chǎn)生類(lèi)似于人類(lèi)創(chuàng)作的作品。這在文學(xué)、音樂(lè)、電影等領(lǐng)域都有廣泛的應(yīng)用。圖6:AI“生成式”下的創(chuàng)作場(chǎng)景部分如下所示10人工智能研究框架培訓(xùn)AIGC取長(zhǎng)補(bǔ)短,有望成為主流內(nèi)容生產(chǎn)模式01PGCUGCAIGC輔助由專(zhuān)業(yè)團(tuán)隊(duì)生產(chǎn),內(nèi)容質(zhì)量高?內(nèi)容生產(chǎn)門(mén)檻高,壟斷嚴(yán)重?生產(chǎn)周期長(zhǎng),難以滿(mǎn)足大規(guī)模生產(chǎn)需求電視,電影,游戲等短視頻,社交媒體文章,播客等創(chuàng)作工具下放,用戶(hù)可自行生產(chǎn)內(nèi)容,創(chuàng)作門(mén)檻、成本降低內(nèi)容生產(chǎn)參與者眾多,創(chuàng)作生態(tài)繁榮,個(gè)性化程度高?創(chuàng)作者參差不齊,內(nèi)容質(zhì)量不高AI輔助文字創(chuàng)作,圖片創(chuàng)作等AI技術(shù)學(xué)習(xí)的專(zhuān)業(yè)知識(shí)輔助內(nèi)容生產(chǎn)環(huán)節(jié),提高內(nèi)容質(zhì)量AI技術(shù)實(shí)現(xiàn)自動(dòng)化內(nèi)容生產(chǎn),減少創(chuàng)作耗時(shí),提高內(nèi)容生產(chǎn)規(guī)模天花板?人在關(guān)鍵環(huán)節(jié)依然需要輸入指令,沒(méi)有做到完全自主性AIGC11AI自主文字創(chuàng)作,圖片創(chuàng)作等實(shí)現(xiàn)完全自主性AIGC所屬內(nèi)容生產(chǎn)生態(tài)的發(fā)展經(jīng)歷了專(zhuān)家生產(chǎn)內(nèi)容(PGC)、用戶(hù)生成內(nèi)容(UGC)、AI輔助生產(chǎn)內(nèi)容、AI生產(chǎn)內(nèi)容(AIGC)四個(gè)階段,目前處于一、二階段為主,第三階段為輔的境況AIGC克服PGC與UGC存在的質(zhì)量、產(chǎn)量無(wú)法兼具的缺點(diǎn),其有望成為未來(lái)主流的內(nèi)容生產(chǎn)模式圖7:AIGC生態(tài)內(nèi)容生產(chǎn)模式理論上會(huì)經(jīng)歷四個(gè)發(fā)展階段人工智能研究框架培訓(xùn)AIGC興起背后是大模型的重大進(jìn)步,大模型是深度學(xué)習(xí)的重要成果01大模型生成式人工智能(AIGC)模型模型的本質(zhì)是對(duì)現(xiàn)實(shí)世界中數(shù)

據(jù)和規(guī)律的一種抽象和描述。模型的目的是為了從數(shù)據(jù)中找出一些規(guī)律和模式,并用這些規(guī)律和模式來(lái)預(yù)測(cè)未來(lái)的結(jié)果。12大模型是指具有非常大的參數(shù)數(shù)量的深度學(xué)習(xí)模型,通常具有數(shù)億到數(shù)萬(wàn)億參數(shù)。這些模型通常需要在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練,并且需要使用大量的計(jì)算資源進(jìn)行優(yōu)化和調(diào)整。生成式人工智能指基于人工智能通過(guò)已有數(shù)據(jù)尋找規(guī)律,并自動(dòng)生成內(nèi)容的生產(chǎn)方式。在大模型技術(shù)推動(dòng)下,AIGC有了飛速發(fā)展,我們熟知的ChatGPT就是基于大模型的

AIGC。大模型本質(zhì)上也是一種深度學(xué)習(xí)領(lǐng)域的算法,基于一個(gè)龐大復(fù)雜的神經(jīng)網(wǎng)絡(luò),需要通過(guò)存儲(chǔ)更多的參數(shù)來(lái)增加模型的深度和寬度,從而提高模型的表現(xiàn)能力,參數(shù)從百億起步,對(duì)大量數(shù)據(jù)進(jìn)行訓(xùn)練并產(chǎn)生高質(zhì)量的預(yù)測(cè)結(jié)果。圖8:大模型推動(dòng)AIGC的發(fā)展人工智能研究框架培訓(xùn)01人工智能人工智能三要素——算法,算力,數(shù)據(jù)算法算法(Algorithms):是指人工智能的實(shí)現(xiàn)方式,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言處理等。算法是人工智能的靈魂,能夠決定AI能力的

效率和準(zhǔn)確性。算力算力(Hardware):指的是計(jì)算機(jī)硬件資源,包括處理器、內(nèi)存、存儲(chǔ)等。算力是人工智能的基礎(chǔ)設(shè)施,能夠支持算法的運(yùn)行和處理數(shù)據(jù)。數(shù)據(jù)數(shù)據(jù)(Data)是指訓(xùn)練算法和實(shí)現(xiàn)算法所需的信息。數(shù)據(jù)可以是事實(shí)、圖像、聲音、文本等,能夠支持算法的訓(xùn)練和優(yōu)化。數(shù)據(jù)是人工智能的發(fā)展前提,是推動(dòng)人工智能發(fā)展的“原料”。實(shí)現(xiàn)AI

大模型能力的基礎(chǔ)是AI“三要素”:算力、算法、數(shù)據(jù)13人工智能研究框架培訓(xùn)算法是人工智能的靈魂所在01強(qiáng)化學(xué)習(xí)深度學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)習(xí)14......人工智能(本質(zhì)上就是能幫助人類(lèi)解決問(wèn)題的方法)機(jī)器學(xué)習(xí)(實(shí)現(xiàn)AI功能的主流算法之一)人工智能算法本質(zhì)上是幫助人類(lèi)解決相應(yīng)問(wèn)題的方式方法,它可以體現(xiàn)為數(shù)學(xué)方程、程序、工程架構(gòu)等等眾所周知,計(jì)算機(jī)最擅長(zhǎng)處理的是數(shù)字,所以我們可以將現(xiàn)實(shí)問(wèn)題 抽象為數(shù)學(xué)問(wèn)題,再讓計(jì)算機(jī)幫我們解決。那么,其中的關(guān)鍵就是 找到能夠準(zhǔn)確翻譯該問(wèn)題的數(shù)據(jù)公式,一般是某個(gè)函數(shù)關(guān)系

f(x) 。這個(gè)函數(shù)就叫做“算法/模型”。既然我們知道算法本質(zhì)就是函數(shù),那么影響算法準(zhǔn)確程度的因素是什么?答案就是函數(shù)的參數(shù)。而機(jī)器學(xué)習(xí)的本質(zhì)就是它是一種可以通過(guò)反復(fù)帶入數(shù)據(jù)從而自主調(diào)整參數(shù)的人工智能算法之一。機(jī)器學(xué)習(xí)不是某種具體的算法,而是很多算法的統(tǒng)稱(chēng)。機(jī)器學(xué)習(xí)下 的算法紛繁復(fù)雜,從學(xué)習(xí)方法上來(lái)分,機(jī)器學(xué)習(xí)又可以分為傳統(tǒng)機(jī) 器學(xué)習(xí)(監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí))、深度學(xué)習(xí)和強(qiáng)化 學(xué)習(xí)等等。圖9:人工智能的算法是其解決問(wèn)題的核心思路和手段數(shù)據(jù)來(lái)源:國(guó)泰君安證券研究人工智能研究框架培訓(xùn)強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)漸成主流01深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)深度強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)是一種通過(guò)與環(huán)境的交互學(xué)習(xí)最優(yōu)行為策略的算法。通俗地說(shuō),強(qiáng)化學(xué)習(xí)類(lèi)似于嬰兒學(xué)習(xí)和發(fā)現(xiàn)世界,如果有獎(jiǎng)勵(lì)(正強(qiáng)化),嬰兒可能會(huì)執(zhí)行一個(gè)行動(dòng),如果有懲罰(負(fù)強(qiáng)化),嬰兒就不太可能執(zhí)行這個(gè)行動(dòng)。強(qiáng)化學(xué)習(xí)在游戲、機(jī)器人控制和自動(dòng)駕駛等領(lǐng)域有廣泛應(yīng)用,比如熟知的AlphaGo。深度學(xué)習(xí)就是基于多層神經(jīng)網(wǎng)絡(luò)模型來(lái)學(xué)習(xí)數(shù)據(jù)表示和特征提取;所謂神經(jīng)網(wǎng)絡(luò),就是讓計(jì)算模仿大腦神經(jīng)元來(lái)感知信息的

一種方法。深度學(xué)習(xí)可以應(yīng)用于各種領(lǐng)域,例如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和語(yǔ)音識(shí)別等。力相結(jié)合,可以直接根據(jù)輸入的圖像進(jìn)行控制,是一種更接近人類(lèi)思維方式的人工智能算法。主流的深度強(qiáng)化學(xué)習(xí)算法DQN就是在現(xiàn)成的強(qiáng)化學(xué)習(xí)算法上,通過(guò)添加深度神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)一套新的深度強(qiáng)化學(xué)習(xí)算法。15強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)都是目前機(jī)器學(xué)習(xí)算法的主流分支,而深度強(qiáng)化學(xué)習(xí)則是博采眾長(zhǎng)的融合產(chǎn)物。圖10:強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)的解釋如下所示深度強(qiáng)化學(xué)習(xí)將深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能人工智能研究框架培訓(xùn)算力是人工智能的基礎(chǔ)設(shè)施01算力在人工智能領(lǐng)域扮演著至關(guān)重要的角色。算力在人工智能領(lǐng)域的作用是提供強(qiáng)大的計(jì)算資源,支持人工智能算法的訓(xùn)練、推理和預(yù)測(cè),處理大規(guī)模的數(shù)據(jù)集,優(yōu)化和調(diào)參模型,從而推動(dòng)人工智能技術(shù)的發(fā)展和應(yīng)用。圖11:算力在人工智能全生命周期中,都扮演著重要的支撐性角色訓(xùn)練深度學(xué)習(xí)模型16訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)需要大量的計(jì)算資源來(lái)處理大規(guī)模的數(shù)據(jù)集和復(fù)雜的模型結(jié)構(gòu)。高算力可以加快訓(xùn)練速度,從而提高模型的準(zhǔn)確性和性能。推理和預(yù)測(cè)在部署人工智能系統(tǒng)時(shí),需要進(jìn)行推理和預(yù)測(cè)。這需要對(duì)訓(xùn)練好的模型進(jìn)行實(shí)際應(yīng)用,并在實(shí)時(shí)或近實(shí)時(shí)的情況下對(duì)新數(shù)據(jù)進(jìn)行處理和響應(yīng)。高算力可以加快推理速度,使得人工智能系統(tǒng)能夠快速做出準(zhǔn)確的決策和預(yù)測(cè)。大規(guī)模數(shù)據(jù)處理人工智能應(yīng)用通常需要處理大規(guī)模的數(shù)據(jù)集,包括圖像、文本、語(yǔ)音等。算力可以加速數(shù)據(jù)的處理和分析,提取有用的特征和模式,從而支持更高級(jí)別的人工智能任務(wù),如圖像識(shí)別、自然語(yǔ)言處理和語(yǔ)音識(shí)別等。模型優(yōu)化和調(diào)參在人工智能領(lǐng)域,模型的優(yōu)化和調(diào)參是提高性能和準(zhǔn)確度的關(guān)鍵步驟。算力可以支 持對(duì)模型的超參數(shù)進(jìn)行優(yōu)化搜索,以找到最佳的配置。此外,算力還可以用于模型 架構(gòu)搜索和自動(dòng)化的機(jī)器學(xué)習(xí)流程,以提高模型的效果和效率。人工智能研究框架培訓(xùn)數(shù)據(jù)是人工智能發(fā)展的土壤01數(shù)據(jù)是指訓(xùn)練算法和實(shí)現(xiàn)算法所需的信息,它是訓(xùn)練模型推動(dòng)AI算法的土壤。數(shù)據(jù)是人工智能成長(zhǎng)的能源。人工智能的自我調(diào)整與學(xué)習(xí)的過(guò)程,本質(zhì)上是對(duì)大量數(shù)據(jù)進(jìn)行分析并找出規(guī)律,如無(wú)人車(chē)需要大量的試車(chē)數(shù)據(jù)不斷地測(cè)試算法,并在業(yè)務(wù)場(chǎng)景上形成自我改進(jìn)的反饋系統(tǒng)??梢?jiàn)如果沒(méi)有數(shù)據(jù)的場(chǎng)景不可能實(shí)現(xiàn)人工智能,數(shù)據(jù)就是人工智能的引爆點(diǎn)。數(shù)據(jù)是人工智能結(jié)果準(zhǔn)確的可靠性保證。對(duì)于人工智能結(jié)果的 可靠性,數(shù)據(jù)要素的豐富性和準(zhǔn)確性是關(guān)鍵,只有數(shù)據(jù)要素充分 、準(zhǔn)確,才能提高人工智能結(jié)果的準(zhǔn)確性。數(shù)據(jù)是人工智能應(yīng)用的創(chuàng)新基礎(chǔ)。在數(shù)據(jù)要素基礎(chǔ)上,人工智能應(yīng)用可以進(jìn)行跨學(xué)科的整合,輔助解決大量的實(shí)際問(wèn)題,如金融預(yù)測(cè)、物流運(yùn)輸、醫(yī)療診斷等,從而推動(dòng)了各個(gè)領(lǐng)域的創(chuàng)新發(fā)展。人工智能創(chuàng)新的基礎(chǔ)17數(shù)據(jù)圖12:數(shù)據(jù)相當(dāng)于人工智能領(lǐng)域的“石油資源”人工智能研究框架培訓(xùn)01NLP、CV等是AI技術(shù)的重要子領(lǐng)域。這些細(xì)分領(lǐng)域的技術(shù)專(zhuān)長(zhǎng),又會(huì)進(jìn)一步賦能產(chǎn)業(yè)應(yīng)用自然語(yǔ)言處理(NLP)在機(jī)器語(yǔ)言和人類(lèi)語(yǔ)言之間溝通的橋梁,以實(shí)現(xiàn)人機(jī)交流的目的隨著各類(lèi)算法的演繹和迭代,人工智能的子領(lǐng)域明朗化情感分析機(jī)器翻譯信息抽取智能推薦(RES)深度智能挖掘用戶(hù)和物品的關(guān)聯(lián)關(guān)系,將對(duì)應(yīng)場(chǎng)景的推薦結(jié)果推送給用戶(hù),

提升用戶(hù)體驗(yàn)和運(yùn)營(yíng)效率電子商務(wù)搜索引擎位置服務(wù)計(jì)算機(jī)視覺(jué)(CV)讓計(jì)算機(jī)和系統(tǒng)能夠從圖像、視頻和其他視覺(jué)輸入中獲取有意義的信息,并根據(jù)該信息采取行動(dòng)或提供建議圖像分類(lèi)目標(biāo)檢測(cè)目標(biāo)分割實(shí)例分割自動(dòng)駕駛自動(dòng)駕駛有四大核心支柱。感知、定位、規(guī)劃、控制。隨著神經(jīng)網(wǎng)絡(luò)的發(fā)展,深

度學(xué)習(xí)在這四大領(lǐng)域中發(fā)揮了重要作用感知定位規(guī)劃控制新聞推薦18人工智能研究框架培訓(xùn)AI

子領(lǐng)域——計(jì)算機(jī)視覺(jué)0101020304圖像分類(lèi)任務(wù)主要的目的是判斷一張圖片的主要類(lèi)別。圖像分類(lèi)可以是說(shuō)計(jì)算機(jī)視覺(jué)中最基礎(chǔ)的任務(wù)之一。19目標(biāo)檢測(cè)目標(biāo)檢測(cè)任務(wù)是給定一張圖像或是一個(gè)視頻幀,讓計(jì)算機(jī)定位出這個(gè)目標(biāo)的的位置并且知道目標(biāo)物是什么,即輸出目標(biāo)的Bounding

Box(邊框)以及標(biāo)簽。目標(biāo)分割目標(biāo)分割是檢測(cè)到圖像中的所有目標(biāo),解決“每一個(gè)像素屬于哪個(gè)目標(biāo)物或場(chǎng)景”的問(wèn)題,屬于像素級(jí)的,需要給出屬于每一類(lèi)的所有像素點(diǎn),而不是矩形框。實(shí)例分割實(shí)例分割其實(shí)就是目標(biāo)檢測(cè)和目標(biāo)分割的結(jié)合。相對(duì)目標(biāo)檢測(cè)的邊界框,實(shí)例分割可精確到物體的邊緣。相對(duì)目標(biāo)分割,實(shí)例分割需要標(biāo)注出圖上同一物體的不同個(gè)體。計(jì)算機(jī)視覺(jué)(Computervision,縮寫(xiě)作CV)是人工智能(AI)的一個(gè)重要應(yīng)用領(lǐng)域,是指讓計(jì)算機(jī)和系統(tǒng)能夠從圖像、視頻和其他視覺(jué)輸入中獲取有意義的信息,并根據(jù)該信息采取行動(dòng)或提供建議。目前主要有以下幾大基礎(chǔ)任務(wù):圖13:CV的應(yīng)用場(chǎng)景如下所示圖像分類(lèi)人工智能研究框架培訓(xùn)01AI

子領(lǐng)域————自然語(yǔ)言處理情感分析信息抽取機(jī)器翻譯,是指通過(guò)特定的計(jì)算機(jī)程序?qū)⒁环N書(shū)寫(xiě)形式或聲音形式的自然語(yǔ)言,翻譯成另一種書(shū)寫(xiě)形式或聲音形式的自然語(yǔ)言。目前,計(jì)算機(jī)主要能夠?qū)崿F(xiàn)語(yǔ)音翻譯、圖像翻譯、VR翻譯等。情感分析,即指通過(guò)計(jì)算技術(shù)對(duì)文本的主客觀性、觀點(diǎn)、情緒、極性的挖掘和分析,對(duì)文本的情感傾向做出分類(lèi)判斷。情感分析在評(píng)論機(jī)制的App中應(yīng)用較為廣泛。在互聯(lián)網(wǎng)輿情分析中,尤其是在選舉預(yù)測(cè)、股票預(yù)測(cè)等領(lǐng)域,情感分析起著舉足輕重的作用。信息抽取,指從文本中抽取出特定的事實(shí)信息。被抽取出來(lái)的信息通常以結(jié)構(gòu)化的形式直接存入數(shù)據(jù)庫(kù),可以供用戶(hù)查詢(xún)及進(jìn)一步分析使用,為之后構(gòu)建知識(shí)庫(kù)、智能問(wèn)答等提供數(shù)據(jù)支撐。機(jī)器翻譯20自然語(yǔ)言處理(英語(yǔ):NaturalLanguageProcessing,縮寫(xiě)作NLP)是人工智能和語(yǔ)言學(xué)領(lǐng)域的分支學(xué)科,是指讓計(jì)算機(jī)和系統(tǒng)能夠從文本和語(yǔ)音信號(hào)輸入中獲取有意義的信息,理解人類(lèi)語(yǔ)言,并作出決策。目前主要有以下幾大基礎(chǔ)任務(wù):圖14:NLP的應(yīng)用場(chǎng)景如下所示人工智能研究框架培訓(xùn)02人工智能發(fā)展已歷經(jīng)三次浪潮21人工智能研究框架培訓(xùn)“AI生成內(nèi)容”(AIGC)是AI發(fā)展到一定階段的必然產(chǎn)物圖15:全球人工智能產(chǎn)業(yè)關(guān)鍵事件時(shí)間軸如下圖所示0222從人工智能關(guān)鍵歷史事件可以看出,以大模型為基礎(chǔ)支撐的“AI生成內(nèi)容”(AIGC)功能是AI相關(guān)理論和技術(shù)發(fā)

展到一定階段的必然產(chǎn)物人工智能研究框架培訓(xùn)AIGC

是從早期的“決策型”AI發(fā)展演化而來(lái)02決策型AI利用機(jī)器學(xué)習(xí)技術(shù)學(xué)習(xí)數(shù)據(jù)分布,進(jìn)行如分類(lèi),預(yù)測(cè)等任務(wù)。發(fā)展過(guò)程中誕生了卷積神經(jīng)網(wǎng)絡(luò),殘差深度網(wǎng)絡(luò),Transformer網(wǎng)絡(luò)結(jié)構(gòu)等推薦系統(tǒng):挖掘用戶(hù)與物品的關(guān)聯(lián)關(guān)系人臉識(shí)別:根據(jù)輸入人臉信息進(jìn)行身 份判別文字識(shí)別:根據(jù)文字圖片輸出文本生成式AI(AIGC)在學(xué)習(xí)歸納數(shù)據(jù)分布的基礎(chǔ)上,學(xué)習(xí)數(shù)據(jù)產(chǎn)生的模式,并創(chuàng)造數(shù)據(jù)中不存在的新樣本。在分析式AI技術(shù)基礎(chǔ)上誕生大型

Transformer網(wǎng)絡(luò),Diffusion等新模型文字創(chuàng)作:通過(guò)提示文本生成完整文案圖像生成:根據(jù)關(guān)鍵信息生成風(fēng)格多 樣圖片,如博客配圖,海報(bào)圖片等代碼生成:根據(jù)上下文生成完整代碼AIGC(生成式AI

)起源于“決策型”AI,決策型AI發(fā)展過(guò)程中的技術(shù)積累為生成式AI的產(chǎn)生奠定基礎(chǔ)決策型AI其學(xué)習(xí)的知識(shí)局限于數(shù)據(jù)本身;生成式AI在總結(jié)歸納數(shù)據(jù)知識(shí)的基礎(chǔ)上可生成數(shù)據(jù)中不存在的樣本最新生成式AI技術(shù)如GAN,Diffusion等,催生多款A(yù)IGC產(chǎn)品如:OpenAI系列、DALL·E2(Diffusion),Starry

A.I.(基于GAN)等圖16:AIGC是在決策型AI的基礎(chǔ)上,學(xué)習(xí)數(shù)據(jù)產(chǎn)生模式,實(shí)現(xiàn)新樣本內(nèi)容的創(chuàng)造數(shù)據(jù)學(xué)習(xí)

數(shù)據(jù)學(xué)習(xí)+新數(shù)據(jù)生成

…23人工智能研究框架培訓(xùn)OpenAI

的ChatGPT也是“AI

生成內(nèi)容”(AIGC)浪潮的一部分02AIGC發(fā)展特點(diǎn)人工智能總體階段早期萌芽階段(20世紀(jì)50年代-90年代中期)快速發(fā)展階段(21世紀(jì)10年代中期-至今)受限于技術(shù)水平,AIGC僅限于小范圍實(shí)驗(yàn)AIGC從實(shí)驗(yàn)性向?qū)嵱眯赞D(zhuǎn)變,受限于算法瓶頸,無(wú)法直接進(jìn)行內(nèi)容生成沉淀積累階段(20世紀(jì)90年代-21世紀(jì)10年代中期)深度學(xué)習(xí)算法不斷迭代,人工智能生成內(nèi)容百花齊放AIGC典型事件1950年,艾倫·圖靈提出著名的“圖靈測(cè)試”,給出判斷機(jī)器是否具有“智能”的方法1966年,世界第一款可人機(jī)對(duì)話機(jī)器人“Eliza”問(wèn)世80年代中期,IBM創(chuàng)造語(yǔ)音控制打字機(jī)“Tangora”2012年,微軟展示語(yǔ)全自動(dòng)同聲傳譯系統(tǒng),可將英文語(yǔ)音自動(dòng)翻譯成中文語(yǔ)音2007年,世界上第一部完全由人工智能創(chuàng)作的小說(shuō)《1

The

Road》問(wèn)世2014年,LanJ.Goodfellow提出生成式對(duì)抗網(wǎng)絡(luò)GAN2018年,英偉達(dá)發(fā)布

StyleGAN模型用于自動(dòng)生成高質(zhì)量圖片2019年,DeepMind發(fā)布

DVD-GAN模型用于生成連續(xù)性視頻2022年,OpenAI發(fā)布

ChatGPT模型用于生成自然能語(yǔ)言文本圖17:隨著算法的不斷迭代,人工智能主動(dòng)生成內(nèi)容(AIGC)技術(shù)不斷發(fā)展24人工智能研究框架培訓(xùn)以ChatGPT為例,其也是基于NLP模型逐步進(jìn)化而來(lái)02GPT-1(1.17億參數(shù))GPT-1有一定的泛化能力,能夠用于和監(jiān)督任務(wù)無(wú)關(guān)的NLP任務(wù)中2018201920202022.01GPT-2(15億參數(shù))除了理解能力外,GPT-2在生成方面表現(xiàn)出了

強(qiáng)大的天賦:閱讀摘要、聊天、續(xù)寫(xiě)、編故事,甚至可以生成假新聞、釣魚(yú)郵件或在線進(jìn)行角色扮演GPT-3(1750億參數(shù))GPT-3作為一個(gè)自監(jiān)督模型,可以完成自然語(yǔ)言處理的絕大部分任務(wù):將網(wǎng)頁(yè)描述轉(zhuǎn)換為相應(yīng)代碼、模仿人類(lèi)敘事、創(chuàng)作定制詩(shī)歌、生成游戲劇本,甚至模仿已故的哲學(xué)家預(yù)測(cè)生命的真諦InstructGPTInstructGPT是一個(gè)經(jīng)過(guò)微調(diào)的新版GPT-3,可以將有害的、不真實(shí)的和有偏差的輸出最小化ChatGPTChatGPT是InstructGPT的衍生產(chǎn)品,它將人類(lèi)的反饋納入訓(xùn)練過(guò)程,更好地使模型輸出與用戶(hù)意圖保持一致2022.1225GPT模型是一種自然語(yǔ)言處理(NLP)模型,使用多層變換器(Transformer)來(lái)預(yù)測(cè)下一個(gè)單詞的概率分布,通過(guò)訓(xùn)練在大型文本語(yǔ)料庫(kù)上學(xué)習(xí)到的語(yǔ)言模式來(lái)生成自然語(yǔ)言文本從GPT-1

到GPT-3

智能化程度不斷提升,ChatGPT

的到來(lái)也是GPT-4

正式推出之前的序章圖18:ChatGPT由GPT-1到InstructGPT模型的不斷成熟而逐步形成26人工智能研究框架培訓(xùn)2022年總結(jié)來(lái)看,人工智能的歷史沿革本質(zhì)上是技術(shù)的進(jìn)化演繹02GPT-1GPT-2GPT-3Instruc-tGPTT5BARTM2m-100BigBirdBERTRoBERTaXLMALBERTELECTRATransfo-rmerCNNRNN神經(jīng)網(wǎng)絡(luò)MachineLearning基于規(guī)則的少量數(shù)據(jù)處理1950年開(kāi)始1980年開(kāi)始1990年開(kāi)始;2006年獲得突破2017年2018年2019年2020年基于模板和規(guī)則的前深度學(xué)習(xí)階段根據(jù)一定范圍的數(shù)據(jù)進(jìn)行參數(shù)分類(lèi)開(kāi)始模仿人腦進(jìn)行大量數(shù)據(jù)的標(biāo)記和訓(xùn)練對(duì)人腦學(xué)習(xí)過(guò)程進(jìn)行重點(diǎn)關(guān)注進(jìn)行海量數(shù)據(jù)學(xué)習(xí)訓(xùn)練,人類(lèi)的反饋信息成為模型學(xué)習(xí)的內(nèi)容ChatGPT圖19:ChatGPT經(jīng)過(guò)多類(lèi)技術(shù)積累,最終形成針對(duì)人類(lèi)反饋信息學(xué)習(xí)的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型GANGPT-4近期興起的以ChatGPT為代表的大模型,是來(lái)自于機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)以及Transformer模型的多種技術(shù)的積累2023年人工智能研究框架培訓(xùn)03算力是人工智能的基礎(chǔ)設(shè)施,算法是人工智能的靈魂27人工智能研究框架培訓(xùn)算力是AI產(chǎn)業(yè)發(fā)展的根基03算力是承載人工智能應(yīng)用發(fā)展的基礎(chǔ),是人工智能最核心的要素?cái)?shù)據(jù)的快速增長(zhǎng)對(duì)算力發(fā)展提出更高要求。隨著信息化、數(shù)字化的持續(xù)推進(jìn),全球新產(chǎn)生的數(shù)據(jù)量正在快速增長(zhǎng),根據(jù)IDC數(shù)據(jù)顯示,

2021年全球新增數(shù)據(jù)總量達(dá)到84.5

ZB,預(yù)計(jì)到2026年全球新增數(shù)據(jù)總量將達(dá)到221.2

ZB,2021年至2026年間的年復(fù)合增速達(dá)到21.22%新應(yīng)用場(chǎng)景的出現(xiàn)對(duì)數(shù)據(jù)實(shí)時(shí)性要求更高,從而使得邊緣計(jì)算能力變得愈發(fā)重要,人工智能應(yīng)用也越來(lái)越依賴(lài)邊緣算力支撐。算法模型的復(fù)雜化和巨量化需要更強(qiáng)算 力的支撐。近些年,算法模型的參數(shù)量 和復(fù)雜程度都在呈現(xiàn)指數(shù)級(jí)增長(zhǎng)態(tài)勢(shì), 尤其是自然語(yǔ)言處理等新興認(rèn)知智能領(lǐng) 域?qū)λ懔Φ囊筮h(yuǎn)超圖像識(shí)別和語(yǔ)音識(shí) 別等傳統(tǒng)AI領(lǐng)域數(shù)據(jù)28算法算力、算法和數(shù)據(jù)是人工智能產(chǎn)業(yè)發(fā)展的三個(gè)核心要素,在三大要素中,算力才是最核心的要素?cái)?shù)據(jù)的生產(chǎn)不再是問(wèn)題,如何處理、分析和使用數(shù)據(jù)才是問(wèn)題。算法經(jīng)歷了數(shù)十年的發(fā)展,在深度學(xué)習(xí)和加速計(jì)算出現(xiàn)之后,得到了迅速的發(fā)展和優(yōu)化算力是承載和推動(dòng)人工智能走向?qū)嶋H應(yīng)用的決定性力量算力圖20:算力是AI產(chǎn)業(yè)發(fā)展的根基人工智能研究框架培訓(xùn)算力提升有極強(qiáng)的經(jīng)濟(jì)效益03數(shù)據(jù)來(lái)源:《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》,國(guó)泰君安證券研究29算力的經(jīng)濟(jì)效益使其成為各國(guó)政策支持的重點(diǎn)根據(jù)清華大學(xué)全球產(chǎn)業(yè)院與浪潮信息聯(lián)合發(fā)布的《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》,通過(guò)對(duì)全球15個(gè)重點(diǎn)國(guó)家的計(jì)算力指數(shù)與數(shù)字經(jīng)濟(jì)及GDP的回歸分析,得到15個(gè)重點(diǎn)國(guó)家的計(jì)算力指數(shù)平均每提高1點(diǎn),國(guó)家的數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.5‰和1.8‰進(jìn)一步研究發(fā)現(xiàn),當(dāng)一個(gè)國(guó)家計(jì)算力指數(shù)分別達(dá)到40分及60分以上時(shí),計(jì)算力指數(shù)每提升1點(diǎn),其對(duì)GDP增長(zhǎng)的推動(dòng)力將分別增加到1.5倍及3倍。智能算力提升具備重大經(jīng)濟(jì)效益,對(duì)算力基礎(chǔ)設(shè)施發(fā)展的支持性政策成為各國(guó)政策的重點(diǎn)。圖21:算力提升具有極強(qiáng)的經(jīng)濟(jì)效益人工智能研究框架培訓(xùn)AI

數(shù)據(jù)中心需求激增,AI

服務(wù)器快速放量03網(wǎng)絡(luò)寬帶計(jì)算能力用于大規(guī)模并行計(jì)算,處理復(fù)雜機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的高性能計(jì)算設(shè)備(如GPU和特定的AI芯片)用于快速數(shù)據(jù)傳輸和通信的高網(wǎng)絡(luò)帶寬、低延遲網(wǎng)絡(luò),以滿(mǎn)足對(duì)數(shù)據(jù)傳輸速度的敏感需求儲(chǔ)存需求用于存儲(chǔ)大規(guī)模數(shù)據(jù)集的大容量、高速存儲(chǔ)軟件支持針對(duì)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)的軟件支持,包括專(zhuān)門(mén)的AI框架、庫(kù)和工具,以及優(yōu)化的軟件棧和分布式計(jì)算平臺(tái),以提高計(jì)算效率和性能30AI

數(shù)據(jù)中心是專(zhuān)門(mén)用于支持人工智能計(jì)算和數(shù)據(jù)處理任務(wù)的設(shè)施或物理空間AI

數(shù)據(jù)中心通常擁有大量高性能的服務(wù)器、GPU

加速器和專(zhuān)門(mén)的存儲(chǔ)系統(tǒng),以提供強(qiáng)大的計(jì)算能力并加速深度學(xué)習(xí)AI

數(shù)據(jù)中心配備了高速的網(wǎng)絡(luò)設(shè)備和優(yōu)化的軟件框架,以支持高效的數(shù)據(jù)傳輸和算法訓(xùn)練通過(guò)這些專(zhuān)門(mén)的配置和優(yōu)化,AI

數(shù)據(jù)中心能夠?yàn)楦鞣N規(guī)模和復(fù)雜度的AI

工作負(fù)載提供可靠穩(wěn)定的計(jì)算環(huán)境,并滿(mǎn)足大規(guī)模數(shù)據(jù)存儲(chǔ)、備份和分析的需求AI

數(shù)據(jù)中心在推動(dòng)人工智能技術(shù)的發(fā)展和應(yīng)用方面起到關(guān)鍵作用,為各行各業(yè)的AI

應(yīng)用和服務(wù)提供了強(qiáng)大的支持圖22:AI數(shù)據(jù)中心比普通數(shù)據(jù)中心需要更好的計(jì)算能力、存儲(chǔ)需求、網(wǎng)絡(luò)帶寬和軟件支持人工智能研究框架培訓(xùn)AI

數(shù)據(jù)中心需求激增,AI

服務(wù)器快速放量03大模型的出現(xiàn)和技術(shù)創(chuàng)新對(duì)AI數(shù)據(jù)中心的發(fā)展起到推動(dòng)作用大模型的出現(xiàn)帶來(lái)了算力的增量需求根據(jù)OpenAI

發(fā)布的有關(guān)GPT-3模型的文檔,它包含1750

億個(gè)參數(shù),需要進(jìn)行數(shù)千萬(wàn)次的計(jì)算操作來(lái)完成一次推理任務(wù)ChatGPT

的總算力消耗約為3640PF-days,需要7~8

個(gè)投資規(guī)模30

億、單體算力500P

的數(shù)據(jù)中心才能支撐運(yùn)行,這樣的規(guī)模和復(fù)雜性需要高

性能的計(jì)算設(shè)備和大規(guī)模的并行計(jì)算能力,帶動(dòng)了AI

數(shù)據(jù)中心需求的增長(zhǎng)新的處理器架構(gòu)、高速網(wǎng)絡(luò)、存儲(chǔ)技術(shù)以及更高效的冷卻和能源管理系統(tǒng)的出現(xiàn),提升了數(shù)據(jù)中心的性能和效率,為AI

數(shù)據(jù)中心的發(fā)展提供了技術(shù)支持圖23:大模型時(shí)代使算力需求翻倍提升31數(shù)據(jù)來(lái)源:IJCNN32人工智能研究框架培訓(xùn)AI

服務(wù)器中,GPU

價(jià)值量最大03可以將數(shù)據(jù)存儲(chǔ)在本地,利用本地的計(jì)算資源進(jìn)行

AI模型的訓(xùn)練和推理保證數(shù)據(jù)的安全性和隱私性可能受限于本地的存儲(chǔ)和計(jì)算能力混合架構(gòu)基于云平臺(tái)的架構(gòu)使用遠(yuǎn)程存儲(chǔ)技術(shù)和混合云存儲(chǔ)(一種聯(lián)合本地存儲(chǔ)和云存儲(chǔ)的技術(shù))進(jìn)行數(shù)據(jù)存儲(chǔ),利用云端的計(jì)算資源進(jìn)行AI模型的訓(xùn)練和推理提供彈性的存儲(chǔ)和計(jì)算能力可能存在數(shù)據(jù)的安全性和隱私性問(wèn)題描述優(yōu)點(diǎn)缺點(diǎn)AI

服務(wù)器是AI

數(shù)據(jù)中心重要的組成部分AI

服務(wù)器是專(zhuān)門(mén)為人工智能應(yīng)用而設(shè)計(jì)和配置的服務(wù)器,具備強(qiáng)大的計(jì)算能力和高效的數(shù)據(jù)處理能力,是執(zhí)行AI

任務(wù)和處理大規(guī)模數(shù)據(jù)的關(guān)鍵組件,為數(shù)據(jù)中心提供計(jì)算資源和算力,用于執(zhí)行復(fù)雜的AI

算法和模型。AI

服務(wù)器有兩種主要架構(gòu):混合架構(gòu)和基于云平臺(tái)的架構(gòu)。圖24:AI服務(wù)器主要使用混合架構(gòu)和云平臺(tái)架構(gòu)人工智能研究框架培訓(xùn)AI

服務(wù)器中,GPU

價(jià)值量最大03主板是AI服務(wù)器的核心電路板,連接各個(gè)部件并提供電源和數(shù)據(jù)傳輸?shù)慕涌?,承載著CPU、內(nèi)存插槽、擴(kuò)展插槽和其他重要組件33電源提供服務(wù)器所需的電能,確保各個(gè)組件正常運(yùn)行機(jī)箱是AI服務(wù)器的外部框架,提供支撐和保護(hù)內(nèi)部組件的結(jié)構(gòu)背板提供連接各個(gè)部件的接口,而布線則用于傳輸電力和數(shù)據(jù)信號(hào)散熱系統(tǒng)用于控制服務(wù)器的溫度并保持其在安全范圍內(nèi)運(yùn)行。散熱片吸收和分散熱量,而風(fēng)扇則提供氣流來(lái)冷卻服務(wù)器內(nèi)部。內(nèi)存(RAM)用于臨時(shí)存儲(chǔ)數(shù)據(jù)和程序代碼,提供快速的數(shù)據(jù)訪問(wèn)和處理能力。AI服務(wù)器通常配備大容量的內(nèi)存,以支持大規(guī)模的數(shù)據(jù)集和模型CPU負(fù)責(zé)執(zhí)行計(jì)算任務(wù)和處理數(shù)據(jù),是服務(wù)器的主要計(jì)算引擎,可以進(jìn)行復(fù)雜的算法和模型運(yùn)算加速卡(如GPU、TPU)提供高性能的并行計(jì)算能力,用于加速機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù),可以加快模型訓(xùn)練和推理的速度AI

服務(wù)器中的主要元器件包括CPU、GPU

板組、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)接口卡、機(jī)箱、主板、散熱系統(tǒng)和電源圖25:AI服務(wù)器拆箱圖如下所示人工智能研究框架培訓(xùn)AI

服務(wù)器中,GPU

價(jià)值量最大03GPU

是AI

服務(wù)器中價(jià)值量最高的部件,承擔(dān)了大部分的計(jì)算任務(wù)和深度學(xué)習(xí)模型的訓(xùn)練與推理圖26:整個(gè)AI硬件產(chǎn)業(yè)鏈中的各個(gè)環(huán)節(jié)緊密合作,共同構(gòu)建了支持AI應(yīng)用和服務(wù)的完整生態(tài)系統(tǒng)AI服務(wù)器GPU電源網(wǎng)絡(luò)設(shè)備存儲(chǔ)CPU冷卻系統(tǒng)在整個(gè)AI服務(wù)器的投入比例中,

GPU通常占據(jù)較大的比例,大約在整體投入的30%至60%之間。

GPU提供了強(qiáng)大的并行計(jì)算能力和高效的深度學(xué)習(xí)加速,是實(shí)現(xiàn)高性能AI計(jì)算的關(guān)鍵。CPU作為服務(wù)器的核心計(jì)算單元發(fā)揮著重要作用,而存儲(chǔ)、網(wǎng)絡(luò)設(shè)備、冷卻系統(tǒng)和電源等則在支持和維護(hù)服務(wù)器功能上起到關(guān)鍵作用。34其他部件在整體投入中比例相對(duì)較小,但它們同樣是確保服務(wù)器正常運(yùn)行和數(shù)據(jù)中心高效運(yùn)作的必要組成部分人工智能研究框架培訓(xùn)AIGC拉動(dòng)AI算力需求,AI芯片將成為未來(lái)科技石油03基于APU架構(gòu)的MI300預(yù)計(jì)于年底開(kāi)始應(yīng)用于超級(jí)計(jì)算機(jī)隨著AI進(jìn)入“大模型”時(shí)代,訓(xùn)練數(shù)據(jù)不斷增長(zhǎng)、算法復(fù)雜度不斷提高,國(guó)內(nèi)人工智能廠商對(duì)算力的需求陡升。AI芯片作為大模型及AI應(yīng)用落地的算力基礎(chǔ),重要性日益凸顯。廣義的AI芯片指專(zhuān)門(mén)用于處理人工智能應(yīng)用中大量計(jì)算任務(wù)的模塊,即面向人工智能領(lǐng)域的芯片均被稱(chēng)為AI芯片。狹義的AI芯片即針對(duì)人工智能算法做了特殊加速設(shè)計(jì)的芯片。狹義的AI芯片與傳統(tǒng)芯片(如CPU)相比,性能優(yōu)勢(shì)主要體現(xiàn)在專(zhuān)用性的側(cè)重上。圖27:AI芯片產(chǎn)業(yè)鏈較為復(fù)雜IP授權(quán)設(shè)計(jì)晶圓代工AI芯片云端/邊緣端終端訓(xùn)練推理智能汽車(chē)智能手機(jī)AIoT機(jī)器人35人工智能研究框架培訓(xùn)AIGC拉動(dòng)AI算力需求,AI芯片將成為未來(lái)科技石油0336AI

芯片主要分為三種類(lèi)型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)三類(lèi)芯片代表分別有英偉達(dá)(NVIDIA)的GPU、賽靈思的FPGA和Google的TPU。GPU的計(jì)算能力最強(qiáng),但是成本高、功耗高;FPGA可編程,最靈活,但是計(jì)算能力不強(qiáng);ASIC體積小、功耗低,適合量產(chǎn),但是研發(fā)時(shí)間長(zhǎng),且不可編輯,前期投入成本高,帶來(lái)一定的技術(shù)風(fēng)險(xiǎn)。表1:AI芯片分為GPU、FPGA、ASIC三種類(lèi)型GPUFPGAASIC定制化程度通用型半定制化定制化靈活性好好不好成本高較高低編程語(yǔ)言/架構(gòu)CUDA,OpenCL等Verilog/VHDL等硬件描述語(yǔ)言,OpenCL、HLS/功耗大較大小主要優(yōu)點(diǎn)峰值計(jì)算能力強(qiáng),產(chǎn)品成熟平均性能較高,功耗較低,靈活性強(qiáng)平均性能很強(qiáng),功耗很低,體積小主要缺點(diǎn)效率不高,不可編輯,功耗高量產(chǎn)單價(jià)高,峰值計(jì)算能力較低,編程語(yǔ)言難度大前期投入成本高,不可編輯,研發(fā)時(shí)間長(zhǎng),技術(shù)風(fēng)險(xiǎn)大主要應(yīng)用場(chǎng)景云端訓(xùn)練,云端推理云端推理,終端推理云端訓(xùn)練,云端推理,終端推理人工智能研究框架培訓(xùn)AIGC拉動(dòng)AI算力需求,AI芯片將成為未來(lái)科技石油03針對(duì)不同技術(shù)路徑,國(guó)內(nèi)廠商均已有所布局GPU:國(guó)內(nèi)GPU廠商已有部分產(chǎn)品落地,國(guó)產(chǎn)GPU迎來(lái)黃金發(fā)展期圖28:國(guó)內(nèi)GPU企業(yè)迎來(lái)較快發(fā)展景嘉微自主研發(fā)了一系列GPU芯片,包括JM54系列、JM72系列、JM92系列三代GPU產(chǎn)品37場(chǎng)的局面,并不斷研發(fā)更為先進(jìn)的JM7200和JM9系列公司于

2014

年成功研發(fā)出國(guó)內(nèi)首顆國(guó)

2022

年5月,公司M9系列第二款產(chǎn)高性能、低功耗GPU

芯片JM5400,

圖形處理芯片成功研發(fā),可以滿(mǎn)足地打破了國(guó)外產(chǎn)品長(zhǎng)期壟斷我國(guó)GPU

理信息系統(tǒng)、媒體處理、CAD

輔助設(shè)計(jì)、游戲、虛擬化等高性能顯示需求和人工智能計(jì)算需求,可廣泛應(yīng)用于各種設(shè)備海光DCU系列產(chǎn)品以基于通用的

GPGPU架構(gòu),采用7nm工藝,兼容“類(lèi)

CUDA”環(huán)境以及國(guó)際主流商業(yè)計(jì)算軟件和人工智能軟件,軟硬件生態(tài)豐富海光DCU系列產(chǎn)品深算一號(hào)已經(jīng)實(shí)現(xiàn)商業(yè)化應(yīng)用,于2021年實(shí)現(xiàn)規(guī)?;鲐洠磥?lái)將廣泛應(yīng)用于大數(shù)據(jù)處理、人工智能、商業(yè)計(jì)算等領(lǐng)域其產(chǎn)品性能達(dá)到了國(guó)際上同類(lèi)型主流高端處理器的水平,具有較強(qiáng)的并行計(jì)算能力和較高的能效比,在國(guó)內(nèi)處于領(lǐng)先地位人工智能研究框架培訓(xùn)AIGC拉動(dòng)AI算力需求,AI芯片將成為未來(lái)科技石油03針對(duì)不同技術(shù)路徑,國(guó)內(nèi)廠商均已有所布局表2:ASIC:國(guó)內(nèi)ASIC廠商實(shí)力雄厚,積極追趕國(guó)外芯片巨頭圖29:CPU+FPGA:國(guó)內(nèi)巨頭紛紛布局CPU+FPGA的混合異構(gòu)加速AI計(jì)算38此前被全球最大

FPGA廠商賽靈思收購(gòu)的深鑒科技也基于FPGA來(lái)設(shè)計(jì)深度學(xué)習(xí)的加速器架構(gòu)數(shù)據(jù)來(lái)源:國(guó)泰君安證券研究全球科技巨頭紛紛布局云端FPGA生態(tài),國(guó)內(nèi)包括騰訊云、阿里云均在2017年推出了基于FPGA的服務(wù),百度大腦也使用了FPGA芯片人工智能研究框架培訓(xùn)AIGC拉動(dòng)AI算力需求,AI芯片將成為未來(lái)科技石油03FPGA方案及ASIC方案成本曲線存在差異ASIC無(wú)法重新編程前期投入成本較高39ASIC具備性能更強(qiáng)、體積更小、功耗更低、成本更低、可靠性更髙等優(yōu)點(diǎn),將更具備一定競(jìng)爭(zhēng)優(yōu)勢(shì)實(shí)現(xiàn)專(zhuān)用算法“硬件優(yōu)化”,ASIC路線在AI領(lǐng)域的長(zhǎng)期成長(zhǎng)性值得期待圖30:ASIC路線在AI領(lǐng)域的長(zhǎng)期成長(zhǎng)性值得期待4人工智能研究框架培訓(xùn)要解決人類(lèi)指定的各類(lèi)任務(wù),先要讓計(jì)算機(jī)模擬人類(lèi)的學(xué)習(xí)機(jī)制03人類(lèi)跟計(jì)算機(jī)的能力維度各有優(yōu)勢(shì),讓計(jì)算機(jī)學(xué)習(xí)和模擬人類(lèi)的解決問(wèn)題的方法是各類(lèi)算法的起點(diǎn)人類(lèi)會(huì)非常容易的辨別出垃圾郵件與貓狗,但是讓計(jì)算機(jī)做卻非常困難,因?yàn)檫@與發(fā)明計(jì)算機(jī)的最初任務(wù)有本質(zhì)區(qū)別。比如對(duì)1億數(shù)據(jù)進(jìn)行混合四則運(yùn)算或大小排序,這些任務(wù)讓人類(lèi)執(zhí)行會(huì)非常低效,但計(jì)算機(jī)卻可以快速完成。而人工智能要處理的任務(wù)與計(jì)算機(jī)最初的任務(wù)恰好相反。這就促使了讓人們思考人類(lèi)到底是怎么進(jìn)行學(xué)習(xí)的。人類(lèi)的學(xué)習(xí)機(jī)制:嬰兒根本不知道貓狗到現(xiàn)在我們可以一眼分辨出貓狗,是一個(gè)經(jīng)驗(yàn)學(xué)習(xí)過(guò)程:首先需要一定的樣本資料,從小可能在電視中、現(xiàn)實(shí)中或圖書(shū)中或家長(zhǎng)教育中獲得大量信息,然后大腦將接受的信息進(jìn)行學(xué)習(xí)、歸納、整理、總結(jié),最后形成我們的知識(shí)與經(jīng)驗(yàn)。對(duì)于計(jì)算機(jī),它的優(yōu)勢(shì)是計(jì)算能力非常強(qiáng),可以處理海量數(shù)據(jù)。我們需要給它提供成千上萬(wàn)的資料數(shù)據(jù)(貓狗照片)讓它進(jìn)行學(xué)習(xí),然后計(jì)算圖32:讓計(jì)算機(jī)模仿人類(lèi)來(lái)解決問(wèn)題具備理論上的可行性機(jī)再面對(duì)新樣本時(shí)才能以較高的準(zhǔn)確率進(jìn)行分辨。圖31:理解人類(lèi)的學(xué)習(xí)機(jī)制,有助于讓人工智能來(lái)有效復(fù)刻這種能力機(jī)制0誠(chéng)信·責(zé)任·親和·專(zhuān)業(yè)·創(chuàng)新人工智能研究框架培訓(xùn)例如預(yù)測(cè)一封郵件是否是垃圾郵件、預(yù)測(cè)照片中的人是男性還是女性還是偏中性?這種結(jié)果只有兩個(gè)值或者多個(gè)值的問(wèn)題,我們可以把每個(gè)值都當(dāng)做一類(lèi),預(yù)測(cè)對(duì)象到底屬于哪一類(lèi)。對(duì)于結(jié)果只有兩個(gè)值的問(wèn)題,一般稱(chēng)為二分類(lèi)問(wèn)題,結(jié)果有多個(gè)值的問(wèn)題稱(chēng)為多分類(lèi)問(wèn)題?;贏I習(xí)得的能力,AI

就能處理兩大類(lèi)任務(wù)03分類(lèi)人工智能要處理的任務(wù)多種多樣。比如人臉識(shí)別、垃圾郵件檢測(cè)、電源票房預(yù)測(cè)、降雨量預(yù)測(cè)等等。但是這些任務(wù)背后的根本任務(wù)只有兩類(lèi),就是分類(lèi)與回歸。回歸例如要通過(guò)一個(gè)人的飲食預(yù)測(cè)一個(gè)人的體重,體重的值可以有無(wú)限多個(gè),有的人60kg,有的人61kg,而且在60和61之間也有無(wú)限多個(gè)數(shù)。這種預(yù)測(cè)結(jié)果是某一個(gè)確定數(shù),而具體是哪個(gè)數(shù)有無(wú)限多種可能,預(yù)測(cè)的這個(gè)變量(體重)因?yàn)橛袩o(wú)限多種可能,在數(shù)軸上是連續(xù)的,所以稱(chēng)這種變量為連續(xù)變量。AI

所能處理的這些任務(wù)背后的根本任務(wù)只有兩類(lèi),就是分類(lèi)與回歸人類(lèi)大腦每日處理的其實(shí)也是分類(lèi)與回歸問(wèn)題。比如我們會(huì)思考晚上吃燒烤還是火鍋,會(huì)選擇出門(mén)穿哪件衣服,這些都可看做是分類(lèi)問(wèn)題;在稱(chēng)重上秤前我們會(huì)先估計(jì)自己多重,約會(huì)時(shí)會(huì)預(yù)計(jì)對(duì)方幾點(diǎn)到達(dá),這些都可看做是回歸問(wèn)題。圖33:分類(lèi)和回歸是人工智能所處理任務(wù)的主要類(lèi)別分類(lèi)任務(wù):模型輸出是:對(duì)象的所屬類(lèi)別;數(shù)據(jù)類(lèi)型是:離散數(shù)據(jù)回歸任務(wù):模型輸出的結(jié)果是:一個(gè)值;數(shù)據(jù)類(lèi)型是:連續(xù)型數(shù)據(jù)41人工智能研究框架培訓(xùn)分類(lèi)任務(wù):模型輸出是對(duì)象的所屬類(lèi)別,數(shù)據(jù)類(lèi)型是離散數(shù)據(jù)03數(shù)據(jù)來(lái)源:百度數(shù)據(jù)來(lái)源:廣汽42分類(lèi)任務(wù):有二分類(lèi)和多分類(lèi)二分類(lèi)任務(wù)包括前面提到的垃圾郵件檢測(cè)與貓狗圖像識(shí)別的例子。多分類(lèi)任務(wù)場(chǎng)景包括下棋與自動(dòng)駕駛等場(chǎng)景。在棋盤(pán)上可以落子的個(gè)數(shù)是有限的,所以每一步阿爾法Go要做的就是根據(jù)當(dāng)前已落子信息,預(yù)測(cè)出落子在每個(gè)可落子位置的勝率,然后選取勝 率最高的位置進(jìn)行落子即可;自動(dòng)駕駛車(chē)輛上裝有多個(gè)攝像頭和傳感器來(lái)時(shí)刻監(jiān)視車(chē)輛四周的環(huán)境信息,可根據(jù)這些環(huán)境的圖像信息讓它選擇在每種情況下方向盤(pán)轉(zhuǎn)動(dòng)多少角度、油門(mén)或剎車(chē)踩多深來(lái)實(shí)現(xiàn)車(chē)輛的自動(dòng)行駛。圖34:棋牌類(lèi)是多分類(lèi)任務(wù)的場(chǎng)景案例之一

圖35:自動(dòng)駕駛也是一種多分類(lèi)任務(wù)可給方向盤(pán)設(shè)置900個(gè)選擇方案(普通車(chē)的方向盤(pán)一般是

900度,也就是兩圈半),給油門(mén)剎車(chē)分別設(shè)置10個(gè)檔位。那么整個(gè)自動(dòng)行駛的過(guò)程,其實(shí)就是在每個(gè)時(shí)刻根據(jù)環(huán)境信息來(lái)對(duì)這三個(gè)關(guān)鍵部件進(jìn)行操作選擇,所以可以將它看作為分類(lèi)任務(wù)。人工智能研究框架培訓(xùn)回歸任務(wù):模型輸出的結(jié)果是一個(gè)值,數(shù)據(jù)類(lèi)型是連續(xù)型03以網(wǎng)約車(chē)出行預(yù)測(cè)以及股價(jià)預(yù)測(cè)來(lái)說(shuō)明回歸任務(wù)?;貧w任務(wù)和分類(lèi)任務(wù)并非嚴(yán)格區(qū)分。案例一:可根據(jù)上下車(chē)地點(diǎn)、時(shí)間、天氣情況、人流密度以及歷史記錄等因素,預(yù)測(cè)此刻某區(qū)域的網(wǎng)約車(chē)訂單數(shù),并以此為依據(jù)進(jìn)行車(chē)輛調(diào)度,保證供需平衡。案例二:股價(jià)預(yù)測(cè)也可看做為一個(gè)回歸問(wèn)題。因?yàn)榭筛鶕?jù)歷史走勢(shì)、利弊政策、公司財(cái)報(bào)等因素對(duì)股價(jià)進(jìn)行預(yù)測(cè)。其實(shí)分類(lèi)問(wèn)題在某種程度上可以看做為一個(gè)回歸問(wèn)題:比如可以定義若一支股票漲幅會(huì)大于5%,就把它歸為買(mǎi)入類(lèi);在-5%至5%之間,就將它歸為持有類(lèi);跌幅大于5%的話就將它歸為賣(mài)出類(lèi)。圖36:網(wǎng)約車(chē)出行流量預(yù)測(cè)是一種回歸任務(wù)數(shù)據(jù)來(lái)源:百度地圖圖37:股價(jià)預(yù)測(cè)也是典型的回歸任務(wù)數(shù)據(jù)來(lái)源:微軟根據(jù)相應(yīng)程序可以預(yù)測(cè)股價(jià)趨勢(shì),可看做回歸問(wèn)題43人工智能研究框架培訓(xùn)最終計(jì)算機(jī)解決這些任務(wù)的方案,我們稱(chēng)之為算法03傳統(tǒng)機(jī)器學(xué)習(xí)通過(guò)訓(xùn)練集,不斷識(shí)別特征,不斷建模,最后形成有效的模型,這個(gè)過(guò)程就叫“機(jī)器學(xué)習(xí)”!無(wú)論使用什么算法,使用什么樣的數(shù)據(jù),最根本的思路都逃不出上面的3步。深度學(xué)習(xí)模擬人腦神經(jīng)元進(jìn)行學(xué)習(xí)與預(yù)測(cè),通常不具有可解釋性從人工智能大的子領(lǐng)域來(lái)看,常用的算法類(lèi)型有專(zhuān)家系統(tǒng)、傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)。專(zhuān)家系統(tǒng)通俗來(lái)說(shuō)就是制定規(guī)則;傳統(tǒng)的機(jī)器學(xué)習(xí)主要運(yùn)用可解釋的數(shù)學(xué)公式進(jìn)行推導(dǎo)預(yù)測(cè);而目前大火的深度學(xué)習(xí)則是模擬人腦神經(jīng)元進(jìn)行學(xué)習(xí)與預(yù)測(cè),通常不具有可解釋性,但卻能很好的解決問(wèn)題(之后會(huì)詳細(xì)解釋?zhuān)?。圖38:AI核心算法主要分為三大類(lèi)專(zhuān)家系統(tǒng)利用以往知識(shí)與經(jīng)驗(yàn)制定規(guī)則44人工智能研究框架培訓(xùn)專(zhuān)家系統(tǒng)算法:基于以往知識(shí)與經(jīng)驗(yàn)來(lái)制定規(guī)則03早期AI

根據(jù)設(shè)定的規(guī)則,讓電腦去執(zhí)行預(yù)測(cè)。這種早期算法也叫做“專(zhuān)家系統(tǒng)”。專(zhuān)家系統(tǒng)是模擬人類(lèi)專(zhuān)家解決某一類(lèi)具體問(wèn)題的人工智能系統(tǒng),如疾病診療、機(jī)械設(shè)計(jì)等。那么, 如何讓計(jì)算機(jī)模擬人類(lèi)專(zhuān)家?思路很簡(jiǎn)單:想辦法將專(zhuān)家掌握的知識(shí)抽取出來(lái),利用這些知識(shí),

計(jì)算機(jī)就可以像專(zhuān)家一樣工作了。例如,AI在互聯(lián)網(wǎng)中的早期應(yīng)用有識(shí)別垃圾郵件。郵箱每天會(huì)收到眾多郵件,而把垃圾郵件剔除就可以大大節(jié)約人們?cè)诶]件中浪費(fèi)的時(shí)間。傳統(tǒng)的方法是制定規(guī)則,比如一篇文章中大量出現(xiàn)“免費(fèi)”“特價(jià)”“發(fā)財(cái)”“代理”“穩(wěn)贏”等等關(guān)鍵詞,我們就把它定義為垃圾郵件,根據(jù)設(shè)定的規(guī)則,然后讓電腦去執(zhí)行預(yù)測(cè)。實(shí)現(xiàn)專(zhuān)家系統(tǒng)要解決兩個(gè)問(wèn)題:一是如何表示知識(shí),二是如何利用知識(shí)解決問(wèn)題首先是知識(shí)表示的問(wèn)題,即如何將專(zhuān)家的知識(shí)梳理出來(lái),并表示成計(jì)算機(jī)能讀懂的結(jié)構(gòu)。知識(shí)表示有很多種方法,最簡(jiǎn)單的是寫(xiě)成“如果...就...”這樣的判斷句,稱(chēng)為“產(chǎn)生式規(guī)則”。第二個(gè)問(wèn)題涉及到推理方法,即如何利用既有知識(shí)解決問(wèn)題。以診療系統(tǒng)為例,如果病人的表現(xiàn)是打噴嚏和發(fā)燒,人類(lèi)的醫(yī)生會(huì)基于打噴嚏和發(fā)燒這些表現(xiàn),判斷病人可能是感冒了,而治療感冒的常用藥物是阿司匹林,因此醫(yī)生會(huì)告訴病人:吃幾片阿斯匹林。這個(gè)過(guò)程就是人類(lèi)的推理過(guò)程。計(jì)算機(jī)醫(yī)生會(huì)模仿這個(gè)過(guò)程,首先會(huì)將病人發(fā)燒和打噴嚏作為前提在知識(shí)庫(kù)中查找。圖39:用IF語(yǔ)句來(lái)舉例理解專(zhuān)家系統(tǒng)IF發(fā)燒AND打噴嚏Then感冒數(shù)據(jù)來(lái)源:國(guó)泰君安證券研究45IF感冒THEN開(kāi)阿司匹林知識(shí)表示基于該知識(shí)推論病人是否感冒。得出結(jié)論后,通過(guò)“感冒”,在知識(shí)庫(kù)中繼續(xù)查找,發(fā)現(xiàn)下面的知識(shí)解決問(wèn)題基于該知識(shí),計(jì)算機(jī)就知道要給病人開(kāi)阿司匹林人工智能研究框架培訓(xùn)單一的專(zhuān)家系統(tǒng)算法會(huì)遇到諸多瓶頸03但在實(shí)踐過(guò)程中,有些任務(wù)本身的規(guī)則很難定義。一個(gè)典型的例子就是圖像識(shí)別。在圖像識(shí)別領(lǐng)域中,一個(gè)最基礎(chǔ)的問(wèn)題就是分辨這個(gè)圖像是什么。舉例來(lái)說(shuō),告訴你一張圖像不是貓就是狗,現(xiàn)在給你一張圖片,讓你分辨一張圖片到底是貓還是狗。人類(lèi)可以輕松地分辨出左側(cè)是貓右側(cè)是狗,但是讓你具體說(shuō)出你是究竟根據(jù)什么來(lái)分辨出貓與狗的,突然發(fā)現(xiàn)這個(gè)問(wèn)題很難回答。例如,貓跟狗都有五官與體毛,并有基本相同的姿勢(shì)等等,計(jì)算機(jī)量化描述這些規(guī)則的話,難度和復(fù)雜度極大。數(shù)據(jù)來(lái)源:AI有溫度微信公眾號(hào)圖41:因?yàn)閳D像的細(xì)節(jié)特征太多,編寫(xiě)規(guī)則來(lái)進(jìn)行判斷的難度極大46圖40:識(shí)別圖像的工作極大提升了傳統(tǒng)算法的難度數(shù)據(jù)來(lái)源:AI有溫度微信公眾號(hào)人工智能研究框架培訓(xùn)傳統(tǒng)的機(jī)器學(xué)習(xí)主要運(yùn)用可解釋的數(shù)學(xué)公式進(jìn)行推導(dǎo)運(yùn)算03案例任務(wù):收集鳶尾花花萼的長(zhǎng)度與寬度,來(lái)判斷它具體屬于哪一品種(由于可視化與易推導(dǎo)的需求,此處將數(shù)據(jù)維度降到2維或3維來(lái)說(shuō)明傳統(tǒng)機(jī)器學(xué)習(xí)的原理。而現(xiàn)實(shí)中的數(shù)據(jù)通常是具有多種特征的,比如鳶尾花的數(shù)據(jù)集原本有4個(gè)特征,其實(shí)我們應(yīng)該在一個(gè)4維空間對(duì)數(shù)據(jù)進(jìn)行切分)。機(jī)器學(xué)習(xí)背后的數(shù)學(xué)保證了低維空間的算法推導(dǎo)到高維空間也同樣適用。圖42:傳統(tǒng)的機(jī)器學(xué)習(xí)主要運(yùn)用可解釋的數(shù)學(xué)公式進(jìn)行推導(dǎo)預(yù)測(cè)首先將花萼的長(zhǎng)度與寬度繪制在一張二維圖中,紅色代表一類(lèi),藍(lán)色代表一類(lèi)根據(jù)兩組數(shù)據(jù)計(jì)算出一條

f(x)=k1x1+k2x2+b(可理解為

y=kx+b)的直線將兩類(lèi)數(shù)據(jù)分離:47如果再來(lái)一組數(shù)據(jù)落入直線上方,就歸屬于紅色類(lèi);若落入直線下方,則屬于藍(lán)色類(lèi)人工智能研究框架培訓(xùn)傳統(tǒng)的機(jī)器學(xué)習(xí)對(duì)圖像識(shí)別有天然優(yōu)勢(shì)03傳統(tǒng)機(jī)器學(xué)習(xí)同樣可以運(yùn)用到圖像領(lǐng)域可以看到在鳶尾花分類(lèi)任務(wù)中的特征都有明確的含義,每個(gè)數(shù)字代表什么意思。而其實(shí)在機(jī)器學(xué)習(xí)中,特征可以是很抽象的,在圖像識(shí)別領(lǐng)域中,通常將每一個(gè)像素點(diǎn)看做一個(gè)特征。在數(shù)字識(shí)別任務(wù)中,將圖像放大,每一個(gè)像素由一個(gè)方塊表示,方塊顏色的深淺不同就對(duì)應(yīng)著不同的值,所以可以用28*28=784個(gè)特征來(lái)代表這張圖像,然后將數(shù)字按順序排開(kāi)喂給機(jī)器機(jī)進(jìn)行學(xué)習(xí),并歸納整理每個(gè)位置的值與最終結(jié)果的關(guān)系。在算法領(lǐng)域中特征可能是不具有含義的,而是抽象的,甚至這個(gè)特征與最終結(jié)果毫無(wú)關(guān)系。圖44:傳統(tǒng)機(jī)器學(xué)習(xí)的工作流程如下所示圖43:利用機(jī)器學(xué)習(xí)來(lái)處理像素點(diǎn)可以實(shí)現(xiàn)圖像識(shí)別數(shù)據(jù)來(lái)源:華為云官網(wǎng)48人工智能研究框架培訓(xùn)根據(jù)機(jī)器學(xué)習(xí)訓(xùn)練方式,又分監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)03監(jiān)督學(xué)習(xí)需要有明確的目標(biāo),很清楚自己想要什么結(jié)果。比如:按照“既定規(guī)則”來(lái)分類(lèi)、預(yù)測(cè)某個(gè)具體的值…監(jiān)督并不是指人站在機(jī)器旁邊看機(jī)器做的對(duì)不對(duì),而是具有四個(gè)步驟的流程。圖45:監(jiān)督學(xué)習(xí)可以處理回歸和分類(lèi)兩種任務(wù),下面以芝麻信用評(píng)分(回歸任務(wù))來(lái)說(shuō)明監(jiān)督學(xué)習(xí)選擇一個(gè)合適的數(shù)學(xué)模型01

合適的模型先把部分已知“問(wèn)題和答案”(訓(xùn)練集)給機(jī)器去學(xué)習(xí)02

提供訓(xùn)練數(shù)據(jù)機(jī)器總結(jié)出了自己的“方法論”03

訓(xùn)練出方法論04

在新數(shù)據(jù)上使用方法論人類(lèi)把”新的問(wèn)題”(測(cè)試集)給機(jī)器,讓他去解答步驟1

:構(gòu)建問(wèn)題,選擇模型首先找出個(gè)人信用的影響因素,從邏輯上講一個(gè)人的體重跟他的

信用應(yīng)該沒(méi)有關(guān)系,而財(cái)富總額貌似跟信用有關(guān),所以根據(jù)判斷,找出了下面5個(gè)影響因素:付款記錄、賬戶(hù)總金額、信用記錄跨度(自開(kāi)戶(hù)以來(lái)的信用記錄、特定類(lèi)型賬戶(hù)開(kāi)戶(hù)以來(lái)的信用記錄…)、新賬戶(hù)(近期開(kāi)戶(hù)數(shù)目、特定類(lèi)型賬戶(hù)的開(kāi)戶(hù)比例…)、信用類(lèi)別(各種賬戶(hù)的數(shù)目)步驟2

:收集已知數(shù)據(jù)為了找出公式f,需要先收集大量的已知數(shù)據(jù),這些數(shù)據(jù)必須包含一個(gè)人的5種數(shù)據(jù)和他的信用狀態(tài)(把信用狀態(tài)轉(zhuǎn)化為分?jǐn)?shù))。把數(shù)據(jù)分成幾個(gè)部分,一部分用來(lái)訓(xùn)練,一部分用來(lái)測(cè)試和驗(yàn)證。步驟3

:訓(xùn)練出理想模型有了這些數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí),就能”猜測(cè)”出這5種數(shù)據(jù)和信用分?jǐn)?shù)的關(guān)系。這個(gè)關(guān)系就是公式f。然后再用驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù)來(lái)驗(yàn)證一下這個(gè)公式是否OK。步驟4

:對(duì)新用戶(hù)進(jìn)行預(yù)測(cè)當(dāng)我們想知道一個(gè)新用戶(hù)的信用狀況時(shí),只需要收集到他的這5種數(shù)據(jù),套進(jìn)公式f

計(jì)算一遍就知道結(jié)果了!49人工智能研究框架培訓(xùn)03圖:樸素貝葉斯

決策樹(shù)SVM邏輯回歸

線性回歸

回歸樹(shù)K鄰近Adaboosting神經(jīng)網(wǎng)絡(luò)貝葉斯分類(lèi)法是基于貝葉斯定定理的統(tǒng)計(jì)學(xué)分類(lèi)方法。它通過(guò)預(yù)測(cè)一個(gè)給定的元組屬于一個(gè)特定類(lèi)的概率,來(lái)進(jìn)行分類(lèi)。樸素貝葉斯分類(lèi)法假定一個(gè)屬性值在給定類(lèi)的影響?yīng)毩⒂谄渌麑傩缘摹?lèi)條件獨(dú)立性。分類(lèi)任務(wù)回歸任務(wù)練數(shù)據(jù)構(gòu)建決策樹(shù),對(duì)未知的數(shù)據(jù)進(jìn)行分類(lèi)。支持向量機(jī)把分類(lèi)問(wèn)題轉(zhuǎn)化為尋找分類(lèi)平面的問(wèn)題,并通過(guò)最大化分類(lèi)邊界點(diǎn)距離分類(lèi)平面的距離來(lái)實(shí)現(xiàn)分類(lèi)。決策樹(shù)是一種簡(jiǎn)單但廣泛使用的分類(lèi)器,它通過(guò)訓(xùn)邏輯回歸是用于處理因變量為分類(lèi)變量的回歸問(wèn)題,常見(jiàn)的是二分類(lèi)或二項(xiàng)分布問(wèn)題,也可以處理多分類(lèi)問(wèn)題,它實(shí)際上是屬于一種分類(lèi)方法。線性回歸是處理回歸任務(wù)最常用的算法之一。該算法的形式十分簡(jiǎn)單,它期望使用一個(gè)超平面擬合數(shù)據(jù)集(只有兩個(gè)變量的時(shí)候就是一條直線)?;貧w樹(shù)(決策樹(shù)的一種)通過(guò)將數(shù)據(jù)集重復(fù)分割為不同的分支而實(shí)現(xiàn)分層學(xué)習(xí),分割的標(biāo)準(zhǔn)是最大化每一次分離的信息增益。這種分支結(jié)構(gòu)讓回歸樹(shù)很自然地學(xué)習(xí)到非線性關(guān)系。通過(guò)搜索K個(gè)最相似的實(shí)例(鄰居)的整個(gè)訓(xùn)練集并總結(jié)那些K個(gè)實(shí)例的輸出變量,對(duì)新數(shù)據(jù)點(diǎn)進(jìn)行預(yù)測(cè)。從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)一系列的弱分類(lèi)器或基本分類(lèi)器,然后將這些弱分類(lèi)器組合成一個(gè)強(qiáng)分類(lèi)器。它從信息處理角度對(duì)人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象,建立某種簡(jiǎn)單模型,按不同的連接方式組成不同的網(wǎng)絡(luò)。主流的監(jiān)督學(xué)習(xí)算法種類(lèi)較多圖46:主流的監(jiān)督學(xué)習(xí)算法包括樸素貝葉斯、決策樹(shù)、SVM等多種算法,目前也在逐步豐富中

Adaboost目的就是50回歸+分類(lèi)人工智能研究框架培訓(xùn)無(wú)監(jiān)督學(xué)習(xí)跟監(jiān)督學(xué)習(xí)相比,主要有三個(gè)特點(diǎn)03無(wú)監(jiān)督學(xué)習(xí)是一種機(jī)器學(xué)習(xí)的訓(xùn)練方式,它本質(zhì)上是一個(gè)統(tǒng)計(jì)手段,在沒(méi)有標(biāo)簽的數(shù)據(jù)里可以發(fā)現(xiàn)潛在的一些結(jié)構(gòu)的一種訓(xùn)練方式。下面通過(guò)跟監(jiān)督學(xué)習(xí)的對(duì)比來(lái)理解無(wú)監(jiān)督學(xué)習(xí):監(jiān)督學(xué)習(xí)是一種目的明確的訓(xùn)練方式,你知道得到的是什么;而無(wú)監(jiān)督學(xué)習(xí)則是沒(méi)有明確目的的訓(xùn)練方式,你無(wú)法提前知道結(jié)果是什么。監(jiān)督學(xué)習(xí)需要給數(shù)據(jù)打標(biāo)簽;而無(wú)監(jiān)督學(xué)習(xí)不需要給數(shù)據(jù)打標(biāo)簽。監(jiān)督學(xué)習(xí)由于目標(biāo)明確,所以可以衡量效果;而無(wú)監(jiān)督學(xué)習(xí)幾?無(wú)法量化效果如何。圖47:舉例說(shuō)明無(wú)監(jiān)督學(xué)習(xí)案例1:發(fā)現(xiàn)異常案例2:用戶(hù)細(xì)分背景:有很多違法行為都需要”洗錢(qián)”,這些洗錢(qián)行為跟普通用戶(hù)的行為是不一樣的,到底哪里不一樣?如果通過(guò)人為去分析是一件成本很高很復(fù)雜的事情,我們可以通過(guò)這些行為的特征對(duì)用戶(hù)進(jìn)行分類(lèi),就更容易找到那些行為異常的用戶(hù),然后再深入分析他們的行為到底哪里不一樣,是否屬于違法洗錢(qián)的范疇。通過(guò)無(wú)監(jiān)督學(xué)習(xí),可以快速把行為進(jìn)行分類(lèi),雖然不知道這些分類(lèi)意味著什么,但是通過(guò)這種分類(lèi),可以快速排出正常的用戶(hù),更有針對(duì)性的對(duì)異常行為進(jìn)行深入分析。51用戶(hù)細(xì)分對(duì)于廣告平臺(tái)很有意義,不僅把用戶(hù)按照性別、年齡、地理位置等維度進(jìn)行用戶(hù)細(xì)分,還可以通過(guò)用戶(hù)行為對(duì)用戶(hù)進(jìn)行分類(lèi)。案例3:推薦系統(tǒng)比如大家在淘寶、天貓、京東上逛的時(shí)候,總會(huì)根據(jù)你的瀏覽行為推薦一些相關(guān)的商品,有些商品就是無(wú)監(jiān)督學(xué)習(xí)通過(guò)聚類(lèi)來(lái)推薦出來(lái)的。系統(tǒng)會(huì)發(fā)現(xiàn)一些購(gòu)買(mǎi)行為相似的用戶(hù),推薦這類(lèi)用戶(hù)最”喜歡”的商品。人工智能研究框架培訓(xùn)強(qiáng)化學(xué)習(xí)不需要大量的“數(shù)據(jù)喂養(yǎng)”,通過(guò)自我嘗試學(xué)會(huì)技能03跟監(jiān)督、無(wú)監(jiān)督學(xué)習(xí)類(lèi)似,強(qiáng)化學(xué)習(xí)并不是某一種特定的算法,而是一類(lèi)算法的統(tǒng)稱(chēng)。強(qiáng)化學(xué)習(xí)算法的思路非常簡(jiǎn)單,以游戲?yàn)槔?,如果在游戲中采取某種策略可以取得較高的得分,那么就進(jìn)一步「強(qiáng)化」這種策略,以期繼續(xù)取得較好的結(jié)果。這種策略與日常生活中的各種「績(jī)效獎(jiǎng)勵(lì)」非常類(lèi)似。強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)最大的不同就是不需要大量的“數(shù)據(jù)喂養(yǎng)”。而是通過(guò)自己不停的嘗試來(lái)學(xué)會(huì)某些技能。圖48:強(qiáng)化學(xué)習(xí)的主流算法包括免模型學(xué)習(xí)(Model-Free)和有模型學(xué)習(xí)(Model-Based)有模型學(xué)習(xí)(Model-Based)對(duì)環(huán)境有提前的認(rèn)知,可以提前考慮規(guī)劃,但是缺點(diǎn)是如果模型跟真實(shí)世界不一致,那么在實(shí)際使用場(chǎng)景下會(huì)表現(xiàn)的不好。免模型學(xué)習(xí)(Model-Free)放棄了模型學(xué)習(xí),在效率上不如后者,但是這種方式更加容易實(shí)現(xiàn),也容易在真實(shí)場(chǎng)景下調(diào)整到很好的狀態(tài)。所以免模型學(xué)習(xí)方法更受歡迎,得到更加廣泛的開(kāi)發(fā)和測(cè)試。52人工智能研究框架培訓(xùn)深度學(xué)習(xí)的靈感來(lái)自大腦的結(jié)構(gòu)和功能03求深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,但是并不完全等于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),可以看做神經(jīng)網(wǎng)絡(luò)的升級(jí)版本根據(jù)李開(kāi)復(fù)在《人工智能》內(nèi)容,以識(shí)別圖片中的漢字為例來(lái)解釋深度學(xué)習(xí):假設(shè)深度學(xué)習(xí)要處理的信息是“水流”,而處理數(shù)據(jù)的深度學(xué)習(xí)網(wǎng)絡(luò)是一個(gè)由管道和閥門(mén)組成的巨大水管網(wǎng)絡(luò)。網(wǎng)絡(luò)的入口是若干管道開(kāi)口,網(wǎng)絡(luò)的出口也是若干管道開(kāi)口。這個(gè)水管網(wǎng)絡(luò)有許多層,每一層由許多個(gè)可以控制水流流向與流量的調(diào)節(jié)閥。根據(jù)不同任務(wù)的需要,水管網(wǎng)絡(luò)的層數(shù)、每層的調(diào)節(jié)閥數(shù)量可以有不同的變化組合。對(duì)復(fù)雜任務(wù)來(lái)說(shuō),調(diào)節(jié)閥的總數(shù)可以成千上萬(wàn)甚至更多。水管網(wǎng)絡(luò)中,每一層的每個(gè)調(diào)節(jié)閥都通過(guò)水管與下一層的所有調(diào)節(jié)閥連接起來(lái),組成一個(gè)從前到后,逐層完全連通的水流系統(tǒng)。那么,計(jì)算機(jī)該如何使用這個(gè)龐大的水管網(wǎng)絡(luò)來(lái)學(xué)習(xí)識(shí)字呢?比如,當(dāng)計(jì)算機(jī)看到一張寫(xiě)有“田”字的圖片,就簡(jiǎn)單將組成這張圖片的所有數(shù)字(在計(jì)算機(jī)里,圖片的每個(gè)顏色點(diǎn)都是用“0”和“1”組成的數(shù)字來(lái)表示的)全都變成信息的水流,從入口灌進(jìn)水管網(wǎng)絡(luò)。我們預(yù)先在水管網(wǎng)絡(luò)的每個(gè)出口都插一塊字牌,對(duì)應(yīng)于每一個(gè)我們想讓計(jì)算機(jī)認(rèn)識(shí)的漢字。這時(shí),因?yàn)檩斎氲氖恰疤铩边@個(gè)漢字,等水流流過(guò)整個(gè)水管網(wǎng)絡(luò),計(jì)算機(jī)就會(huì)跑到管道出口位置去看一看,是不是標(biāo)記由“田”字的管道出口流出來(lái)的水流最多。如果是這樣,就說(shuō)明這個(gè)管道網(wǎng)絡(luò)符合要求。如果不是這樣,就調(diào)節(jié)水管網(wǎng)絡(luò)里的每一個(gè)流量調(diào)節(jié)閥,讓“田”字出口“流出”的水最多。與訓(xùn)練時(shí)做的事情類(lèi)似,未知的圖片會(huì)被計(jì)算機(jī)轉(zhuǎn)變成數(shù)據(jù)的水流,灌入訓(xùn)練好的水管網(wǎng)絡(luò)。這時(shí),計(jì)算機(jī)只要觀察一下,哪個(gè)出水口流出來(lái)的水流最多,這張圖片寫(xiě)的就是哪個(gè)字。圖49:深度學(xué)習(xí)就像自來(lái)水管系統(tǒng),不斷調(diào)節(jié)各個(gè)閥門(mén),讓對(duì)應(yīng)出口的流量符合要深度學(xué)習(xí)大致就是這么一個(gè)用

人類(lèi)的數(shù)學(xué)知識(shí)與計(jì)算機(jī)算法構(gòu)建起來(lái)的整體架構(gòu),再結(jié)合盡可能多的訓(xùn)練數(shù)據(jù)以及計(jì)算機(jī)的大規(guī)模運(yùn)算能力去調(diào)節(jié)內(nèi)部參數(shù),盡可能逼近問(wèn)題目標(biāo)的半理論、半經(jīng)驗(yàn)的建模方式。53人工智能研究框架培訓(xùn)機(jī)器學(xué)習(xí)VS

深度學(xué)習(xí)03機(jī)器學(xué)習(xí)與深度學(xué)習(xí)有著明顯的異同點(diǎn)在數(shù)據(jù)準(zhǔn)備和預(yù)處理方面,兩者是很相似的。他們都可能對(duì)數(shù)據(jù)進(jìn)行一些操作:數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)簽、歸一化、去噪、降維。核心區(qū)別:傳統(tǒng)機(jī)器學(xué)習(xí)的特征提取主要依賴(lài)人工,針對(duì)特定簡(jiǎn)單任務(wù)的時(shí)候人工提取特征會(huì)簡(jiǎn)單有效,但是并不能通用;深度學(xué)習(xí)的特征提取并不依靠人工,而是機(jī)器自動(dòng)提取的。這也是為什么都說(shuō)深度學(xué)習(xí)的可解釋性很差,因?yàn)橛袝r(shí)候深度學(xué)習(xí)雖然能有好的表現(xiàn),但是我們并不知道他的原理是什么。圖50:深度學(xué)習(xí)與機(jī)器學(xué)習(xí)在不同階段有不同的異同點(diǎn)數(shù)據(jù)預(yù)處理特征提取選擇分類(lèi)器數(shù)據(jù)預(yù)處理設(shè)計(jì)模型訓(xùn)練傳統(tǒng)機(jī)器學(xué)習(xí)54數(shù)據(jù)來(lái)源:easyai深度學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)習(xí)與深 傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的相似處 度學(xué)習(xí)的核心區(qū)別圖51:深度學(xué)習(xí)的優(yōu)缺點(diǎn)如下所示優(yōu)點(diǎn)1:學(xué)習(xí)能力強(qiáng)從結(jié)果來(lái)看,深度學(xué)習(xí)的表現(xiàn)非常好,他的學(xué)習(xí)能力非常強(qiáng)。優(yōu)點(diǎn)2:覆蓋范圍廣,適應(yīng)性好深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)層數(shù)很多,寬度很廣,理論上可以映射到任意函數(shù),所以能解決很復(fù)雜的問(wèn)題。優(yōu)點(diǎn)3:數(shù)據(jù)驅(qū)動(dòng),上限高深度學(xué)習(xí)高度依賴(lài)數(shù)據(jù),數(shù)據(jù)量越大,他的表現(xiàn)就越好。在圖像識(shí)別、面部識(shí)別、NLP等部分任務(wù)甚至已經(jīng)超過(guò)了人類(lèi)的表現(xiàn)。同時(shí)還可以通過(guò)調(diào)參進(jìn)一步提高他的上限。優(yōu)點(diǎn)4:可移植性好由于深度學(xué)習(xí)的優(yōu)異表現(xiàn),有很多框架可以使用,例如TensorFlow、Pytorch缺點(diǎn)1:計(jì)算量大,便攜性差深度學(xué)習(xí)需要大量的數(shù)據(jù)很大量的算力,所以成本很高。缺點(diǎn)2:硬件需求高深度學(xué)習(xí)對(duì)算力要求很高,普通的CPU已經(jīng)無(wú)法滿(mǎn)足深度學(xué)習(xí)的要求。主流的算力都是使用GPU和TPU。缺點(diǎn)3:模型設(shè)計(jì)復(fù)雜深度學(xué)習(xí)的模型設(shè)計(jì)非常復(fù)雜,需要投入大量的人力物力和時(shí)間來(lái)開(kāi)發(fā)新的算法和模型。大部分人只能使用現(xiàn)成的模型。缺點(diǎn)4:沒(méi)有”人性”,容易存在偏見(jiàn)由于深度學(xué)習(xí)依賴(lài)數(shù)據(jù),并且可解釋性不高。在訓(xùn)練數(shù)據(jù)不平衡的情況下會(huì)出現(xiàn)倫理風(fēng)險(xiǎn)。人工智能研究框架培訓(xùn)深度學(xué)習(xí)包括四種典型的算法034種典型的深度學(xué)習(xí)算法:卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成對(duì)抗網(wǎng)絡(luò)、深度強(qiáng)化學(xué)習(xí)圖52:深度學(xué)習(xí)的幾種主要算法如下循環(huán)神經(jīng)網(wǎng)絡(luò)–RNNRNN是一種能有效的處理序列數(shù)據(jù)的算法。比如:文章內(nèi)容、語(yǔ)音音頻、股票價(jià)格走勢(shì)…深度強(qiáng)化學(xué)習(xí)–DL深度強(qiáng)化學(xué)習(xí)就是用深度學(xué)習(xí)來(lái)對(duì)強(qiáng)化學(xué)習(xí)中的State、Policy進(jìn)行表示。區(qū)別的話,深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)的一個(gè)子類(lèi)卷積神經(jīng)網(wǎng)絡(luò)–CNN能夠?qū)⒋髷?shù)據(jù)量的圖片有效的降維 成小數(shù)據(jù)量(并不影響結(jié)果)能夠保留圖片的特征,類(lèi)似人類(lèi)的視覺(jué)原理生成對(duì)抗網(wǎng)絡(luò)–GANGAN是最近2年很熱門(mén)的一種無(wú)監(jiān)督算法,他能生成出非常逼真的照片,圖像甚至視頻。我們手機(jī)里的照片處理軟件中就會(huì)使用到它。55人工智能研究框架培訓(xùn)Transformer技術(shù)框架是深度學(xué)習(xí)發(fā)展到一定階段的產(chǎn)物03優(yōu)點(diǎn)56缺點(diǎn)能夠利用分布式GPU進(jìn)行并行訓(xùn)練,提升模型訓(xùn)練效率。它能夠通過(guò)自注意力機(jī)制捕捉輸入或輸出序列中任意兩個(gè)位置之間的關(guān)系,而不受距離的影響。它能夠產(chǎn)生更具可解釋性的模型,我們可以從模型中檢查注意力分布,看到各個(gè)注意頭(attention

head)可以學(xué)會(huì)執(zhí)行不同的任務(wù)。尤其是對(duì)于大型數(shù)據(jù)集和長(zhǎng)序列。它的局部信息的獲取能力不如RNN和CNN強(qiáng),可能會(huì)忽略一些細(xì)節(jié)和上下文。它的位置信息編碼存在問(wèn)題,因?yàn)槲恢镁幋a與詞向量相加可能會(huì)破壞詞向量的語(yǔ)義信息,而且位置編碼并不能很好地表征相對(duì)位置關(guān)系。它的頂層梯度消失問(wèn)題,因?yàn)閷託w一化模塊會(huì)阻斷梯度流,導(dǎo)致頂層參數(shù)難以更新。Transformer

模型是一種基于自注意力機(jī)制的深度學(xué)習(xí)模型,主要用于自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)領(lǐng)域。它可以用于機(jī)器翻譯、文本摘要、視覺(jué)問(wèn)答等序列到序列的生成式任務(wù),利用編碼器和解碼器的結(jié)構(gòu)對(duì)輸入和輸出序列進(jìn)行建模。它可以用于文本分類(lèi)、情感分析等單序列的理解任務(wù),利用編碼器對(duì)輸入序列進(jìn)行特征提取。它可以用于視覺(jué)語(yǔ)言預(yù)訓(xùn)練、圖像超分辨率、視頻修復(fù)等跨模態(tài)的任務(wù),利用自注意力機(jī)制融合不同模態(tài)的信息。它可以用于預(yù)訓(xùn)練語(yǔ)言模型,如BERT、GPT等,利用大規(guī)模無(wú)標(biāo)注數(shù)據(jù)學(xué)習(xí)通用的語(yǔ)言表示,再遷移到下游任務(wù)上進(jìn)行微調(diào)。圖53:Transformer的優(yōu)缺點(diǎn)如下計(jì)算復(fù)雜度很高,需要大量的算力和內(nèi)存,人工智能研究框架培訓(xùn)Transformer標(biāo)志著“基礎(chǔ)模型”時(shí)代的開(kāi)始0357Transformer作為基礎(chǔ)性模型,為其他模型(GPT、GPT-3、BERT等)的演化提供基本手段轉(zhuǎn)移學(xué)習(xí)(Transfer

Learning)使基礎(chǔ)模型成為可能,預(yù)訓(xùn)練又是轉(zhuǎn)移學(xué)習(xí)的主要方式轉(zhuǎn)移學(xué)習(xí)的思想是將從一項(xiàng)任務(wù)中學(xué)習(xí)到的“知識(shí)”(例如,圖像中的對(duì)象識(shí)別)應(yīng)用于另一項(xiàng)任務(wù)(例如,視頻中的活動(dòng)識(shí)別)。技術(shù)層面上,基礎(chǔ)模型通過(guò)轉(zhuǎn)移學(xué)習(xí)(Transfer

Learning)(Thrun

1998)和規(guī)模(scale)得以實(shí)現(xiàn)。在Transformer模型中,預(yù)訓(xùn)練又是轉(zhuǎn)移學(xué)習(xí)的主要方法:“預(yù)訓(xùn)練”是將大量低成本收集的訓(xùn)練數(shù)據(jù)放在一起,經(jīng)過(guò)某種預(yù)訓(xùn)方法去學(xué)習(xí)其中的共性,然后將共性“移植”到特定任務(wù)模型中,再使用相關(guān)特定領(lǐng)域的少量標(biāo)注數(shù)據(jù)進(jìn)行“微調(diào)”來(lái)適應(yīng)感興趣的下游任務(wù)。大規(guī)?;?scale)使基礎(chǔ)模型更強(qiáng)大,因而GPT模型得以形成大規(guī)模需要的三個(gè)要素:(i)計(jì)算機(jī)硬件的改進(jìn)——例如,GPU吞吐量和內(nèi)存在過(guò)去四年中增加了10倍;Transformer模型架構(gòu)的開(kāi)發(fā),該架構(gòu)利用硬件的并行性來(lái)訓(xùn)練比以前更具表現(xiàn)力的模型;更多訓(xùn)練數(shù)據(jù)的可用性。基于Transformer的序列建模方法現(xiàn)在已應(yīng)用于文本、圖像、語(yǔ)音、表格數(shù)據(jù)、蛋白質(zhì)序列、有機(jī)分子和強(qiáng)化學(xué)習(xí)等,這些案例的形成使得 使用一套統(tǒng)一工具來(lái)開(kāi)發(fā)各種模態(tài)的基礎(chǔ)模型這種理念得以成熟,象征著基礎(chǔ)模型時(shí)代的到來(lái)。例如,GPT-3(Brownetal.2020)在上 下文學(xué)習(xí)中,只需向下游任務(wù)提供提示(任務(wù)的自然語(yǔ)言描述),語(yǔ)言模型就可以適應(yīng)下游任務(wù),這是產(chǎn)生的一種新興屬性。人工智能研究框架培訓(xùn)04人工智能技術(shù)的應(yīng)用前景廣闊5859人工智能研究框架培訓(xùn)隨著大模型技術(shù)引爆AIGC浪潮,AI

應(yīng)用方向愈發(fā)拓展04代碼生成文本問(wèn)答圖像生成其他視頻生成AIGCChatGPT可與人類(lèi)進(jìn)行流暢的文本問(wèn)答Copilot可自動(dòng)編寫(xiě)代碼DALL·E2由文字描述生成圖像,如:An

astronaut

riding

a

hourse

asSynthesia可將輸入文本合成不同述說(shuō)風(fēng)格的視頻AIGC產(chǎn)業(yè):可以利用人工智能技術(shù)自動(dòng)產(chǎn)生內(nèi)容,常見(jiàn)如代碼生成,文本問(wèn)答等圖54:AIGC應(yīng)用功能簡(jiǎn)單如下圖所示a

pencil

drawing人工智能研究框架培訓(xùn)大模型加持下,人工智能也正在加速進(jìn)入千行百業(yè)04資料來(lái)源:哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心通用大模型的發(fā)展正在賦能各行各業(yè),行業(yè)專(zhuān)屬大模型也在不斷涌現(xiàn)。ChatGPT這種通用大模型已經(jīng)引爆垂直領(lǐng)域的千行百業(yè),各行業(yè)龍頭企業(yè)甚至初 創(chuàng)企業(yè)都摩拳擦掌。金融、教育、醫(yī)療、法律、自動(dòng)駕駛、智能物流、安防等多 個(gè)領(lǐng)域的行業(yè)公司都已相繼加入行業(yè)大模型的研發(fā)中。星環(huán)科技研發(fā)出金融行業(yè)專(zhuān)屬大模型——無(wú)涯,它是一款面向金融量化領(lǐng)域、 超大規(guī)模參數(shù)量的生成式大語(yǔ)言模型。無(wú)涯能夠?qū)善?、債券、基金、商品?各類(lèi)市場(chǎng)事件進(jìn)行全面的復(fù)盤(pán)、傳播和推演,從時(shí)間和空間、深度和廣度等多 個(gè)方面擴(kuò)展投資研究的視角,實(shí)現(xiàn)了全新的智能量化投研新范式。哈工大提出了一種基于醫(yī)學(xué)知識(shí)增強(qiáng)的大型語(yǔ)言模型指令微調(diào)方法,打造出中 文醫(yī)學(xué)大模型“本草”?!北静荨霸谥形尼t(yī)療問(wèn)診場(chǎng)景中展現(xiàn)出一定的性能提 升,模型能夠根據(jù)用戶(hù)的問(wèn)題,提供較準(zhǔn)確、可靠的診斷建議和治療方案,滿(mǎn) 足非專(zhuān)業(yè)人士對(duì)醫(yī)學(xué)知識(shí)的需求。此外,模型具備一定的自適應(yīng)能力,能夠在 不同的中文問(wèn)診場(chǎng)景中進(jìn)行有效的應(yīng)答,提升用戶(hù)體驗(yàn)。此外,學(xué)而思研發(fā)的教育大模型“MathGPT”,理想汽車(chē)研發(fā)的自動(dòng)駕駛大 模型“MindGPT”。冪律聯(lián)合智譜AI聯(lián)合發(fā)布了基于中文千億大模型的法律 垂直大模型“PowerLawGLM”。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論