版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
金融科技理論與實(shí)踐第四章
人工智能學(xué)習(xí)目標(biāo)1、了解人工智能的基本概念及發(fā)展歷程;2、理解人工智能的分類;3、掌握人工智能的核心算法和底層技術(shù);4、深入理解人工智能的技術(shù)方向及其發(fā)展趨勢。第一節(jié) 人工智能的概念及其發(fā)展一、人工智能的概念(一)人工智能開創(chuàng)者艾倫·圖靈艾倫·圖靈在1950年發(fā)表《計(jì)算機(jī)器與智能》一文,成為之后人工智能科學(xué)的開創(chuàng)性構(gòu)思,并且提出了影響深遠(yuǎn)的“圖靈測試”?!皥D靈測試”由三部分組成:計(jì)算機(jī)、被測試的人、主持人或試驗(yàn)人。測試過程是讓主持人進(jìn)行提問,由計(jì)算機(jī)與被測試的人進(jìn)行回答(兩者被隔離開來)。計(jì)算機(jī)盡量模擬人的思維回答問題,被測試的人則盡量表明自己是“人”。“圖靈測試”對計(jì)算機(jī)智能與人類智能進(jìn)行了形象的描繪,因此也成為后來檢測計(jì)算機(jī)是否具有智能的重要方法。他提出了重要的衡量標(biāo)準(zhǔn)“圖靈測試”,如果有機(jī)器能夠通過圖靈測試,那他就是一個完全意義上的智能機(jī),和人沒有區(qū)別了。(二)人工智能是什么人工智能屬于計(jì)算機(jī)科學(xué)的一個重要分支,主要涉及怎樣用人工的方法或技術(shù),讓某些自動化機(jī)器或者計(jì)算機(jī)對人的智能進(jìn)行模擬、延伸和擴(kuò)展,從而使某些機(jī)器設(shè)備具備人類的思考能力或?qū)崿F(xiàn)腦力勞動自動化?;蛟S拉斐爾的說法是最貼切的,人工智能是一門科學(xué)這門科學(xué)讓機(jī)器做人的需要智能才能完成的事。二、人工智能發(fā)展歷史(一)人工智能第一次浪潮(1956-1980):人工智能誕生并迅速發(fā)展1956年8月,在美國漢諾斯小鎮(zhèn)寧靜的達(dá)特茅斯學(xué)院中召開了一場后來被一致認(rèn)為是人工智能起源的學(xué)術(shù)研討會,與會專家們圍繞“用機(jī)器來模仿人類學(xué)習(xí)以及其他方面的智能”這一主題展開了為期兩個月的討論,盡管會議沒有達(dá)成普遍的共識,但是卻為會議討論起了一個名字——人工智能,這一事件標(biāo)志著人工智能的產(chǎn)生。1956年也被視為人工智能元年,參加本次會議的摩爾、麥卡錫、明斯基、塞弗里奇、索羅門諾夫作為人工智能領(lǐng)域的開創(chuàng)者。(二)第二次浪潮(1980~1997):人工智能開始產(chǎn)業(yè)化
人工智能在經(jīng)歷了10年左右的低谷期后,于1980年迎來了它的第二個黃金年代,這一階段一直持續(xù)到1980年卡耐基梅隆大學(xué)為Dec公司制造了一個專家系統(tǒng)R1。這個系統(tǒng)從1982年到1988年平均每年為公司節(jié)約4000萬美元,取得了巨大的成功,其他公司和高校等研究機(jī)構(gòu)紛紛效仿,重燃了整個社會對人工智能的信心。1981年日本新一代計(jì)算機(jī)技術(shù)研究所提出,研發(fā)具有人工智能的第5代計(jì)算機(jī)是第二個黃金年代的另外一個重要標(biāo)志。1987年到1997年人工智能的發(fā)展陷入第二次低谷。主要原因有兩個,一個是個人計(jì)算機(jī)的出現(xiàn)沖擊了專家系統(tǒng),二是人工智能計(jì)算機(jī)研發(fā)的失敗。隨著專家系統(tǒng)的不斷發(fā)展,復(fù)雜度的快速提升,基于知識庫和推理機(jī)的專家系統(tǒng)顯示出了讓人不安的一面:難以升級擴(kuò)展、魯棒性不夠,直接導(dǎo)致高昂的維護(hù)成本,政府進(jìn)一步削減了人工智能研究經(jīng)費(fèi)。(三)第三次浪潮(1997-至今):人工智能將迎來爆發(fā)進(jìn)入20世紀(jì)90年代中期,人工智能再次迎來了爆發(fā)式發(fā)展,1997年5月11日,IBM超級計(jì)算機(jī)深藍(lán)(DeepBlue),在經(jīng)過多輪較量后,擊敗了國際象棋世界冠軍Jarrykasparoa。盡管不乏IBM作弊的聲音,但這個事件標(biāo)志著人工智能的研究到達(dá)了一個新的高度,也給人工智能做了一次大規(guī)模的宣傳。2000年后隨著大數(shù)據(jù)普及、深度學(xué)習(xí)算法的完善和硬件效能的提高,人工智能的應(yīng)用領(lǐng)域變得更廣,應(yīng)用技術(shù)也更加成熟。第二節(jié)人工智能分類一、弱人工智能二、強(qiáng)人工智能三、超人工智能一、弱人工智能弱人工智能的英文是ArtificialNarrowIntelligence,簡稱為ANI,也稱限制領(lǐng)域人工智能或者應(yīng)用型人工智能。指的是專注于且只能解決特定領(lǐng)域問題的人工智能,毫無疑問,我們今天看到的所有人工智能算法和應(yīng)用都屬于弱人工智能的范疇,AlphaGo是弱人工智能的一個最好實(shí)例。AlphaGo雖然在圍棋領(lǐng)域超越了人類最頂尖選手,但它的能力也僅止于圍棋。一般而言,限于弱人工智能在功能上的局限性,人們更愿意將弱人工智能看成是人類的工具,而不會將弱人工智能視成威脅。二、強(qiáng)人工智能強(qiáng)人工智能又稱通用人工智能或者完全人工智能,指的是可以勝任人類所有工作的人工智能,人可以做什么,強(qiáng)人工智能就可以做什么,這種定義過于寬泛,缺乏一個量化的標(biāo)準(zhǔn)來評估什么樣的計(jì)算機(jī)程序才是強(qiáng)人工智能為此不同的研究者提出了許多不同的建議。最為流行,被廣為接受的標(biāo)準(zhǔn),是前面我們詳細(xì)討論過的圖靈測試,但即便是圖靈測試本身,也只是關(guān)注與計(jì)算機(jī)的行為和人類之間的行為。一般認(rèn)為,一個可以稱得上強(qiáng)人工智能的程序,大概需要具備以下幾個方面的能力:第一,存在不確定因素時進(jìn)行推理,使用策略,解決問題,制定決策的能力。第二,知識表示的能力,包括常識性知識的表示能力。第三,規(guī)劃能力。第四,學(xué)習(xí)能力。第五,有使用自然語言進(jìn)行交流溝通的能力。第六,將上述能力整合起來,實(shí)現(xiàn)既定目標(biāo)的能力?;谏厦鎺追N能力的描述,可以想象一個具備強(qiáng)人工智能的計(jì)算機(jī)程序會表現(xiàn)出什么樣的行為特征,一旦實(shí)現(xiàn)了符合這一描述的強(qiáng)人工智能,那我們幾乎可以肯定的說,所有人類工作都可以用人工智能來取代。三、超人工智能超人工智能的英文是ArtificialSuperintelligence,簡稱ASI,科學(xué)家把超人工智能定義為在幾乎所有領(lǐng)域都比最聰明的人類大腦都聰明很多,包括科學(xué)創(chuàng)新、通識和社交技能。假設(shè)計(jì)算機(jī)程序通過不斷發(fā)展,可以比世界上最聰明的人類還聰明,那么由此產(chǎn)生的人工智能系統(tǒng)就可以被稱為超人工智能。
牛津大學(xué)哲學(xué)家、未來學(xué)家Nick.Bostrom在他的《超級智能》一書中,將超人工智能定義為在科學(xué)創(chuàng)造力,智慧和社交能力等每一方面都比最強(qiáng)的人類大腦聰明很多的智能,顯然對于今天的人來說,這是一種只存在于科幻電影中的想象場景。與弱人工智能、強(qiáng)人工智能相比,超人工智能的定義最為模糊,因?yàn)闆]人知道超越人類最高水平的智慧,到底會表現(xiàn)為何種能力。首先我們不知道強(qiáng)于人類的智慧形式是怎樣的一種存在,現(xiàn)在去談?wù)摮斯ぶ悄芎腿祟惖年P(guān)系不僅僅為時過早,而是根本不存在可以清晰界定的討論對象,其次我們沒有辦法也沒有經(jīng)驗(yàn)去預(yù)測超人工智能到底是一種不現(xiàn)實(shí)的幻想還是一種在未來必定會降臨的結(jié)局,我們根本無法準(zhǔn)確推斷到底計(jì)算機(jī)程序有沒有能力達(dá)到這一目標(biāo)。第三節(jié)人工智能的核心算法人工智能的核心便是算法,智能算法將是具有產(chǎn)生智能功能和完成智能任務(wù)的程序性知識。同時,算法也有一定的學(xué)習(xí)能力,它可以從數(shù)據(jù)樣本中獲取將所需要的知識,并進(jìn)行一定程度上的分析與歸納,形成自己的知識。一、機(jī)器學(xué)習(xí)的分類目前,機(jī)器學(xué)習(xí)算法可以分為傳統(tǒng)算法和深度學(xué)習(xí)(DeepLearning)算法兩大類。機(jī)器學(xué)習(xí)指的是計(jì)算機(jī)系統(tǒng)無須遵照顯式的程序指令,而只依靠數(shù)據(jù)來提升自身性能的能力。其核心在于,機(jī)器學(xué)習(xí)是從數(shù)據(jù)中自動發(fā)現(xiàn)模式,模式一旦被發(fā)現(xiàn)便可用于預(yù)測。比如,給予機(jī)器學(xué)習(xí)系統(tǒng)一個關(guān)于交易時間、商家、地點(diǎn)、價格及交易是否正當(dāng)?shù)刃庞每ń灰仔畔⒌臄?shù)據(jù)庫,系統(tǒng)就會學(xué)習(xí)到可用來預(yù)測信用卡欺詐的模式。處理的交易數(shù)據(jù)越多,預(yù)測就會越準(zhǔn)確。(一)機(jī)器學(xué)習(xí)的分類(1)監(jiān)督學(xué)習(xí)(Supervisedlearning)監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中的一個方法,可以由訓(xùn)練資料中學(xué)到或建立一個模式(lamingmodel),并依此模式推測新的實(shí)例。監(jiān)督式學(xué)習(xí)有兩種形態(tài)的模型。最一般的,監(jiān)督式學(xué)習(xí)產(chǎn)生一個全域模型,會將輸入物件對應(yīng)到預(yù)期輸出。而另一種,則是將這種對應(yīng)作用于一個區(qū)域模型(如案例推論及最近鄰居法)。了解決一個給定的監(jiān)督式學(xué)習(xí)的問題(手寫辨識),必須考慮以下步驟:第一,決定訓(xùn)練資料的范例的形態(tài)。第二,搜集訓(xùn)練資料。這類資料需要具有真實(shí)世界的特征。所以,可以由人類專家或(機(jī)器或傳感器的)測量中得到輸入物件和其相對應(yīng)輸出。第三,決定學(xué)習(xí)函數(shù)的輸入特征的表示法。學(xué)習(xí)函數(shù)的準(zhǔn)確度與輸入的物件如何表示有很大的關(guān)聯(lián)度。傳統(tǒng)上,輸入的物件會被轉(zhuǎn)成一個特征向量,包含了許多關(guān)于描述物件的特征。因?yàn)榫S數(shù)災(zāi)難的關(guān)系,特征的個數(shù)不宜太多,但也要足夠大,才能準(zhǔn)確地預(yù)測輸出。第四,決定要學(xué)習(xí)的函數(shù)和其對應(yīng)的學(xué)習(xí)算法所使用的數(shù)據(jù)結(jié)構(gòu)。譬如,工程師可能選擇人工神經(jīng)網(wǎng)絡(luò)和決策樹。第五,完成設(shè)計(jì)。工程師接著在搜集到的資料上跑學(xué)習(xí)算法,可以借由將資料跑在資料的子集(稱為驗(yàn)證集)或交叉驗(yàn)證(crossvalidation)上來調(diào)整學(xué)習(xí)算法的參數(shù)。參數(shù)調(diào)整后,算法可以運(yùn)行在不同于訓(xùn)練集的測試集上。另外,監(jiān)督式學(xué)習(xí)所使用的詞匯是分類?,F(xiàn)有的各式分類器,各自都有強(qiáng)項(xiàng)或弱項(xiàng)。分類器的表現(xiàn)很大程度上與要被分類的資料特性有關(guān),并沒有某一單一分類器可以在所有給定的問題上都表現(xiàn)得最好,這被稱為“天下沒有白吃的午餐”理論。各式的經(jīng)驗(yàn)法則被用來比較分類器的表現(xiàn)及尋找會決定分類器表現(xiàn)的資料特性。決定適合某一問題的分類器仍舊是一項(xiàng)藝術(shù),而非科學(xué)。目前最廣泛使用的分類器有人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、最近鄰居法、高斯混合模型、樸素貝葉斯方法、決策樹和徑向基函數(shù)分類。(2)無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)無監(jiān)督學(xué)習(xí)是人工智能網(wǎng)絡(luò)的一種算法,其目的是對原始資料進(jìn)行分類,以便了解資料內(nèi)部結(jié)構(gòu)。有別于監(jiān)督式學(xué)習(xí)網(wǎng)絡(luò),無監(jiān)督式學(xué)習(xí)網(wǎng)絡(luò)在學(xué)習(xí)時并不知道其分類結(jié)果是否正確,即沒有受到監(jiān)督式增強(qiáng)(告訴它何種學(xué)習(xí)是正確的)。其特點(diǎn)是僅對此種網(wǎng)絡(luò)提供輸入范例,而它會自動從這些范例中找出其潛在的類別規(guī)則。學(xué)習(xí)完畢并經(jīng)測試后,也可以將之應(yīng)用到新的案例上。無監(jiān)督學(xué)習(xí)里典型的例子就是聚類。聚類的目的在于把相似的東西聚在一起,而我們并不關(guān)心這一類是什么。因此,一個聚類算法通常只需要知道如何計(jì)算相似度就可以開始工作了。(3)半監(jiān)督學(xué)習(xí)(Semi-superisedlearning)半監(jiān)督學(xué)習(xí)的基本思想是利用數(shù)據(jù)分布上的模型假設(shè),建立學(xué)習(xí)器對未標(biāo)簽樣本進(jìn)行標(biāo)簽。半監(jiān)督學(xué)習(xí)問題從樣本的角度而言是利用少量標(biāo)注樣本和大量未標(biāo)注樣本進(jìn)行機(jī)器學(xué)習(xí),從概率學(xué)習(xí)角度可理解為研究如何利用訓(xùn)練樣本的輸入邊緣概率P(x)和條件輸出概率P(y|x)的聯(lián)系設(shè)計(jì)具有良好性能的分類器。這種聯(lián)系的存在是建立在某些假設(shè)的基礎(chǔ)上的,即聚類假設(shè)(clusterassumption)和流形假設(shè)(manifordassumption)。(4)強(qiáng)化學(xué)習(xí)(reinforcementlearning)強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)中的一個領(lǐng)域,強(qiáng)調(diào)如何基于環(huán)境而行動,以取得最大化的預(yù)期利益。在這種學(xué)習(xí)模式下,輸入數(shù)據(jù)作為對模型的反饋,不像監(jiān)督模型那樣,僅僅是作為一個檢查模型對錯的方式。在強(qiáng)化學(xué)習(xí)中,輸入數(shù)據(jù)直接反饋到模型,模型必須對此立刻做出調(diào)整。常見的應(yīng)用場景包括動態(tài)系統(tǒng)以及機(jī)器人控制等。常見算法包括Q-Learning以及時間差學(xué)習(xí)(Temporaldiferencelearning)。在運(yùn)籌學(xué)和控制理論研究的語境下,強(qiáng)化學(xué)習(xí)被稱作“近似動態(tài)規(guī)劃”在經(jīng)濟(jì)學(xué)和博弈論中,強(qiáng)化學(xué)習(xí)被用來解釋在有限性的條件下如何出現(xiàn)平衡。在企業(yè)數(shù)據(jù)應(yīng)用的場景下,人們最常用的可能就是監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)的模型。在圖像識別等領(lǐng)域,由于存在大量的非標(biāo)識數(shù)據(jù)和少量的可標(biāo)識數(shù)據(jù),目前半監(jiān)督式學(xué)習(xí)是一個很熱的話題。而強(qiáng)化學(xué)習(xí)更多地應(yīng)用在機(jī)器人控制及其他需要進(jìn)行系統(tǒng)控制的領(lǐng)域。(二)深度學(xué)習(xí)的分類但是隨著研究的不斷深入,傳統(tǒng)機(jī)器學(xué)習(xí)算法在很多“智能”問題上效果不佳,無法實(shí)現(xiàn)真正的“智能”。在圖像識別大賽中,DeepLearning引起了工業(yè)界的關(guān)注,迅速將DeepLearning引進(jìn)到工業(yè)界的應(yīng)用上。深度學(xué)習(xí)技術(shù)解決了很多傳統(tǒng)機(jī)器學(xué)習(xí)算法效果不佳的“智能”問題,尤其是圖片識別、語音識別和語義理解等。某種程度上,深度學(xué)習(xí)就是機(jī)器學(xué)習(xí)領(lǐng)域的相對論。將人工智能和機(jī)器學(xué)習(xí)帶到一個新高度的技術(shù)就是:DeepLearning深度學(xué)習(xí)(也稱深度神經(jīng)網(wǎng)絡(luò))是一種機(jī)器學(xué)習(xí)的技術(shù)。與淺層神經(jīng)網(wǎng)絡(luò)類似,深度神經(jīng)網(wǎng)絡(luò)也能夠?yàn)閺?fù)雜的非線性系統(tǒng)提供建模,通常包括如下幾種網(wǎng)絡(luò)結(jié)構(gòu):卷積深度神經(jīng)網(wǎng)絡(luò)(CNN);循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN);區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(RCNN);長短期記憶網(wǎng)絡(luò)(LST)。淺層神經(jīng)網(wǎng)絡(luò)深層神經(jīng)網(wǎng)絡(luò)二、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法決策樹是一個預(yù)測模型,代表的是對象屬性與對象值之間的一種映射關(guān)系。樹中每個節(jié)點(diǎn)表示某個對象,每個分叉路徑代表著某個可能的屬性值,而每個葉結(jié)點(diǎn)則對應(yīng)從根節(jié)點(diǎn)到該葉節(jié)點(diǎn)所經(jīng)歷的路徑所表示的對象的值。決策樹僅有單一輸出,若需要復(fù)數(shù)輸出,可以建立獨(dú)立的決策樹以處理不同輸出。從數(shù)據(jù)產(chǎn)生決策樹的機(jī)器學(xué)習(xí)技術(shù)叫做決策樹學(xué)習(xí),通俗說就是一個決策樹包含三種類型的節(jié)點(diǎn):決策節(jié)點(diǎn)
通常用矩形框來表示;機(jī)會節(jié)點(diǎn)
通常用圓圈來表示:終結(jié)點(diǎn)
通常用三角形來表示。1、決策樹模型支持向量機(jī)(supportvectormachines)是由Cortes和Vapnik于1995年首先提出的,支持向量機(jī)方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力
支持向量機(jī)是一種二分類模型,它的目的是尋找一個超平面來對樣本進(jìn)行分割,分割的原則是間隔最大化,最終轉(zhuǎn)化為一個凸二次規(guī)劃問題來求解。由簡至繁的模型包括:當(dāng)訓(xùn)練樣本線性可分時,通過硬間隔最大化,學(xué)習(xí)一個線性可分支持向量機(jī);當(dāng)訓(xùn)練樣本近似線性可分時,通過軟間隔最大化,學(xué)習(xí)一個線性支持向量機(jī);當(dāng)訓(xùn)練樣本線性不可分時,通過核技巧和軟間隔最大化,學(xué)習(xí)一個非線性支持向量機(jī)。2.支持向量機(jī)3.貝葉斯分類器貝葉斯分類器的分類原理是通過某對象的先驗(yàn)概率,利用貝葉斯公式計(jì)算出其后驗(yàn)概率,即該對象屬于某一類的概率,選擇具有最大后驗(yàn)概率的類作為該對象所屬的類。也就是說,貝葉斯分類器是最小錯誤率意義上的優(yōu)化。目前研究較多的貝葉斯分類器主要有四種,分別是:NaiveBayes、TAN、BAN和GBN。優(yōu)點(diǎn)1、在接受大量數(shù)據(jù)訓(xùn)練和查詢時所具備的高速度。2、對分類器實(shí)際學(xué)習(xí)狀況的解釋還是相對簡單的。由于每個特征的概率值都被保存了起來,因此我們可以在任何時候查看數(shù)據(jù)庫,找到最合適的特征來區(qū)分垃圾郵件和非垃圾郵件。保存在數(shù)據(jù)庫中的這些信息都很有價值,它們有可能被用于其他的應(yīng)用程序,或者作為構(gòu)筑這些應(yīng)用程序的良好基礎(chǔ)。缺點(diǎn)它無法處理基于特征組合所產(chǎn)生的變化結(jié)果。樸素貝葉斯分類器的優(yōu)點(diǎn)與缺點(diǎn)4.神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)技術(shù)起源于20世紀(jì)五六十年代,當(dāng)時感知機(jī)(perceptron)擁有輸入層、輸出層和一個隱含層。輸入的特征向量過隱含層變換達(dá)到輸出層,在輸出層得到分類結(jié)果。早期感知機(jī)的推動者是Rosenblt。但是,Rosenblat的單層感知機(jī)有一個嚴(yán)重得不能再嚴(yán)重的問題,即它對稍復(fù)雜一些的函數(shù)都無能為力(比如最為典型的“異或”操作)。隨著數(shù)學(xué)的發(fā)展,直到20世紀(jì)80年代才有Rurmelhart、WlliansHinton、LeCun等人發(fā)明了多層感知機(jī)。多層感知機(jī),就是有多個隱含層的感知機(jī)。多層感知機(jī)可以擺脫早期離散傳輸函數(shù)的束縛,使用sigmoid或tanh等連續(xù)函數(shù)模擬神經(jīng)元對激勵的響應(yīng),在訓(xùn)練算法上則使用Werbos發(fā)明的反向傳播BP算法。這時候,產(chǎn)生了神經(jīng)網(wǎng)絡(luò)的概念。神經(jīng)網(wǎng)絡(luò)的層數(shù)直接決定了它對現(xiàn)實(shí)的刻畫能力。隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的加深,優(yōu)化函數(shù)越來越容易陷入局部最優(yōu)解,并且這個“陷阱”越來越偏離真正的全局最優(yōu)。利用有限數(shù)據(jù)訓(xùn)練的深層網(wǎng)絡(luò),性能還不如較淺層網(wǎng)絡(luò)。同時,另一個不可忽略的問題是隨著網(wǎng)絡(luò)層數(shù)增加,“梯度消失”現(xiàn)象更加嚴(yán)重。常用的神經(jīng)網(wǎng)絡(luò)分為:1.感知機(jī)(神經(jīng)網(wǎng)絡(luò)的前身);2.前向傳播算法;3.BP(反向傳播算法);4.DNN(深度神經(jīng)網(wǎng)絡(luò));5.CNN(卷積神經(jīng)網(wǎng)絡(luò));6.RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))。第四節(jié)人工智能的技術(shù)方向人工智能研究及應(yīng)用的一個目標(biāo)是算法及網(wǎng)絡(luò)結(jié)構(gòu)盡量能夠處理各種任務(wù),因此人工智能在各個應(yīng)用領(lǐng)域仍然需要結(jié)合領(lǐng)域知識和數(shù)據(jù)特性進(jìn)行一定結(jié)構(gòu)的設(shè)計(jì)。人工智能具有解決廣泛問題的能力,因?yàn)槠鋼碛凶詣訉W(xué)習(xí)數(shù)據(jù)中的重要特征信息的能力深度學(xué)習(xí)具備很強(qiáng)的非線性建模能力。眾多復(fù)雜問題本質(zhì)上都是高度非線性的,而人工智能實(shí)現(xiàn)了從輸入到輸出的非線性變換。這是深度學(xué)習(xí)在眾多復(fù)雜問題上取得突破的重要原因之一。文本、圖像、語音等問題都比較復(fù)雜,這就需要模型具有很強(qiáng)的非線性建模能力,本小節(jié)在上一節(jié)人工智能算法基礎(chǔ)上,引出人工智能的不同技術(shù)方向。一、計(jì)算機(jī)視覺計(jì)算機(jī)視覺技術(shù)的目的是解決機(jī)器如何感知并理解現(xiàn)實(shí)世界所傳達(dá)的信息,以幫助機(jī)器更好地做決策。計(jì)算機(jī)視覺的主要目標(biāo)是讓計(jì)算機(jī)能夠通過視覺理解世界,并根據(jù)他們的理解做出決策。要實(shí)現(xiàn)以上目標(biāo),計(jì)算機(jī)視覺則需要融合圖象處理技術(shù)、信號處理技術(shù)、概率統(tǒng)計(jì)分析、計(jì)算幾何、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)理論和計(jì)算機(jī)信息處理等技術(shù)。計(jì)算機(jī)視覺的核心:計(jì)算機(jī)視覺的核心是分割,它將整個圖像分成一個個像素組,然后對其進(jìn)行標(biāo)記和分類。特別地,語義分割試圖在語義上理解圖像中每個像素的角色(比如,識別它是汽車、摩托車還是其他的類別)。與其他計(jì)算機(jī)視覺任務(wù)一樣,卷積神經(jīng)網(wǎng)絡(luò)在分割任務(wù)上取得了巨大成功。最流行的原始方法之一是通過滑動窗口進(jìn)行塊分類,利用每個像素周圍的圖像塊,對每個像素分別進(jìn)行分類。但是其計(jì)算效率非常低,因?yàn)槲覀儾荒茉谥丿B塊之間重用共享特征。解決方案就是加州大學(xué)伯克利分校提出的全卷積網(wǎng)絡(luò)(FCN),它提出了端到端的卷積神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),在沒有任何全連接層的情況下進(jìn)行密集預(yù)測。這種方法允許針對任何尺寸的圖像生成分割映射,并且比塊分類算法快得多,幾乎后續(xù)所有的語義分割算法都采用了這種范式。計(jì)算機(jī)視覺的一般過程:(1)輸入設(shè)備(inputdevice)的研制,包括成像設(shè)備和數(shù)字化設(shè)備.成象設(shè)備是指通過光學(xué)攝像機(jī)或紅外、激光、超聲、X射線對周圍場景或物體進(jìn)行探測成象,得到關(guān)于場景或物體的二維或三維數(shù)字化圖像。(2)對輸入的原始圖像進(jìn)行預(yù)處理.這一過程借用了大量的圖像處理技術(shù)和算法,如圖像濾波、圖像增強(qiáng)、邊緣檢測等,以便從圖像中抽取諸如角點(diǎn)、邊緣、線條、邊界以及色彩等關(guān)于場景的基本特征;這一過程還包含了各種圖像變換(如校正)、圖像紋理檢測、圖像運(yùn)動檢測等。(3)恢復(fù)場景的深度、表面法線方向、輪廓等有關(guān)場景的信息,并在此基礎(chǔ)上恢復(fù)物體的完整三維圖,建立物體三維描述。(4)根據(jù)機(jī)器預(yù)先存貯的模型知識以及形狀、色彩等特征,對于圖像中各種物體進(jìn)行識別,確定它們用于哪一類物體。(5)建立各個圖像中物體的拓?fù)潢P(guān)系圖,給出圖像所反映景物的結(jié)構(gòu)描述。(6)體系結(jié)構(gòu)(systemarchitecture),涉及一系列相關(guān)的課題,并行結(jié)構(gòu)、分層結(jié)構(gòu)、信息流結(jié)構(gòu)、拓?fù)浣Y(jié)構(gòu)以及從設(shè)計(jì)到實(shí)現(xiàn)的途徑。二、語音識別語音識別主要包括語言抓取合成以及語義理解等方面,是一門交叉學(xué)科,其主要目的是讓智能設(shè)備聽懂人類的語音。它是一門涉及數(shù)字信號處理、人工智能、語言學(xué)、數(shù)理統(tǒng)計(jì)學(xué)、聲學(xué)、情感學(xué)及心理學(xué)等多學(xué)科交叉的科學(xué)。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個領(lǐng)域。語音識別技術(shù)語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面。語音識別過程三、自然語言處理自然語言處理(NaturalLanguageProcessing,NLP)是人工智能涉及到的非常重要的技術(shù)之一,其目的是用自然語言實(shí)現(xiàn)人機(jī)交互,涉及到計(jì)算機(jī)科學(xué)、人工智能、語言學(xué)等眾多學(xué)科。自然語言處理大體包括了自然語言理解和自然語言生成兩個部分?!镒匀徽Z言理解:實(shí)現(xiàn)人機(jī)間自然語言通信意味著要使計(jì)算機(jī)既能理解自然語言文本的意義。★自然語言生成:能以自然語言文本來表達(dá)給定的意圖、思想等。無論實(shí)現(xiàn)自然語言理解,還是自然語言生成,都遠(yuǎn)不如人們原來想象的那么簡單。造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性(ambiguity)。因此,從1949年美國人威弗提出的機(jī)器翻譯設(shè)計(jì)方案之后,自然語言處理技術(shù)的發(fā)展經(jīng)歷了多個階段,從最早利用語法規(guī)則、單詞或短語對應(yīng)進(jìn)行翻譯,到現(xiàn)在以大規(guī)模真實(shí)語料庫和大規(guī)模、信息豐富的信息詞典為基礎(chǔ),強(qiáng)調(diào)對大規(guī)模真實(shí)文本的處理能力。即:(1)對系統(tǒng)輸入,要求研制的自然語言處理系統(tǒng)能處理大規(guī)模的真實(shí)文本,而不是如以前的研究性系統(tǒng)那樣,只能處理很少的詞條和典型句子。只有這樣,研制的系統(tǒng)才有真正的實(shí)用價值。(2)對系統(tǒng)的輸出,鑒于真實(shí)地理解自然語言是十分困難的,對系統(tǒng)并不要求能對自然語言文本進(jìn)行深層的理解,但要能從中抽取有用的信息。例如,對自然語言文本進(jìn)行自動地提取索引詞,過濾,檢索,自動提取重要信息,進(jìn)行自動摘要等。從現(xiàn)有的理論和技術(shù)現(xiàn)狀看,針對具體應(yīng)用、具有相當(dāng)自然語言處理能力的實(shí)用系統(tǒng)已經(jīng)出現(xiàn),有些已商品化,甚至開始產(chǎn)業(yè)化,但是,通用的、高質(zhì)量的自然語言處理系統(tǒng),仍然是較長期的努力目標(biāo)。四、知識圖譜知識圖譜模擬的是人的知識記憶。高級的決策判斷和推理,必須建立在知識和記憶的基礎(chǔ)之上,這就是知識圖譜在人工智能領(lǐng)域的重大意義——讓計(jì)算機(jī)可以獲得基于知識和記憶的高級判斷、推理能力。知識圖譜通過將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論和方法與計(jì)量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,并利用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識架構(gòu)以達(dá)到多學(xué)科融合目的的現(xiàn)代理論。知識圖譜起源于語義網(wǎng)絡(luò),最初由Google提出用與優(yōu)化搜索結(jié)果,發(fā)展至今已經(jīng)應(yīng)用于各個垂直化領(lǐng)域。從商業(yè)概念上,知識圖譜可分為“通用知識圖譜”和“行業(yè)知識圖譜”。通用知識圖譜顧名思義是面向全領(lǐng)域的,強(qiáng)調(diào)的是“廣度”,比較著名的知識庫有Freebase,Wikidata,Yago,DBPedia等。行業(yè)知識圖譜是面向特定的垂直領(lǐng)域,對于數(shù)據(jù)有更嚴(yán)格的前置數(shù)據(jù)模式和更準(zhǔn)確的準(zhǔn)確度要求,強(qiáng)調(diào)的是“深度”。兩者之間的主要區(qū)別在于前者是“自底向上”構(gòu)建的知識庫,后者是“自頂向下”構(gòu)建的知識庫。構(gòu)建知識圖譜是一個迭代更新的過程,根據(jù)知識獲取的邏輯,每一輪迭代包含:知識儲存、信息抽取、知識融合、知識計(jì)算,四個階段。首先,知識存儲:針對構(gòu)建知識圖譜設(shè)計(jì)底層的存儲方式,完成各類知識的存儲,包括基本屬性知識、關(guān)聯(lián)知識、事件知識、時序知識、資源類知識等。存儲方式的憂慮將直接導(dǎo)致查詢效率和應(yīng)用效果。其次,信息抽?。簭母鞣N類型的數(shù)據(jù)源中提取出實(shí)體、屬性以及實(shí)體間的相互關(guān)系,在此基礎(chǔ)上形成本體化的知識表達(dá)。再次,知識融合:在獲得新知識之后,需要對其進(jìn)行整合,以消除矛盾和歧義,比如某些實(shí)體可能有多種表達(dá),某個特定稱謂也許對應(yīng)于多個不同的實(shí)體等;最后,知識計(jì)算:對于經(jīng)過融合的新知識,需要經(jīng)過質(zhì)量評估之后(部分需要人工參與甄別),才能將合格的部分加入到知識庫中,以確保知識庫的質(zhì)量。第五節(jié)人工智能發(fā)展現(xiàn)狀和未來趨勢一、發(fā)展現(xiàn)狀據(jù)中國信通院,人工智能作為驅(qū)動和引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),不僅是賦能產(chǎn)業(yè)轉(zhuǎn)型創(chuàng)新的重要手段,更是數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的重要動力。以5G和人工智能為代表的技術(shù)進(jìn)步和產(chǎn)品創(chuàng)新快速演進(jìn),并加速與垂直行業(yè)深度融合,應(yīng)用場景迸發(fā)。人工智能正在成為新一輪科技革命和產(chǎn)業(yè)變革的關(guān)鍵驅(qū)動力,應(yīng)用產(chǎn)品和領(lǐng)域逐步豐富。目前人工智能在網(wǎng)絡(luò)優(yōu)化、自然語言處理、面部識別、醫(yī)療影像和診斷、自主導(dǎo)航、農(nóng)作物監(jiān)測等領(lǐng)域被廣泛應(yīng)用,未來在藥物研發(fā)、基因診斷等領(lǐng)域的應(yīng)用潛力將持續(xù)釋放。IDC(國際數(shù)據(jù)公司)預(yù)測全球AI市場規(guī)模不斷擴(kuò)大,“十四五”規(guī)劃綱要將“新一代人工智能”作為議題重點(diǎn)提及,加上新基建、數(shù)字經(jīng)濟(jì)在內(nèi)的持續(xù)利好政策促進(jìn)了產(chǎn)業(yè)智能化升級。IDC預(yù)測,隨著AI應(yīng)用的不斷落地,中國市場規(guī)模將不斷增長。
IDC預(yù)計(jì),政府、銀行和通訊三大行業(yè)的支出規(guī)模在五年預(yù)測期內(nèi)將持續(xù)保持領(lǐng)先,三者合計(jì)約占總量的三分之一。二、未來趨勢趨勢1:能力、通用性更強(qiáng)的機(jī)器學(xué)習(xí)模型趨勢2:機(jī)器學(xué)習(xí)持續(xù)的效率提升趨勢3:機(jī)器學(xué)習(xí)變得更個性化,對社區(qū)也更有益趨勢4:機(jī)器學(xué)習(xí)對科學(xué)、健康和可持續(xù)發(fā)展的影響越來越大趨勢5:對機(jī)器學(xué)習(xí)更深入和更廣泛的理解趨勢1:能力、通用性更強(qiáng)的機(jī)器學(xué)習(xí)模型研究人員正在訓(xùn)練比以往任何時候規(guī)模更大、能力更強(qiáng)的機(jī)器學(xué)習(xí)模型。過去幾年里,數(shù)據(jù)集和模型規(guī)模的增長帶來了多種語言任務(wù)上準(zhǔn)確率的顯著提升,并通過標(biāo)準(zhǔn)NLP基準(zhǔn)任務(wù)上的全面改進(jìn)證明了這一點(diǎn)。這些先進(jìn)的模型中有很多都聚焦于單一但重要的書面語言形態(tài)上,并在語言理解基準(zhǔn)和開放式會話能力中展現(xiàn)出了SOTA結(jié)果,即使跨同一領(lǐng)域多個任務(wù)也是如此。同時,這些模型在訓(xùn)練數(shù)據(jù)相對較少時也有能力泛化至新的語言任務(wù),在某些情況下,對于新任務(wù)需要極少甚至不需要訓(xùn)練樣本。趨勢2:機(jī)器學(xué)習(xí)持續(xù)的效率提升效率的提升源自計(jì)算機(jī)硬件設(shè)計(jì)和機(jī)器學(xué)習(xí)算法、元學(xué)習(xí)研究的進(jìn)步,并正在推動機(jī)器學(xué)習(xí)模型更強(qiáng)大的功能。機(jī)器學(xué)習(xí)pipeline的很多方面,從訓(xùn)練和執(zhí)行模型的硬件到機(jī)器學(xué)習(xí)架構(gòu)的各個組件,這些都可以進(jìn)行效率優(yōu)化,同時保持或提升整體性能。更高的效率促成了大量關(guān)鍵性進(jìn)步,這些進(jìn)步將繼續(xù)顯著提升機(jī)器學(xué)習(xí)的效率,使更大、更高質(zhì)量的機(jī)器學(xué)習(xí)模型能夠在保持成本效益的前提下開發(fā),并進(jìn)一步促進(jìn)大眾化趨勢3:機(jī)器學(xué)習(xí)變得更個性化,對社區(qū)也更有益隨著機(jī)器學(xué)習(xí)和硅硬件(如谷歌Pixel6上的谷歌張量處理器)的創(chuàng)新,許多新體驗(yàn)成為了可能,使移動設(shè)備更有能力持續(xù)有效地感知周圍的背景和環(huán)境。這些進(jìn)步提升了可訪問性和易用性,同時也增強(qiáng)了計(jì)算能力,對于移動攝影、實(shí)時翻譯等功能至關(guān)重要。值得注意的是,最近的技術(shù)進(jìn)步還為用戶提供了更加個性化的體驗(yàn),同時加強(qiáng)了隱私保護(hù)。趨勢4:機(jī)器學(xué)習(xí)對科學(xué)、健康和可持續(xù)發(fā)展的影響越來越大近年來,從物理學(xué)到生物學(xué),機(jī)器學(xué)習(xí)在基礎(chǔ)科學(xué)中的影響越來越大,并在相關(guān)領(lǐng)域(例如可再生能源和醫(yī)學(xué))實(shí)現(xiàn)了許多優(yōu)秀的實(shí)際應(yīng)用。例如,計(jì)算機(jī)視覺模型正在被用來解決個人和全球范圍內(nèi)的問題,它們可以協(xié)助醫(yī)生展開日常工作,擴(kuò)展人們對神經(jīng)生理學(xué)的理解,還可以提供更精準(zhǔn)的天氣預(yù)報(bào),可以簡化救災(zāi)工作。通過發(fā)現(xiàn)減少排放和提高替代能源輸出的方法,其他類型的機(jī)器學(xué)習(xí)模型被證明在應(yīng)對氣候變化方面至關(guān)重要。隨著機(jī)器學(xué)習(xí)變得更加穩(wěn)健、成熟且可廣泛使用,這樣的模型甚至可以用作藝術(shù)家的創(chuàng)作工具。趨勢5:對機(jī)器學(xué)習(xí)更深入和更廣泛的理解隨著機(jī)器學(xué)習(xí)在技術(shù)產(chǎn)品和社會中更廣泛地使用,我們必須繼續(xù)開發(fā)新技術(shù)以確保公平公正地應(yīng)用它,造福于所有人,而不只是其中一部分。一個重點(diǎn)領(lǐng)域是基于在線產(chǎn)品中用戶活動的推薦系統(tǒng)。由于這些推薦系統(tǒng)通常由多個不同的組件組?成,因此了解它們的公平性通常需要深入了解各個組件以及各個組件組合在一起時的行為方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年安徽水利水電職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性考試題庫及答案詳解一套
- 2026年運(yùn)城師范高等??茖W(xué)校單招職業(yè)適應(yīng)性測試題庫及答案詳解1套
- 2026年長白山職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試題庫附答案詳解
- 2026年安徽醫(yī)學(xué)高等??茖W(xué)校單招職業(yè)適應(yīng)性測試題庫及參考答案詳解1套
- 2026年林州建筑職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫及答案詳解一套
- 2026年川南幼兒師范高等??茖W(xué)校單招職業(yè)適應(yīng)性考試題庫及答案詳解一套
- 2026年常州紡織服裝職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫及答案詳解1套
- 2026年云南錫業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案詳解一套
- 2026年廣西科技職業(yè)學(xué)院單招綜合素質(zhì)考試題庫帶答案詳解
- 2026年滄州醫(yī)學(xué)高等??茖W(xué)校單招職業(yè)技能考試題庫參考答案詳解
- 水印江南美食街招商方案
- 二零二五年度綠色生態(tài)住宅小區(qū)建設(shè)工程合同協(xié)議
- 2025-2030全球膜處理系統(tǒng)行業(yè)調(diào)研及趨勢分析報(bào)告
- 多導(dǎo)睡眠監(jiān)測課件
- 新蘇教版一年級數(shù)學(xué)下冊第一單元第1課時《9加幾》教案
- 《水利水電工程清污機(jī)制造安裝及驗(yàn)收規(guī)范》
- 統(tǒng)編版(2024新版)七年級上冊歷史期末復(fù)習(xí)考點(diǎn)提綱
- 乳腺癌化療藥物不良反應(yīng)及護(hù)理
- 高新技術(shù)產(chǎn)業(yè)園區(qū)建設(shè)項(xiàng)目可行性研究報(bào)告
- 鍋爐設(shè)備巡檢與保養(yǎng)方案
- 腳手架施工質(zhì)量控制方案
評論
0/150
提交評論