版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主題8人工智能技術(shù)與應(yīng)用目錄頁contents8.1人工智能概述8.2機(jī)器學(xué)習(xí)概述8.3機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)8.4人工智能的未來發(fā)展1234選題背景及意義ONE8.1人工智能概述8.1.1人工智能簡(jiǎn)介8.1.2人工智能學(xué)派8.1.1人工智能簡(jiǎn)介人工智能的基本概念人工智能:研究和開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù),以及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。研究?jī)?nèi)容:包括機(jī)器人、語音識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。主要目標(biāo):使機(jī)器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。8.1.1人工智能簡(jiǎn)介人工智能發(fā)展的里程碑事件(1)圖靈測(cè)試1950年,圖靈發(fā)表了一篇題為《計(jì)算機(jī)與智能》的論文,提出圖靈測(cè)試(2)達(dá)特茅斯會(huì)議1956年,在美國達(dá)特茅斯學(xué)院召開了“人工智能夏季研討會(huì)”,首次提出人工智能的術(shù)語,標(biāo)志著人工智能的誕生。(3)反向傳播算法的提出1969年,反向傳播算法被提出,極大地推動(dòng)了神經(jīng)網(wǎng)絡(luò)的發(fā)展,使得神經(jīng)網(wǎng)絡(luò)在模式識(shí)別、分類等領(lǐng)域取得了顯著成果。8.1.1人工智能簡(jiǎn)介人工智能發(fā)展的里程碑事件(4)專家系統(tǒng)的興起在20世紀(jì)70年代,專家系統(tǒng)開始興起,這是一種利用專業(yè)知識(shí)解決特定領(lǐng)域問題的系統(tǒng)。(5)深度學(xué)習(xí)的突破自2006年起,隨著計(jì)算能力的提升和大數(shù)據(jù)的積累,深度學(xué)習(xí)技術(shù)開始取得突破性進(jìn)展。2012年,深度學(xué)習(xí)在ImageNet圖像識(shí)別競(jìng)賽中取得了顯著成績(jī)。2016年,谷歌研發(fā)的AlphaGo在圍棋比賽中戰(zhàn)勝世界冠軍李世石。(6)大模型的興起近年來,隨著計(jì)算機(jī)計(jì)算能力的提升和算法的優(yōu)化,人工智能大模型開始興起,如GPT系列模型、文心一言等。8.1.2人工智能學(xué)派人工智能學(xué)派1.符號(hào)主義符號(hào)主義,又稱為邏輯主義、心理學(xué)派或計(jì)算機(jī)學(xué)派,是一種基于邏輯推理的智能模擬方法。人類認(rèn)知和思維的基本單元是符號(hào),智能是符號(hào)的表征和運(yùn)算過程。符號(hào)主義的核心思想是基于邏輯推理和符號(hào)操作,模擬人類的思維過程。代表性成果有啟發(fā)式程序(如國際象棋程序、數(shù)獨(dú)程序)、專家系統(tǒng)(如醫(yī)療診斷系統(tǒng)、法律咨詢系統(tǒng)、金融分析系統(tǒng))、知識(shí)工程(如百度百科、維基百科)等。8.1.2人工智能學(xué)派人工智能學(xué)派2.連接主義連接主義,又稱為聯(lián)結(jié)主義、仿生學(xué)派或生理學(xué)派,是一種基于神經(jīng)網(wǎng)絡(luò)和網(wǎng)絡(luò)間的連接機(jī)制與學(xué)習(xí)算法的智能模擬方法。智能活動(dòng)是由大量簡(jiǎn)單單元通過復(fù)雜連接后并行運(yùn)行的結(jié)果。連接主義的核心思想是基于神經(jīng)網(wǎng)絡(luò)和連接機(jī)制,模擬人腦的結(jié)構(gòu)和功能。代表性成果有感知器、反向傳播網(wǎng)絡(luò)(包括多層感知機(jī)MLP和卷積神經(jīng)網(wǎng)絡(luò)CNN等)、深度學(xué)習(xí)模型等。8.1.2人工智能學(xué)派人工智能學(xué)派3.行為主義行為主義,又稱為進(jìn)化主義或控制論學(xué)派,是一種基于“感知——行動(dòng)”的行為智能模擬方法。它認(rèn)為智能取決于感知和行為,取決于對(duì)外界復(fù)雜環(huán)境的適應(yīng),而不是表示和推理。行為主義的核心思想是基于感知和行動(dòng),模擬生物在自然環(huán)境中的智能行為。代表性成果有六足行走機(jī)器人(如Genghis機(jī)器人、RHex機(jī)器人)、波士頓動(dòng)力機(jī)器人(如BigDog機(jī)器人、Atlas機(jī)器人)、進(jìn)化算法(如遺傳算法、粒子群算法、蟻群算法)等。TWO8.2機(jī)器學(xué)習(xí)概述8.2.1人工智能與機(jī)器學(xué)習(xí)8.2.2訓(xùn)練相關(guān)概念8.2.3評(píng)價(jià)指標(biāo)8.2.1人工智能與機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)是人工智能的重要分支,是實(shí)現(xiàn)人工智能的重要方法深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種實(shí)現(xiàn)技術(shù)大模型是參數(shù)量和數(shù)據(jù)量都非常大的深度學(xué)習(xí)模型8.2.1人工智能與機(jī)器學(xué)習(xí)人工智能從發(fā)展程度的角度,人工智能可分為弱人工智能和強(qiáng)人工智能弱人工智能不強(qiáng)調(diào)完全模擬真實(shí)的人類智能,只需要模擬人類某方面的智能強(qiáng)人工智能強(qiáng)調(diào)創(chuàng)造出完全具有人類認(rèn)知能力甚至超越人類智能的智能現(xiàn)階段人工智能的研究工作主要集中在弱人工智能,包括邏輯推理、機(jī)器學(xué)習(xí)、專家系統(tǒng)、知識(shí)圖譜、類腦計(jì)算和混合智能等8.2.1人工智能與機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)的基本過程通過相關(guān)算法對(duì)給定的數(shù)據(jù)集(對(duì)應(yīng)“歷史經(jīng)驗(yàn)”)進(jìn)行“訓(xùn)練”(對(duì)應(yīng)“歸納”)形成“模型”(對(duì)應(yīng)“規(guī)律”)再利用該模型對(duì)新數(shù)據(jù)進(jìn)行“預(yù)測(cè)”從訓(xùn)練數(shù)據(jù)特性的角度,機(jī)器學(xué)習(xí)一般可以分為監(jiān)督學(xué)習(xí)(SupervisedLearning)無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)半監(jiān)督學(xué)習(xí)(Semi-supervisedLearning)強(qiáng)化學(xué)習(xí)(ReinforcementLearning)8.2.1人工智能與機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)(1)監(jiān)督學(xué)習(xí)分類對(duì)未知數(shù)據(jù)的類別進(jìn)行判斷,預(yù)測(cè)結(jié)果是離散的?;陬悇e數(shù)目的不同,可以分為二分類和多分類兩種類別。例如,鳶尾花分類依據(jù)花萼長(zhǎng)度、花萼寬度、花瓣長(zhǎng)度和花瓣寬度四個(gè)特征,判斷所屬鳶尾花類別?;貧w在分析自變量和因變量間相關(guān)關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,用于預(yù)測(cè)或分類。例如,預(yù)測(cè)根據(jù)電影名稱、上映時(shí)間、片長(zhǎng)、演員等不同特征預(yù)測(cè)電影票房。8.2.1人工智能與機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)(2)無監(jiān)督學(xué)習(xí)聚類不同于分類的原理,事先并不知道數(shù)據(jù)的類別。在數(shù)據(jù)類別未知的情況下將數(shù)據(jù)劃分為彼此不相交的簇(Cluster),使簇內(nèi)的樣本間相似性高,不同簇之間的相似度低。降維將數(shù)據(jù)的特征從高維轉(zhuǎn)換到低維的方法,可以消除冗余信息或便于數(shù)據(jù)可視化。當(dāng)數(shù)據(jù)的特征含有大量冗余信息時(shí),利用降維可以消除冗余信息由于超過三維的特征數(shù)據(jù)很難直觀地顯示,因此通過降維降低數(shù)據(jù)特征維度,方便數(shù)據(jù)可視化。8.2.1人工智能與機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)(3)半監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)是一種監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)相結(jié)合的算法,通過利用少量有標(biāo)簽的數(shù)據(jù)集和大量無標(biāo)簽的數(shù)據(jù)集進(jìn)行模型的訓(xùn)練。在獲得標(biāo)注數(shù)據(jù)比較困難而非標(biāo)注信息較容易的應(yīng)用場(chǎng)景下(比如醫(yī)學(xué)數(shù)據(jù)資料),半監(jiān)督學(xué)習(xí)可以取得較好的效果。(4)強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)是在無預(yù)先給定任何數(shù)據(jù)情況下,通過環(huán)境對(duì)其動(dòng)作的反饋,不斷訓(xùn)練模型,從而獲得可以執(zhí)行某項(xiàng)具體任務(wù)的算法,如在AlphaGo、游戲、智能機(jī)器人中的應(yīng)用。8.2.1人工智能與機(jī)器學(xué)習(xí)深度學(xué)習(xí)深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種實(shí)現(xiàn)技術(shù)常用的深度學(xué)習(xí)模型適用于處理圖像問題的卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)適用于處理序列問題的循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)適用于處理序列問題的長(zhǎng)短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM)用于生成高質(zhì)量數(shù)據(jù)的生成對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetworks,GANs)基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型(Transformer)大模型大多基于Transformer模型進(jìn)行構(gòu)建和擴(kuò)展8.2.1人工智能與機(jī)器學(xué)習(xí)大語言模型大語言模型(LLM,也被泛稱為大模型)由數(shù)百萬到數(shù)十億的參數(shù)組成,需要大量的數(shù)據(jù)和計(jì)算資源進(jìn)行訓(xùn)練和推理具有非常強(qiáng)大的表示能力和泛化能力,在多種任務(wù)中表現(xiàn)出色大模型的典型代表包括BERT、GPT系列、Llama系列等,它們的參數(shù)量達(dá)到了千億甚至萬億的規(guī)模。8.2.2訓(xùn)練相關(guān)概念特征與標(biāo)簽機(jī)器學(xué)習(xí)的數(shù)據(jù)一般由特征(Feature)和標(biāo)簽(Label)兩部分組成以鳶尾花(Iris)數(shù)據(jù)集為例用于區(qū)分鳶尾花的類別需要使用花萼的長(zhǎng)度和寬度、花瓣的長(zhǎng)度和寬度四種不同的屬性。測(cè)得的這四種屬性值稱為特征(也稱為屬性、解釋變量、輸入變量、自變量等),特征通常是數(shù)據(jù)集的列。每一行是具有這些特征的一個(gè)實(shí)例。標(biāo)簽(也稱為響應(yīng)變量、輸出變量、因變量等)的數(shù)據(jù)類型為包含三種類別鳶尾花的枚舉型8.2.2訓(xùn)練相關(guān)概念訓(xùn)練集、測(cè)試集與驗(yàn)證集訓(xùn)練集(TrainSet)訓(xùn)練機(jī)器學(xué)習(xí)算法的數(shù)據(jù)集測(cè)試集(TestSet)評(píng)估經(jīng)訓(xùn)練后的模型性能的數(shù)據(jù)集驗(yàn)證集(ValidationSet)微調(diào)模型超參數(shù)的數(shù)據(jù)集經(jīng)過訓(xùn)練集得到的模型先在驗(yàn)證集上進(jìn)行評(píng)估,從而使得模型具有更好的泛化能力,然后再在測(cè)試集上進(jìn)行最終評(píng)估8.2.2訓(xùn)練相關(guān)概念欠擬合、過擬合與適度擬合欠擬合:當(dāng)模型的預(yù)測(cè)值與數(shù)據(jù)真實(shí)值之間具有較大的差異,即偏差較大時(shí),表明模型沒有充分利用訓(xùn)練數(shù)據(jù)自身的特性,對(duì)數(shù)據(jù)的擬合能力較差。過擬合:模型在訓(xùn)練集上表現(xiàn)很好,但在測(cè)試集中訓(xùn)練效果較差。原因是模型過分考慮訓(xùn)練集中已知數(shù)據(jù)自身的特性,導(dǎo)致對(duì)新數(shù)據(jù)的訓(xùn)練效果變差,表明了數(shù)據(jù)集的變化對(duì)模型性能的影響。適度擬合:模型不僅在訓(xùn)練集中可以取得較好的擬合效果,而且對(duì)測(cè)試集的新數(shù)據(jù)也能取得不錯(cuò)的效果。8.2.3評(píng)價(jià)指標(biāo)分類評(píng)價(jià)指標(biāo)以二分類問題為例,將數(shù)據(jù)集中的樣本輸入到分類器得到的預(yù)測(cè)值和樣本的真實(shí)值對(duì)比,可以得到如下四種關(guān)系:①真正類(TP,TruePositive):預(yù)測(cè)正確,預(yù)測(cè)該樣本為正類,真實(shí)類別為正類。②假正類(FP,F(xiàn)alsePositive):預(yù)測(cè)錯(cuò)誤,預(yù)測(cè)該樣本為正類,真實(shí)類別為負(fù)類。③假負(fù)類(FN,F(xiàn)alseNegative):預(yù)測(cè)錯(cuò)誤,預(yù)測(cè)該樣本為負(fù)類,真實(shí)類別為正類。④真負(fù)類(TN,TrueNegative):預(yù)測(cè)正確,預(yù)測(cè)該樣本為負(fù)類,真實(shí)類別為負(fù)類。8.2.3評(píng)價(jià)指標(biāo)分類評(píng)價(jià)指標(biāo)準(zhǔn)確率(Accuracy)預(yù)測(cè)正確的樣本數(shù)占總樣本數(shù)的比例數(shù)據(jù)類別不均衡時(shí),不能客觀評(píng)價(jià)算法的優(yōu)劣精確率(Precision),又叫查準(zhǔn)率針對(duì)預(yù)測(cè)結(jié)果而言在所有被預(yù)測(cè)為正的樣本中實(shí)際為正的樣本比例召回率(Recall),又叫查全率針對(duì)原樣本而言在實(shí)際為正的樣本中被預(yù)測(cè)為正樣本的比例F1分?jǐn)?shù)(F1Score)綜合精確率和召回率的評(píng)價(jià)指標(biāo)8.2.3評(píng)價(jià)指標(biāo)回歸評(píng)價(jià)指標(biāo)(1)MAE(平均絕對(duì)誤差)求預(yù)測(cè)值與真實(shí)值的誤差絕對(duì)值的平均值MAE越小,回歸模型的擬合程度就越好MAE對(duì)誤差的敏感度相對(duì)較低,因?yàn)樗?jì)算的是誤差的絕對(duì)值,不會(huì)因誤差的大小而給予不同的懲罰力度,這使得MAE在處理含有異常值的數(shù)據(jù)時(shí)更加穩(wěn)健MAE適用于對(duì)異常值不那么敏感的場(chǎng)景,如某些工業(yè)制造過程中的質(zhì)量控制等(2)MSE(均方誤差)求預(yù)測(cè)值與真實(shí)值的誤差平方的平均值MSE越小,回歸模型的擬合程度就越好MSE對(duì)誤差的敏感度較高,尤其是當(dāng)誤差較大時(shí),由于平方的作用,MSE會(huì)給予更大的懲罰,這使得MSE在處理含有異常值的數(shù)據(jù)時(shí)可能不夠穩(wěn)健MSE常用于需要精確預(yù)測(cè)的場(chǎng)景,如金融預(yù)測(cè)、醫(yī)療診斷等8.2.3評(píng)價(jià)指標(biāo)回歸評(píng)價(jià)指標(biāo)(3)RMSE(均方根誤差)對(duì)MSE(均方誤差)進(jìn)行開平方運(yùn)算。RMSE在數(shù)值上與MSE的平方根成正比,因此它也保留了MSE對(duì)誤差敏感度的特點(diǎn),但RMSE的數(shù)值范圍與原始數(shù)據(jù)更為接近,便于理解和比較。由于在數(shù)值上的直觀性和便于優(yōu)化的特點(diǎn),RMSE也作為性能評(píng)估指標(biāo)被廣泛應(yīng)用于各種預(yù)測(cè)模型中。(4)決定系數(shù)R2隨著樣本數(shù)量的增加,MAE和MSE也會(huì)隨之增大。而且針對(duì)不同量綱的數(shù)據(jù)集,其計(jì)算結(jié)果也有差異,所以很難直接用這些評(píng)價(jià)指標(biāo)來衡量模型的優(yōu)劣??梢允褂脹Q定系數(shù)R2來評(píng)價(jià)回歸模型的預(yù)測(cè)能力。R2取值范圍一般是0~1,越接近1,回歸的擬合程度就越好。但當(dāng)回歸模型的擬合效果差于取平均值時(shí)的效果時(shí),也可能為負(fù)數(shù)。THREE8.3機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)8.3.1分類8.3.2回歸8.3.3神經(jīng)網(wǎng)絡(luò)8.3.1分類分類基本概念已知一些樣本數(shù)據(jù)類別,判斷未標(biāo)記的新數(shù)據(jù)點(diǎn)所屬類別例如,已知客戶的信用歷史、收入、負(fù)債、職業(yè)穩(wěn)定性等因素,預(yù)測(cè)客戶的信用等級(jí)分類算法屬于一種有監(jiān)督的學(xué)習(xí)在分類分析中,通常采用距離來衡量?jī)蓚€(gè)數(shù)據(jù)點(diǎn)之間的相似性。比較熟悉的是歐氏距離常用的分類算法包括K最近鄰算法(K-NearestNeighbor,KNN)決策樹算法(DecisionTree)支持向量機(jī)算法(SupportVectorMachine,SVM)人工神經(jīng)網(wǎng)絡(luò)算法(ArtificialNeuralNetwork,ANN)8.3.1分類KNN算法①計(jì)算已知類別數(shù)據(jù)集中的點(diǎn)與當(dāng)前點(diǎn)之間的距離。②按照距離遞增升序排序。③選取與當(dāng)前點(diǎn)距離最小的K個(gè)點(diǎn)。④確定前K個(gè)點(diǎn)所在類別的出現(xiàn)頻率。⑤返回前K個(gè)點(diǎn)出現(xiàn)頻率最高的類別作為當(dāng)前點(diǎn)的預(yù)測(cè)分類。8.3.1分類KNN算法Step1:計(jì)算數(shù)據(jù)點(diǎn)(5,4)與樣本數(shù)據(jù)集中所有點(diǎn)的距離Step2:對(duì)以上距離進(jìn)行排序Step3:得出距離最近的5個(gè)元素組成近鄰集合{x2,x3,x4,x5,x6}Step4:上述集合中,x2,x3兩個(gè)數(shù)據(jù)點(diǎn)屬于類別1,x4,x5,x6三個(gè)數(shù)據(jù)點(diǎn)屬于類別2Step5:因此,數(shù)據(jù)點(diǎn)(5,4)的類別為2138.3.3神經(jīng)網(wǎng)絡(luò)KNN分類體驗(yàn)實(shí)現(xiàn)對(duì)鳶尾花數(shù)據(jù)集的KNN分類及生成分類結(jié)果8.3.2回歸
8.3.2回歸線性回歸線性回歸使用最佳的擬合線(回歸線)在因變量Y和自變量X間建立一種關(guān)系常見的線性回歸有一元線性回歸和多元線性回歸如果回歸分析中只包括一個(gè)自變量和一個(gè)因變量,且二者的關(guān)系可用一條直線近似表示,稱為一元線性回歸分析,也稱為單變量線性回歸。其在二維空間是一條直線,是線性回歸最簡(jiǎn)單的形式如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。其在三維空間是一個(gè)平面,在多維空間是一個(gè)超平面8.3.2回歸
8.3.2回歸
8.3.2回歸線性回歸的實(shí)現(xiàn)(1)確定自變量和因變量(2)建立預(yù)測(cè)模型(3)變量間的相關(guān)性檢驗(yàn)(4)模型的評(píng)估和檢驗(yàn)(5)利用回歸預(yù)測(cè)模型進(jìn)行預(yù)測(cè)和控制8.3.3神經(jīng)網(wǎng)絡(luò)線性回歸體驗(yàn)實(shí)現(xiàn)對(duì)線性回歸方程的擬合及顯示運(yùn)行結(jié)果8.3.3神經(jīng)網(wǎng)絡(luò)
8.3.3神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)體驗(yàn)8.3.3神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)體驗(yàn)(1)參數(shù)設(shè)置區(qū)域可以設(shè)置Epoch(訓(xùn)練次數(shù))、Learningrate(學(xué)習(xí)率)、Activation(激活函數(shù))、Regularization(正則化)、Regularizationrate(正則化率)和Problemtype(問題類型)①學(xué)習(xí)率:學(xué)習(xí)率是梯度下降算法的超參數(shù),用以決定在優(yōu)化過程中模型權(quán)重更新的速度和幅度②激活函數(shù):TensorFlow游樂場(chǎng)支持Sigmoid、Tanh、ReLU和Linear函數(shù)③問題類型:TensorFlow游樂場(chǎng)預(yù)設(shè)了分類問題(預(yù)測(cè)結(jié)果為離散型數(shù)據(jù))和回歸問題(預(yù)測(cè)結(jié)果為連續(xù)型數(shù)據(jù))兩種(2)DATA區(qū)域DATA區(qū)域中提供了四種不同類型的數(shù)據(jù):圓形、異或、高斯和螺旋。每個(gè)點(diǎn)代表一個(gè)樣例,不同的顏色代表不同類別。橙色一般代表負(fù)值,藍(lán)色代表正值還提供了用于數(shù)據(jù)微調(diào)的按鍵:訓(xùn)練集與測(cè)試集的比例、噪聲和批次的大小8.3.3神經(jīng)網(wǎng)絡(luò)
FOUR8.4人工智能的未來發(fā)展8.4.1AI發(fā)展的技術(shù)趨勢(shì)8.4.2大模型的未來與安全8.4.1AI發(fā)展的技術(shù)趨勢(shì)深度學(xué)習(xí)的新模型在深度學(xué)習(xí)領(lǐng)域,新的模型和算法不斷涌現(xiàn),其中Transformer和BERT等模型因其出色的性能而備受關(guān)注。這些模型不僅推動(dòng)了自然語言處理的發(fā)展,還為其他領(lǐng)域的研究提供了新思路。8.4.1AI發(fā)展的技術(shù)趨勢(shì)深度強(qiáng)化學(xué)習(xí)的進(jìn)步深度強(qiáng)化學(xué)習(xí)(DeepReinforcementLearning,DRL)結(jié)合了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的技術(shù)。通過在環(huán)境中執(zhí)行動(dòng)作并從環(huán)境中獲取反饋來學(xué)習(xí),從而逐漸提高其行為策略。深度強(qiáng)化學(xué)習(xí)的主要組成部分包括深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork)、狀態(tài)(State)、動(dòng)作(Action)、獎(jiǎng)勵(lì)(Reward)和策略(policy)。DRL的核心是基于價(jià)值函數(shù)的優(yōu)化過程。通過不斷迭代地更新神經(jīng)網(wǎng)絡(luò)參數(shù),智能體能夠?qū)W習(xí)到最優(yōu)的策略。這種優(yōu)化過程使得DRL在應(yīng)對(duì)不確定性和復(fù)雜性方面表現(xiàn)出色。近年來,模型優(yōu)化技術(shù),如梯度下降、Adam等的出現(xiàn),顯著提升了DRL模型的訓(xùn)練效率。這些優(yōu)化算法能夠更快地找到模型的最優(yōu)解,減少訓(xùn)練時(shí)間和計(jì)算資源的需求。數(shù)據(jù)增強(qiáng)、正則化等方法的應(yīng)用,使得DRL模型的泛化能力得到了顯著提升。這意味著模型在未見過的環(huán)境中也能做出合理的決策,提高了模型的適應(yīng)性和魯棒性。。8.4.1AI發(fā)展的技術(shù)趨勢(shì)多模態(tài)融合與跨領(lǐng)域應(yīng)用多模態(tài)生成式AI將成為未來的重要發(fā)展方向,這類系統(tǒng)具備強(qiáng)大的處理能力,能夠同時(shí)處理文本、聲音、旋律和視覺信號(hào)等不同類型的輸入信息。它們能夠?qū)⑦@些信息融合起來,進(jìn)行綜合理解和分析,從而產(chǎn)生更加豐富和準(zhǔn)確的結(jié)果8.4.1AI發(fā)展的技術(shù)趨勢(shì)邊緣計(jì)算與云計(jì)算協(xié)同發(fā)展隨著物聯(lián)網(wǎng)和5G通信技術(shù)的普及,邊緣計(jì)算將成為AI技術(shù)發(fā)展的重要趨勢(shì)物聯(lián)網(wǎng)的發(fā)展使得越來越多的設(shè)備能夠連接到互聯(lián)網(wǎng),這些設(shè)備產(chǎn)生的數(shù)據(jù)量巨大,如果全部傳輸?shù)皆贫诉M(jìn)行處理,不僅會(huì)消耗大量的帶寬資源,還會(huì)導(dǎo)致數(shù)據(jù)傳輸?shù)难舆t5G通信技術(shù)的普及為邊緣計(jì)算提供了更高速、更穩(wěn)定的網(wǎng)絡(luò)環(huán)境。5G技術(shù)的大帶寬、低延遲特性,使得在網(wǎng)絡(luò)邊緣進(jìn)行數(shù)據(jù)處理成為可能,大大提高了邊緣計(jì)算的效率邊緣計(jì)算核心思想是將計(jì)算任務(wù)和數(shù)據(jù)存儲(chǔ)從云端轉(zhuǎn)移到網(wǎng)絡(luò)邊緣的設(shè)備上數(shù)據(jù)在產(chǎn)生的地方就能得到處理,無需經(jīng)過長(zhǎng)距離的傳輸,減少了數(shù)據(jù)傳輸?shù)难舆t和帶寬需求這也使得系統(tǒng)能夠更快地響應(yīng)用戶的需求,提高了系統(tǒng)的實(shí)時(shí)性8.4.1AI發(fā)展的技術(shù)趨勢(shì)量子AI的崛起量子計(jì)算的引入將為AI帶來巨大的計(jì)算速度提升傳統(tǒng)的計(jì)算機(jī)在處理復(fù)雜的數(shù)據(jù)集和執(zhí)行高級(jí)算法時(shí),往往會(huì)受到計(jì)算能力的限制。而量子計(jì)算機(jī),憑借其能夠同時(shí)處理大量數(shù)據(jù)的能力,將極大地縮短AI模型的訓(xùn)練時(shí)間,使得原本需要數(shù)周甚至數(shù)月才能完成的計(jì)算任務(wù),在幾分鐘或幾小時(shí)內(nèi)就能完成量子計(jì)算與AI的結(jié)合將促進(jìn)機(jī)器學(xué)習(xí)算法的創(chuàng)新量子算法,如量子支持向量機(jī)(QSVM)和量子神經(jīng)網(wǎng)絡(luò)等,已經(jīng)在理論和實(shí)驗(yàn)中展示出了超越傳統(tǒng)算法的性能。這些算法不僅能夠提高模型的準(zhǔn)確性,還能在處理高維數(shù)據(jù)時(shí)保持較低的復(fù)雜度,從而為AI應(yīng)用提供更為強(qiáng)大的分析工具通用人工智能(AGI)AI領(lǐng)域的一個(gè)長(zhǎng)期目標(biāo),旨在創(chuàng)建能夠在各種任務(wù)上匹敵人類智能的系統(tǒng)量子計(jì)算的加入可能會(huì)為實(shí)現(xiàn)AGI提供關(guān)鍵的技術(shù)突破8.4.2大模型的未來與安全智力外腦開啟智力即服務(wù)大型語言模型(LLM)為人工智能領(lǐng)域帶來了前所未有的推理能力LLM在理解和生成自然語言方面取得的巨大突破能夠解析復(fù)雜的文本,提取關(guān)鍵信息,執(zhí)行邏輯推理,并產(chǎn)生連貫且深刻的回答
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026山東事業(yè)單位統(tǒng)考濰坊諸城市招聘40人備考題庫帶答案詳解
- 跨境電商獨(dú)立站2025年帶貨合作合同協(xié)議
- 初級(jí)測(cè)量考試題庫及答案
- 2025-2026人教版小學(xué)三年級(jí)科學(xué)上學(xué)期測(cè)試卷
- 高三歷史a卷試題及答案
- 2025-2026人教版三年級(jí)語文期末測(cè)試卷
- 校衛(wèi)生室職責(zé)及管理制度
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院超市管理制度
- 衛(wèi)生院出納管理制度
- 學(xué)校衛(wèi)生室診室管理制度
- 八年級(jí)地理上冊(cè)《中國的氣候》探究式教學(xué)設(shè)計(jì)
- 重慶市2026年高一(上)期末聯(lián)合檢測(cè)(康德卷)化學(xué)+答案
- 2026年湖南郴州市百福控股集團(tuán)有限公司招聘9人備考考試題庫及答案解析
- 2026貴州黔東南州公安局面向社會(huì)招聘警務(wù)輔助人員37人考試備考題庫及答案解析
- 鐵路除草作業(yè)方案范本
- 2026屆江蘇省常州市生物高一第一學(xué)期期末檢測(cè)試題含解析
- 2026年及未來5年市場(chǎng)數(shù)據(jù)中國高溫工業(yè)熱泵行業(yè)市場(chǎng)運(yùn)行態(tài)勢(shì)與投資戰(zhàn)略咨詢報(bào)告
- 教培機(jī)構(gòu)排課制度規(guī)范
- 2026年檢視問題清單與整改措施(2篇)
- 國家開放大學(xué)《基礎(chǔ)教育課程改革專題》形考任務(wù)(1-3)試題及答案解析
- 車載HUD產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2025)-CAICV智能車載光顯示任務(wù)組
評(píng)論
0/150
提交評(píng)論