人工智能應(yīng)用技術(shù)基礎(chǔ) 課件 項目八 擁抱AI大模型的奇妙世界_第1頁
人工智能應(yīng)用技術(shù)基礎(chǔ) 課件 項目八 擁抱AI大模型的奇妙世界_第2頁
人工智能應(yīng)用技術(shù)基礎(chǔ) 課件 項目八 擁抱AI大模型的奇妙世界_第3頁
人工智能應(yīng)用技術(shù)基礎(chǔ) 課件 項目八 擁抱AI大模型的奇妙世界_第4頁
人工智能應(yīng)用技術(shù)基礎(chǔ) 課件 項目八 擁抱AI大模型的奇妙世界_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

大模型技術(shù)的基本概念人工智能應(yīng)用技術(shù)基礎(chǔ)2CONTENTS大模型的定義、內(nèi)涵、作用01大模型的發(fā)展歷程02大模型的類型03大模型的

定義、內(nèi)涵、作用——PART01大模型的定義、內(nèi)涵、作用4一、大模型的定義大模型是指具有數(shù)千萬甚至數(shù)億參數(shù)的深度學(xué)習(xí)模型。隨著計算機技術(shù)和大數(shù)據(jù)的快速發(fā)展,研究者們?yōu)榱颂嵘P偷男阅?,不斷嘗試增加模型的參數(shù)數(shù)量,從而誕生了大模型這一概念。大模型通常由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建而成,擁有數(shù)十億甚至數(shù)千億個參數(shù),其設(shè)計目的是為了提高模型的表達能力和預(yù)測性能,以處理更加復(fù)雜的任務(wù)和數(shù)據(jù)。大模型的定義、內(nèi)涵、作用5二、大模型的內(nèi)涵a.規(guī)模龐大大模型包含數(shù)十億甚至數(shù)千億個參數(shù),模型大小可以達到數(shù)百GB甚至更大。這種巨大的規(guī)模為其提供了強大的表達能力和學(xué)習(xí)能力。b.多任務(wù)學(xué)習(xí)大模型通常會一起學(xué)習(xí)多種不同的NLP任務(wù),使其能夠?qū)W習(xí)到更廣泛和泛化的語言理解能力。c.計算資源要求高訓(xùn)練大模型需要巨大的計算資源,通常需要數(shù)百甚至上千個GPU,以及大量的時間,通常在幾周到幾個月不等。d.數(shù)據(jù)需求量大大模型需要大量的數(shù)據(jù)來進行訓(xùn)練,只有大量的數(shù)據(jù)才能發(fā)揮大模型的參數(shù)規(guī)模優(yōu)勢。大模型的定義、內(nèi)涵、作用6三、大模型的作用a.提升任務(wù)性能大模型由于其龐大的參數(shù)規(guī)模和強大的學(xué)習(xí)能力,可以在各種任務(wù)上取得更好的性能。b.促進技術(shù)創(chuàng)新大模型的發(fā)展推動了人工智能技術(shù)的創(chuàng)新,如Transformer架構(gòu)的提出和應(yīng)用,為大模型的發(fā)展提供了重要支撐。c.拓寬應(yīng)用領(lǐng)域大模型的應(yīng)用領(lǐng)域非常廣泛,包括智能助手、智能客服、智能翻譯、圖像識別、語音識別、自動駕駛、金融風(fēng)控等多個領(lǐng)域。d.推動產(chǎn)業(yè)升級電商行業(yè)通過AIGC+電商模式推進虛實交融,營造沉浸體驗;影視行業(yè)通過AIGC+影視模式拓展創(chuàng)作空間,提升作品質(zhì)量;娛樂行業(yè)通過AIGC+娛樂模式擴展輻射邊界,獲得發(fā)展動能等。大模型的發(fā)展歷程——PART02大模型的發(fā)展歷程8一、萌芽期(1950-2005)1956年,計算機專家約翰·麥卡錫首次提出“人工智能”概念,標(biāo)志著AI領(lǐng)域的正式誕生。1980年,卷積神經(jīng)網(wǎng)絡(luò)的雛形出現(xiàn),為后續(xù)的深度學(xué)習(xí)奠定了基礎(chǔ)。1998年,現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)LeNet-5誕生,推動了機器學(xué)習(xí)方法由淺層機器學(xué)習(xí)向深度學(xué)習(xí)的轉(zhuǎn)變。大模型的發(fā)展歷程9二、沉淀期(2006-2019)此階段以Transformer為代表的全新神經(jīng)網(wǎng)絡(luò)模型成為主流。Transformer架構(gòu)的提出,奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)。2013年,自然語言處理模型Word2Vec誕生,將單詞轉(zhuǎn)換為向量,研究便于新計算機階段處理文本數(shù)據(jù)。2014年,GAN的出現(xiàn),標(biāo)志著深度學(xué)習(xí)進入了生成模型大模型初現(xiàn):2017年,Google提出Transformer架構(gòu),隨后在2018年,OpenAI和Google分別發(fā)布了GPT-1與BERT大模型,標(biāo)志著預(yù)訓(xùn)練大模型成為自然語言處理領(lǐng)域的主流。大模型的發(fā)展歷程10三、爆發(fā)期(2020年至今)大模型的參數(shù)規(guī)模迅速擴大,從億級發(fā)展到百億級、千億級,甚至更高。如GPT-3的參數(shù)規(guī)模達到了1750億。更多策略如基于人類反饋的強化學(xué)習(xí)、代碼預(yù)訓(xùn)練、指令微調(diào)等被用于提升大模型的推理能力和任務(wù)泛化能力。大模型在多個領(lǐng)域得到廣泛應(yīng)用,如自然語言處理、計算機視覺、語音識別等。其中,ChatGPT的推出更是引發(fā)了全球范圍內(nèi)的關(guān)注和討論。大模型的類型——PART03大模型的類型12一、語言大模型語言大模型是人工智能領(lǐng)域最具代表性的大模型之一,主要用于自然語言處理任務(wù)。語言大模型通過大量文本數(shù)據(jù)進行訓(xùn)練,能夠處理文本的生成、理解和分析等任務(wù)。其廣泛應(yīng)用于機器翻譯、對話系統(tǒng)、文本生成、情感分析等領(lǐng)域。大模型的類型13二、視覺大模型視覺大模型主要用于計算機視覺任務(wù),如圖像分類、目標(biāo)檢測、圖像分割、圖像生成等。隨著深度學(xué)習(xí)的進步,視覺大模型通過大規(guī)模的圖像數(shù)據(jù)訓(xùn)練,能夠有效提取和理解圖像中的復(fù)雜特征。視覺大模型的核心技術(shù)包括卷積神經(jīng)網(wǎng)絡(luò)和Transformer架構(gòu)。CNN通過卷積操作提取圖像中的局部特征,池化操作縮減特征維度,逐層抽象出更高層次的語義信息。Transformer則通過自注意力機制在圖像塊之間建立長距離依賴關(guān)系,從而提升對全局特征的理解。感謝觀看Thankyouforwatching.多模態(tài)大模型的技術(shù)發(fā)展人工智能應(yīng)用技術(shù)基礎(chǔ)16CONTENTS模態(tài)與多模態(tài)01多模態(tài)大模型的技術(shù)體系02多模態(tài)大模型的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計03多模態(tài)大模型的自監(jiān)督學(xué)習(xí)優(yōu)化04多模態(tài)大模型的下游任務(wù)微調(diào)適配05模態(tài)與多模態(tài)——PART01模態(tài)與多模態(tài)18一、模態(tài)模態(tài)在多個領(lǐng)域中有不同的定義,但在數(shù)據(jù)處理和人工智能領(lǐng)域,它通常指的是單一類型的數(shù)據(jù)或信息源。這些數(shù)據(jù)類型或信息源可以是多種多樣的。在更廣泛的工程領(lǐng)域,模態(tài)還可以指結(jié)構(gòu)系統(tǒng)的固有振動特性,這是結(jié)構(gòu)動力學(xué)中的一個重要概念。然而,在數(shù)據(jù)處理和人工智能的上下文中,我們主要關(guān)注其作為數(shù)據(jù)類型或信息源的定義。模態(tài)與多模態(tài)19二、多模態(tài)多模態(tài)則是指同時使用兩種或多種不同類型的模態(tài)進行信息交互或處理的方式。多模態(tài)技術(shù)的核心優(yōu)勢在于能夠整合多種類型的數(shù)據(jù),從而提供更全面、更豐富的信息。這種綜合性的信息處理方式有助于提高人工智能系統(tǒng)的性能和應(yīng)用范圍。多模態(tài)大模型

的技術(shù)體系——PART02多模態(tài)大模型的技術(shù)體系21一、核心算法與技術(shù)a.深度學(xué)習(xí)多模態(tài)大模型常基于Transformer架構(gòu),該架構(gòu)在處理序列數(shù)據(jù)方面表現(xiàn)出色,能夠同時處理不同模態(tài)的數(shù)據(jù)。通過深度學(xué)習(xí)模型提取不同模態(tài)數(shù)據(jù)的特征,并將其編碼為模型可理解的向量形式。多模態(tài)大模型的技術(shù)體系22一、核心算法與技術(shù)b.多模態(tài)融合將不同模態(tài)的特征向量直接拼接成一個新的特征向量,用于后續(xù)處理。利用注意力機制來學(xué)習(xí)不同模態(tài)之間的關(guān)系,從而實現(xiàn)多模態(tài)信息的有效融合。將不同模態(tài)的信息表示為圖中的節(jié)點,利用圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)節(jié)點之間的關(guān)系,實現(xiàn)多模態(tài)信息的整合。c.跨模態(tài)語義對齊通過對比學(xué)習(xí)、自監(jiān)督學(xué)習(xí)等方法,實現(xiàn)不同模態(tài)之間的語義對齊,使得模型能夠理解不同模態(tài)之間的關(guān)聯(lián)和互補性。多模態(tài)大模型的技術(shù)體系23二、技術(shù)體系架構(gòu)多模態(tài)大模型的技術(shù)體系架構(gòu)通常包括以下幾個部分:多模態(tài)大模型

的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計——PART03多模態(tài)大模型的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計25一、多模態(tài)大模型的架構(gòu)設(shè)計多模態(tài)大模型的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計是一個復(fù)雜而關(guān)鍵的過程,它旨在融合多種模態(tài)的信息,以提高模型的理解和推理能力。設(shè)計這樣的模型涉及對網(wǎng)絡(luò)結(jié)構(gòu)的精心規(guī)劃,以確保能夠有效地捕捉不同模態(tài)之間的關(guān)系,融合信息并進行預(yù)測或生成。多模態(tài)大模型通常采用模塊化設(shè)計,將不同模態(tài)的處理模塊分開,便于對每種模態(tài)進行特定的特征提取和表示學(xué)習(xí)。這種設(shè)計方式可以有效管理不同模態(tài)的復(fù)雜性,并使得各模塊可以獨立優(yōu)化。多模態(tài)大模型的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計26二、多模態(tài)大模型的網(wǎng)絡(luò)結(jié)構(gòu)多模態(tài)大模型

的自監(jiān)督學(xué)習(xí)優(yōu)化——PART04多模態(tài)大模型的自監(jiān)督學(xué)習(xí)優(yōu)化28一、數(shù)據(jù)增強與視圖生成a.數(shù)據(jù)增強通過對原始數(shù)據(jù)進行變換,如旋轉(zhuǎn)、裁剪、顏色抖動等,生成多個視圖,以豐富訓(xùn)練數(shù)據(jù)的多樣性。這些變換后的視圖在保持?jǐn)?shù)據(jù)關(guān)鍵信息的同時,增加了模型的泛化能力。b.視圖生成利用圖增強技術(shù)或其他方法生成原始數(shù)據(jù)的輔助視圖,以供自監(jiān)督學(xué)習(xí)使用。這些視圖可以是不同模態(tài)之間的轉(zhuǎn)換,也可以是同一模態(tài)內(nèi)的不同表示。多模態(tài)大模型的自監(jiān)督學(xué)習(xí)優(yōu)化29二、對比學(xué)習(xí)與目標(biāo)函數(shù)a.對比學(xué)習(xí)通過最大化正樣本對之間的相似性和最小化負(fù)樣本對之間的相似性來訓(xùn)練模型。在無負(fù)樣本的情況下,可以利用數(shù)據(jù)增強生成的視圖作為正樣本對,通過對比不同視圖之間的相似性來優(yōu)化模型。b.目標(biāo)函數(shù)設(shè)計合理的目標(biāo)函數(shù)來指導(dǎo)模型的訓(xùn)練。常見的目標(biāo)函數(shù)包括對比損失、三元組損失等。這些目標(biāo)函數(shù)能夠有效地捕捉數(shù)據(jù)之間的相似性和差異性。多模態(tài)大模型

的下游任務(wù)微調(diào)適配——PART05多模態(tài)大模型的下游任務(wù)微調(diào)適配31一、微調(diào)適配的方法a.多任務(wù)指令微調(diào)這種方法涉及對多模態(tài)大模型進行多任務(wù)訓(xùn)練,即同時考慮多個下游任務(wù)的數(shù)據(jù)和指令。然而,不同任務(wù)之間可能存在沖突,導(dǎo)致模型在泛化能力上有所下降。因此,在微調(diào)過程中需要仔細(xì)平衡不同任務(wù)的需求。b.稀疏專家模型與通用專家結(jié)合為了解決多任務(wù)指令微調(diào)中的任務(wù)沖突問題,研究人員提出了利用稀疏專家模型與通用專家結(jié)合的方法。不同的專家處理不同的任務(wù),而通用專家則從所有數(shù)據(jù)中學(xué)習(xí)指令泛化能力。多模態(tài)大模型的下游任務(wù)微調(diào)適配32一、微調(diào)適配的方法c.動態(tài)專家模塊另一種方法是利用超參數(shù)網(wǎng)絡(luò)與適配器構(gòu)建動態(tài)專家模塊。這種方法可以根據(jù)輸入的感覺特征動態(tài)生成參數(shù),從而實現(xiàn)視覺與語言對齊以及多模態(tài)指令微調(diào)的動態(tài)調(diào)整。d.輕量級適配方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論