人工智能大語言模型應用教程 課件 模塊6 Gemma2模型應用與微調_第1頁
人工智能大語言模型應用教程 課件 模塊6 Gemma2模型應用與微調_第2頁
人工智能大語言模型應用教程 課件 模塊6 Gemma2模型應用與微調_第3頁
人工智能大語言模型應用教程 課件 模塊6 Gemma2模型應用與微調_第4頁
人工智能大語言模型應用教程 課件 模塊6 Gemma2模型應用與微調_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人工智能大語言模型應用教程模塊6

Gemma2模型應用與微調學習

目標

了解Gemma2模型;

理解Gemma2模型的推理、量化和微調的原理;

能夠搭建Gemma2模型開發(fā)環(huán)境,并進行推理;

能夠使用Ollama量化Gemma2模型;

能夠獲取Gemma2模型微調所用的數(shù)據(jù)集(語料),并進行微調;

培養(yǎng)良好的道德品質和職業(yè)素養(yǎng);

培養(yǎng)創(chuàng)新思維和自主學習能力;

培養(yǎng)嚴謹、求實、創(chuàng)新的科學精神,培養(yǎng)分析解決問題的能力。6.2Gemma2模型應用與微調設計目標開發(fā)環(huán)境原理學習實驗步驟6.36.46.16.1設計目標什么是GemmaGemma是GoogleDeepMind基于Gemini的研究成果和技術推出的一系列開放權重大型語言模型。是一系列輕量級、開放式模型是文本到文本(TextToText)、僅解碼器(DecoderOnly)的大型語言模型設計目標Gemma的特點6.2開發(fā)環(huán)境推理與微調硬件:服務器、推理卡(NVIDIA16G顯存以上)軟件:Python、大語言模型google/gemma-2-2b-it、VSCode編輯器硬件:筆記本電腦或PC機,4核CPU、8G以上內存,無需GPU軟件:Ollama開發(fā)環(huán)境量化6.3原理學習基本信息與版本特點Gemma2是Google基于Gemini技術推出的新型大型語言模型,提供2B、9B和27B等不同規(guī)模版本,各版本又分預訓練基礎版和指令優(yōu)化版。其中9B以下版本可在RTX4090、RTX3090、P100、T4等消費級推理卡硬件上運行。Gemma2原始模型在發(fā)布,與Huggingface合作集成至其生態(tài),轉化為Huggingface格式供開發(fā)者免費下載。使用Huggingface的Transformers庫加載運行,和LLama-3等模型使用方式類似。推理時用AutoModelForCausalLM.from_pretrained加載模型,model.generate推理,加載模型采用load_in_8bit和load_in_4bit量化模式,過程順暢且資源占用少。推理方法發(fā)布、集成及使用方式大語言模型量化指降低模型精度,使其能在CPU等低算力條件下運行。這一過程通過技術手段調整模型參數(shù)表示方式,在一定程度上犧牲精度,換取更低的硬件資源需求和更廣泛的運行環(huán)境適配性。Google為Gemma2提供gemma.cpp項目,用于基礎模型量化。gemma.cpp是輕量級獨立C++推理引擎,專注于簡單直接的實現(xiàn),能助力Gemma2在低算力下高效運行,不過通用性并非其重點考量。Ollama是大語言模型本地部署工具,基于Llama模型和llama.cpp框架構建。它通過裝入GGUF格式大模型文件實現(xiàn)低算力推理,原理是壓縮大模型參數(shù)以加快載入并降低資源消耗,同時用C++重寫推理代碼提升性能。Ollama最初為解決Llama系列量化推理問題而生,如今功能擴展,不僅支持Llama系列模型,還支持Mistral、Gemma2、GLM-4等非Llama架構模型,但量化模型推理效果遜于原始模型。量化過程LoRA微調低秩適配(LoRA)是一種用于大語言模型(LLM)的參數(shù)高效微調技術,這種微調方案只針對模型參數(shù)的一小部分進行微調,通過凍結原始模型并只訓練被分解為低秩矩陣的適配器層,以此提高微調效率、減少“災難性遺忘”等問題。微調策略6.4實驗步驟實驗步驟推理:

建立虛擬環(huán)境

下載模型開發(fā)推理樣例實驗步驟效果展示:

實驗步驟量化:

Ollama安裝curl-fsSL/install.sh|sh

運行量化模型以gemma2-9b的量化模型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論