生成式人工智能應用實戰(zhàn)課_第1頁
生成式人工智能應用實戰(zhàn)課_第2頁
生成式人工智能應用實戰(zhàn)課_第3頁
生成式人工智能應用實戰(zhàn)課_第4頁
生成式人工智能應用實戰(zhàn)課_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

生成式人工智能應用實戰(zhàn)(慕課版)第1章AI與AIGC概述引導案例方太×百度,打造全AI定制營銷內容CONTENTS目錄01認識AI02認識AIGC03認識大模型04認識智能體認識AI人工智能(ArtificialIntelligence,AI)早已不是科幻小說里的抽象概念,而是滲透生活多個方面的真實存在。AI不僅是一行行代碼,更是人類對“智能”本質的持續(xù)探索與自我超越。AI不僅是技術革命,還是對人類生產方式、社會結構乃至存在意義的深刻重塑。01.1.1.1AI的內涵AI是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術。AI試圖通過模擬人類的思維方式和行為模式,使計算機具備感知、學習、推理、決策甚至部分創(chuàng)造性行為的能力,從而輔助或替代人類完成特定任務。AI的技術本質可以從計算基礎、認知模擬和進化路徑3個層面來理解。計算基礎AI依托大規(guī)模數據處理、算法模型和算力支撐,實現對信息的高效處理。認知模擬AI模仿人類的認知過程,包括感知能力、學習能力和推理決策。進化路徑從“弱AI”向“強AI”發(fā)展。1.1.1AI的內涵能力類型具體能力能力描述感知交互能力圖像識別圖像分類、目標檢測(如醫(yī)學影像識別腫瘤)、視頻理解(如監(jiān)控場景異常檢測)語音識別語音轉化(如將語音轉為文字)、語音合成(如AI主播的配音)、語義理解(如智能客服回答用戶問題)多模態(tài)交互結合文本、圖像、語音等多種信息,如AR試妝工具通過攝像頭識別用戶面部,實時模擬妝容效果學習和知識

處理能力構建知識圖譜將海量信息整理成結構化網絡(如百科知識圖譜梳理人物關系),支持復雜推理遷移學習將在一個任務中學習到的知識應用于其他任務推理和決策

能力邏輯推理在專家系統中,AI能模擬專家的決策過程。例如,在醫(yī)療診斷專家系統中,AI通過邏輯推理,從已知的事實(患者的癥狀等)推導出可能的疾病診斷智能決策利用強化學習來做出決策,如智能駕駛系統能根據感知到的信息調整自己的駕駛策略,以實現安全、高效地駕駛自然語言處理

能力語言理解聊天機器人可以理解用戶的問題并給出合適的回答內容生成根據用戶輸入的提示詞生成連貫的文本內容、圖像、音視頻等AI的主要能力1.1.2AI的發(fā)展層級層級一:對話交互者可以與人類進行對話的AI層級二:推理者具備推理能力,能解決常見問題的AI層級三:代理者能代替人類采取行動、完成任務的AI層級四:創(chuàng)新者能創(chuàng)造新事物的AI層級五:組織者能完成組織工作的AI1.1.3AI的核心要素數據數據是AI模型的“燃料”。數據可以是文本、圖像、音頻、視頻等多種形式。高質量的數據對訓練出高性能的AI模型至關重要。數據要準確、完整且具有代表性。算力算力是指計算機系統處理數據和執(zhí)行計算任務的能力。在AI領域,算力通常由高性能的圖形處理器(GPU)、張量處理器(TPU)等硬件提供。算力是AI模型訓練和推理的“引擎”。算法算法是AI模型的核心邏輯,用于處理數據和解決問題。在機器學習和深度學習中,算法包括各種模型架構和學習方法。算法是AI模型的“大腦”,決定了AI模型如何從數據中學習并做出決策。0102031.1.4AI的類型類型釋義特點弱AI也稱“窄AI”,指專門針對特定任務或領域設計的AI。這類AI在特定任務上表現出色,但不具備通用智能,無法像人類一樣靈活地處理各種不同的任務。例如,語音助手只能理解特定指令并執(zhí)行預設動作任務特定:只能在特定的任務或領域內工作;依賴數據和算法:需要大量的數據進行訓練,并且依賴特定的算法來實現功能;性能優(yōu)化:在特定任務上可以達到甚至超過人類水平,但無法泛化到其他任務上強AI具有廣泛認知能力的AI,它們能像人類一樣在多個領域和任務中表現出智能行為。這種AI具有自主學習、推理、規(guī)劃和創(chuàng)造的能力多領域適應性:能在多種不同的任務和領域中表現出智能行為,而不僅僅是特定的任務和領域;自主學習和推理:具有自主學習和推理的能力,能從經驗中學習并適應新的情況;情感和意識:理論上,強AI還可能具備情感和意識,能理解人類的情感和價值觀超AI超AI不但具備強AI的所有能力,而且在智力、創(chuàng)造力、學習能力等方面遠遠超過人類超越人類智能:在幾乎所有領域都具有超越人類的智能水平,能快速學習和掌握新知識;自我改進能力:具有自我改進和優(yōu)化的能力,能不斷升級自己的算法和技術架構弱AI、強AI和超AI(按照能力層級劃分)1.1.4AI的類型類型釋義示例決策式AI決策式AI是指通過分析數據和應用邏輯規(guī)則來做出最優(yōu)決策的AI系統。這些AI系統通常用于優(yōu)化決策過程,提供基于數據的建議或直接做出決策在醫(yī)療領域,專家系統能根據患者的癥狀和病史,提供診斷建議智能交通系統能根據交通流量和路況,優(yōu)化交通信號燈的控制推薦系統根據用戶的歷史行為和偏好,推薦商品或服務生成式AI生成式AI是指通過學習數據分布規(guī)律,能自主生成全新且符合人類認知的內容的AI系統生成新聞稿、小說、廣告文案或設計海報、插畫生成虛擬環(huán)境和角色生成影視特效素材制作AI虛擬主播決策式AI、生成式AI(按照功能目標劃分)1.1.4AI的類型項目決策式AI生成式AI目標基于數據和規(guī)則做出決策,找到最優(yōu)解生成新的內容輸出類型決策指令、行動方案文本、圖像、音頻、視頻等內容結果特性確定性(或可預測概率)隨機性、多樣性人類角色設定目標函數,驗證決策合理性提供創(chuàng)意方向,評估內容質量決策式AI與生成式AI的對比認識AIGC人工智能生成內容(ArtificialIntelligenceGeneratedContent,AIGC)標志著AI進入全新的發(fā)展時期,它重塑了內容產業(yè)的格局,正推動內容產業(yè)從“人類創(chuàng)作”向“人機協同創(chuàng)作”轉型,成為數字經濟時代重要的內容生成工具。02.1.2.1AIGC技術的功能與應用場景功能類別具體功能功能描述典型應用場景文本創(chuàng)作文章/文案生成根據關鍵詞或主題生成連貫的文本內容,如新聞、廣告文案、故事等文案撰寫、文學創(chuàng)作等對話系統模擬人類對話,提供問題回復、建議或情感交互智能客服文本優(yōu)化智能糾錯,擴寫、續(xù)寫、改寫、潤色內容等,如將口語化的文本轉為學術風格的文本等文章糾錯、文案優(yōu)化等文本翻譯將文本翻譯成不同語言跨語言交流、文檔翻譯等圖像創(chuàng)作圖像生成通過文本描述或草圖生成高質量圖像電商商品圖制作、廣告設計等圖像編輯圖像風格遷移,將圖像轉換為不同藝術風格,如油畫、水彩畫、素描等效果圖像后期編輯圖像優(yōu)化去除圖像中的瑕疵、劃痕、水印等,修復模糊、缺損圖像或提升分辨率老照片修復、醫(yī)學影像增強3D模型生成生成3D模型、虛擬場景影視特效制作、虛擬現實內容開發(fā)、建筑設計等AIGC的主要功能與典型應用場景1.2.1AIGC技術的功能與應用場景功能類別具體功能功能描述典型應用場景音頻創(chuàng)作語音合成將文本轉換為自然流暢的語音制作有聲讀物、語音播報等語音克隆復刻特定人的聲音影視配音、語音導航等音樂生成創(chuàng)作旋律、編曲或生成背景音樂影視配樂、個性化鈴聲等音頻編輯降噪、混音等音頻后期編輯視頻創(chuàng)作視頻生成根據腳本生成視頻短視頻創(chuàng)作、廣告視頻生成等視頻剪輯根據腳本快速拼接素材,添加特效短視頻后期處理視頻修復修復老視頻、增強畫質影視劇修復多模態(tài)生成跨模態(tài)內容轉換將圖像轉化為文本、表格等掃描圖片轉為文檔跨模態(tài)內容生成生成融合文本、圖像、音頻的交互式內容動態(tài)繪本、有聲漫畫代碼編輯代碼生成根據需求描述生成代碼軟件開發(fā)代碼優(yōu)化補全代碼、優(yōu)化代碼,糾正代碼錯誤等編程輔助AIGC的主要功能與典型應用場景1.2.1AIGC技術的功能與應用場景功能類別具體功能功能描述典型應用場景數據分析Excel處理拆分、合并Excel表格,數據清洗、查找等處理Excel表格數據運算對數據進行求和、求平均值、求極值、邏輯計算等數據計算數據分析對數據進行對比分析、交叉分析、關聯分析等數據解讀圖表生成生成可視化圖表,如柱狀圖、餅圖、折線圖等數據可視化個性化推薦基于用戶的行為數據生成定制化內容,如新聞推薦、商品推薦文案等電商平臺個性化商品推薦、社交媒體個性化內容推薦等情感分析分析文本內容、圖片內容、視頻內容的情感和情緒用戶評論分析虛擬場景生成構建虛擬空間,如虛擬展廳、數字孿生城等虛擬現實社交、數字直播間生成元宇宙中的虛擬角色與環(huán)境,如虛擬社交場景中的建筑、人物形象等元宇宙平臺開發(fā)、電商直播數字人主播基于地理信息數據生成3D場景模型城市規(guī)劃模擬AIGC的主要功能與典型應用場景1.2.2AIGC技術在不同領域的落地應用AIGC技術在教育領域的落地應用個性化學習支持教學行為分析與評估學業(yè)預警與幫扶教育資源生成與優(yōu)化01AIGC技術在醫(yī)療領域的落地應用醫(yī)學影像診斷定制個性化治療方案臨床輔助診療健康管理藥物研發(fā)02AIGC技術金融領域的落地應用智能客戶服務金融風險管理個性化投資建議智能金融營銷03AIGC技術在交通領域的落地應用智能交通管理智能駕駛輔助智能導航與路徑規(guī)劃041.2.2AIGC技術在不同領域的落地應用案例在線AIGC+廣電,激發(fā)內容創(chuàng)作

新活力1.2.3AIGC時代的人才發(fā)展趨勢AIGC技術的發(fā)展為從業(yè)者的職業(yè)發(fā)展帶來了諸多機遇,主要表現在以下4個方面:提高工作效率、催生新興職業(yè)、降低入門門檻、促進職業(yè)轉型。AIGC技術對職業(yè)發(fā)展帶來的機遇(1)技術素養(yǎng):熟悉AIGC原理、工具應用能力、問題解決能力(2)思維素養(yǎng):批判性思維、創(chuàng)新性思維、適應性思維(3)人文素養(yǎng):情感洞察與共情能力、文化語境敏感度、群體情感共鳴構建、抵制流量至上主義、引入人文議題、審美判斷力與創(chuàng)新(4)倫理與道德素養(yǎng):內容倫理審查、明確責任歸屬、尊重知識產權、堅持公平與公正AIGC時代從業(yè)者的素養(yǎng)要求在帶來機遇的同時,AIGC技術也為從業(yè)者的職業(yè)發(fā)展帶來不少挑戰(zhàn),主要體現在以下幾個方面:職業(yè)替代風險、技能更新壓力。AIGC技術對職業(yè)發(fā)展帶來的挑戰(zhàn)認識大模型大模型是近年來AI領域的重要突破,它不僅能學習海量的數據,還能像人類一樣進行邏輯推理、情感理解,甚至在某些領域展現出超越人類的精準判斷力。它不僅推動著AI技術的革新,還深刻地影響著人們的生活方式、思維方式和社會結構。03.1.3.1大模型的特點大模型的概念大模型是指基于深度學習技術,具有海量參數、強大的學習能力和泛化能力,能實現對自然語言、圖像、音頻等信息進行理解、生成與推理的人工智能模型。大模型的特點依賴大量數據學習能力強可遷移性高較好的泛化能力對計算資源有較高的需求1.3.2大模型的類型分類標準類型釋義特點按照任務類型劃分語言大模型基于大量文本數據訓練的模型,主要用于理解和生成自然語言能理解上下文信息,從而更準確地回答問題或生成文本;能生成連貫、自然的文本,如新聞文章、故事、代碼等視覺大模型基于大量圖像數據訓練的模型,主要用于圖像識別、分析和生成能自動學習圖像中的特征,如物體的形狀、顏色、紋理等;可以用于多種視覺任務,如圖像分類、目標檢測、圖像分割等;一些視覺大模型也可生成圖像,如根據文本描述生成圖像多模態(tài)大模型結合多種模態(tài)(如語言、圖像、語音等)數據的模型,能處理跨模態(tài)的任務能理解不同模態(tài)之間的關系,如理解圖像中的文字內容、根據語音生成圖像等;可以完成復雜的多模態(tài)任務,如圖文問答、語音驅動的圖像生成等;通過融合多種模態(tài)的數據,提高模型的性能和泛化能力按照應用領域劃分通用大模型不針對特定領域,可以在多個領域和任務上通用的大模型具有廣泛的應用能力,能處理多種類型的自然語言處理任務,如文本生成、文本分類、問答、翻譯等。它們通過預訓練大量的通用文本數據,學習到語言的通用規(guī)則和模式,因此可以適應多種場景垂直領域

大模型針對特定領域或特定任務/場景的大模型在特定領域或特定任務/場景的數據上進行訓練或微調,能更好地理解和處理特定領域或任務/場景的語言特點和專業(yè)術語大模型的類型劃分1.3.2大模型的類型分類標準類型釋義特點按照能力劃分推理大模型用于邏輯推理和復雜問題解決的大模型。它通過模擬人類的邏輯思維過程,能處理復雜的因果關系、邏輯推理、數學計算和多步推理任務能處理復雜的因果關系和邏輯鏈條;能進行多步推理,逐步解決問題;強調對因果關系、邏輯規(guī)則、數理規(guī)則的建模,如通過“逐步推導”生成中間推理步驟,而非直接輸出答案;擅長處理邏輯密度高的任務,如數學推導、邏輯分析、代碼生成、復雜問題拆解等非推理大模型側重于語言生成、上下文理解和自然語言處理,而不強調深度推理能力的大模型通過預訓練大量通用文本數據,學習語言的通用規(guī)律和模式,能處理各種類型的自然語言處理任務,如文本生成、問答、翻譯、分類等,但缺乏像推理模型那樣復雜的推理和決策能力;可根據不同的任務需求進行微調,快速適應各種應用場景;擅長處理多樣性高的任務,如文本生成、創(chuàng)意寫作、多輪對話、開放性問答等大模型的類型劃分1.3.3國內主流大模型的功能DeepSeek是杭州深度求索人工智能基礎技術研究有限公司開發(fā)的大模型,其主要功能如下:文本生成與處理、智能對話與問答、代碼生成與輔助、文檔處理、智能搜索與推薦、多語言支持。DeepSeek通義是由阿里云推出的大模型,具備強大的語言處理和多模態(tài)融合能力,其主要功能如下:文本生成與處理、多模態(tài)融合、多語言翻譯、對話與問答、編程輔助、數據可視化。通義豆包是抖音有限公司推出的一款大模型,其主要功能如下:文本生成與處理、多模態(tài)交互、代碼生成與優(yōu)化、數學與邏輯推理。豆包文心一言是百度推出的大模型,其主要功能如下:語言處理、多模態(tài)、信息處理與分析、多樣化服務。文心一言訊飛星火是由科大訊飛推出的認知智能大模型,其主要功能如下:多模態(tài)交互、文件處理、文本處理、邏輯推理、數學解答能力、代碼處理、個性化定制、插件拓展。訊飛星火混元是由騰訊公司全鏈路自研的大模型,其主要功能如下:多輪對話、內容創(chuàng)作、邏輯推理、知識增強、多模態(tài)生成?;煸J識智能體智能體是計算機科學、人工智能乃至諸多交叉學科領域中的核心概念之一,從智能家居中自動調節(jié)環(huán)境的控制系統,到金融市場中執(zhí)行策略的交易程序,再到城市交通中的智能交通系統,智能體的身影無處不在,它們以獨特的智能特性與自主行為能力,成為推動科技進步與社會發(fā)展的重要力量。04.1.4.1智能體的特性智能體的概念智能體是指能感知環(huán)境并根據感知信息自主做出決策和行動的應用或實體。智能體可以是軟件程序、機器人,甚至是一個系統,其目標是通過與環(huán)境的交互來實現特定的任務或目標。智能體的特性自主性社會能力反應性主動性1.4.1智能體的特性案例在線和府撈面,用智能體驅動美味升級1.4.2智能體的結構01傳感器是智能體感知外部環(huán)境信息的“感官器官”。它們能將環(huán)境中的各種信號轉換為智能體可以處理的數據格式。傳感器02執(zhí)行器是智能體用來對外部環(huán)境產生影響的部件。它根據智能體的決策系統發(fā)出

的指令,執(zhí)行具體的動作。執(zhí)行器03決策系統是智能體的“大腦”,根據感知器收集到的信息,通過算法和邏輯來做出決策,包括知識表示、推理、學習等模塊。決策系統04知識庫是智能體存儲和管理知識的結構。它包含了智能體在決策過程中需要的各種信息,如事實、規(guī)則、經驗等。知識庫05學習模塊通過從經驗中學習,更新知識庫和決策系統的參數。學習方式可以是監(jiān)督學習、無監(jiān)督學習、強化學習等。學習模塊06通信接口是智能體與其他智能體或外部系統進行信息交流的部分。它可以是網絡接口、語音接口等。通信接口07用戶界面是智能體與人類用戶交互的接口,包括圖形用戶界面、語音用戶界面、文本用戶界面。用戶界面1.4.2智能體的結構智能體“沈陽文旅”的用戶界面智能體名稱功能簡介智能輔助與推薦輸入對話框輸出區(qū)1.4.3智能體的運作原理0102030405反饋智能體的行動會對環(huán)境產生影響,環(huán)境會將新的狀態(tài)反饋給智能體。智能體通過感知新的狀態(tài),再次進入感知、理解、決策、行動的循環(huán)。理解智能體對感知到的信息進行處理和理解,通常涉及數據預處理、特征提取、語義分析等步驟。對于自然語言處理智能體來說,這一步可能包括分詞、詞性標注、句法分析等。行動智能體根據決策結果,通過執(zhí)行器執(zhí)行相應的行動。執(zhí)行器可以是物理設備,如機械臂、電機等,也可以是軟件接口,如發(fā)送指令、顯示結果等。決策智能體根據理解后的信息,結合自身的知識庫和目標,選擇一個或多個行動方案。決策方式有基于規(guī)則、基于模型、基于學習等。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論