版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
從ChatGPT到AIGC智能創(chuàng)作與應(yīng)用賦能目錄TOC\h\h第1章AIGC:引爆內(nèi)容生產(chǎn)力\h1.1ChatGPT:AI新紀(jì)元已經(jīng)開啟\h1.1.1智能應(yīng)用ChatGPT掀起AIGC熱潮\h1.1.2應(yīng)用場景:ChatGPT的多場景應(yīng)用\h1傳媒\h2電商\h3影視\h4教育\h5金融\h6醫(yī)療\h1.1.3關(guān)注要點:安全性+版權(quán)保護+道德問題\h1安全性\h2版權(quán)保護\h3道德問題\h1.1.4類ChatGPT產(chǎn)品出現(xiàn):阿里巴巴推出“通義千問”\h1.2發(fā)展梳理:從PGC到UGC再到AIGC\h1.2.1PGC:企業(yè)和平臺是內(nèi)容創(chuàng)作的主體\h1.2.2UGC:用戶成為內(nèi)容創(chuàng)作主體\h1.2.3AIGC:AI成為內(nèi)容創(chuàng)作主體\h1.3內(nèi)容生成:AIGC涵蓋多樣的內(nèi)容模態(tài)\h1.3.1AI圖像:AI繪畫趨于普遍\h1.3.2AI文本:方案、廣告、小說皆可智能生成\h1.3.3AI音樂:谷歌AI模型MusicLM實現(xiàn)音樂即興創(chuàng)作\h1.3.4AI編程:智能系統(tǒng)重新定義編程\h1錯誤自動查找\h2錯誤自動修復(fù)\h3代碼搜索\h1.4核心驅(qū)動力:AIGC賦能元宇宙\h1.4.1AIGC是元宇宙實現(xiàn)的生產(chǎn)力工具\h1.4.2由降本增效轉(zhuǎn)向創(chuàng)造價值,AIGC價值凸顯\h1.4.3書分享公眾號青藍書房\h第2章技術(shù)構(gòu)成:AIGC實現(xiàn)的關(guān)鍵技術(shù)\h2.1自然語言處理:賦予AI理解與生成能力\h2.1.1核心能力一:自然語言理解\h1篇章理解\h2文本摘要\h3情感分析\h4文本翻譯\h5問答系統(tǒng)\h2.1.2核心能力二:自然語言生成\h1相似問生成\h2可控文本生成\h2.2AIGC生成算法:提升AI創(chuàng)作能力\h2.2.1生成式AIVS分析式AI\h1生成式AI\h2分析式AI\h2.2.2AI算法成熟,創(chuàng)作能力爆發(fā)\h2.3預(yù)訓(xùn)練大模型崛起,賦能深度學(xué)習(xí)\h2.3.1預(yù)訓(xùn)練大模型發(fā)展,破解深度學(xué)習(xí)難題\h1預(yù)訓(xùn)練大模型能夠推進AI產(chǎn)業(yè)化發(fā)展,實現(xiàn)AI轉(zhuǎn)型\h2預(yù)訓(xùn)練大模型借助自監(jiān)督學(xué)習(xí)功能降低AI開發(fā)成本\h2.3.2破解通用性難題,應(yīng)用全方位突破\h2.4多模態(tài)交互技術(shù):實現(xiàn)全方位的人機交互\h2.4.1多模態(tài)交互:文字+語音+視覺+動作\h2.4.2多模態(tài)人機交互讓虛擬數(shù)字人更加鮮活\h第3章產(chǎn)業(yè)生態(tài):產(chǎn)業(yè)生態(tài)已現(xiàn)雛形\h3.1產(chǎn)業(yè)生態(tài)拆解:上中下游產(chǎn)業(yè)鏈逐步搭建\h3.1.1產(chǎn)業(yè)上游:提供核心數(shù)據(jù)服務(wù)\h1數(shù)據(jù)處理\h2數(shù)據(jù)標(biāo)注\h3數(shù)據(jù)治理\h3.1.2產(chǎn)業(yè)中游:搭建算法模型\h1AI實驗室\h2企業(yè)研究院\h3開源社區(qū)\h3.1.3產(chǎn)業(yè)下游:多領(lǐng)域應(yīng)用拓展\h1文本生成\h2圖片生成\h3音頻生成\h4視頻生成\h5其他\h3.2產(chǎn)業(yè)價值:消費端+產(chǎn)業(yè)端+社會端\h3.2.1消費端:AIGC推動數(shù)字內(nèi)容變革\h3.2.2產(chǎn)業(yè)端:合成數(shù)據(jù)指引AI發(fā)展路徑\h3.2.3社會端:解放人力,助力創(chuàng)造力提升\h3.3產(chǎn)業(yè)發(fā)展面臨的挑戰(zhàn)\h3.3.1知識產(chǎn)權(quán)挑戰(zhàn):數(shù)字內(nèi)容存在版權(quán)風(fēng)險\h3.3.2安全挑戰(zhàn):存在多方面安全風(fēng)險\h1內(nèi)容本身的安全問題\h2可能會引發(fā)違法犯罪行為\h3用戶隱私數(shù)據(jù)泄露\h第4章市場現(xiàn)狀:巨頭搶占市場新藍海\h4.1新賽道崛起:AIGC風(fēng)口已被點燃\h4.1.1資本流入,AIGC初創(chuàng)公司呈現(xiàn)爆發(fā)式增長趨勢\h1HuggingFace\h2Jasper\h3Synthesia\h4.1.2宣布布局,多只概念股漲停\h4.2科技巨頭布局AIGC已成趨勢\h4.2.1阿里巴巴:大模型研發(fā)+AIGC應(yīng)用\h4.2.2百度:全棧布局AI技術(shù),以AI虛擬數(shù)字人發(fā)力\h4.2.3字節(jié)跳動:發(fā)力AI視頻生成\h4.2.4微軟:以投資布局,積聚AIGC實力\h4.2.5谷歌:推出多種AIGC產(chǎn)品\h4.3商業(yè)化落地加速,AIGC服務(wù)已經(jīng)出現(xiàn)\h4.3.1AIGC云算力解決方案實現(xiàn)多種創(chuàng)作\h4.3.2AIGC算法與模型實現(xiàn)開源創(chuàng)作\h4.3.33D視頻內(nèi)容AIGC引擎服務(wù)獲得發(fā)展\h第5章AIGC+傳媒:人機協(xié)同,賦能媒體創(chuàng)作\h5.1AIGC滲透傳媒多環(huán)節(jié)\h5.1.1采編:語音識別轉(zhuǎn)文字工具+新聞內(nèi)容生成工具+視頻剪輯工具\h1語音識別轉(zhuǎn)文字工具\h2新聞內(nèi)容生成工具\h3視頻剪輯工具\h5.1.2傳播:虛擬主播自動播報\h1應(yīng)用范圍不斷拓展\h2應(yīng)用場景不斷升級\h3應(yīng)用形態(tài)日趨完善\h5.1.3互動:實現(xiàn)與觀眾的互動\h1人物信息識別\h2劇情信息識別\h3物品信息識別\h5.2AIGC傳媒的優(yōu)勢\h5.2.1三大前沿能力賦能內(nèi)容創(chuàng)作\h1智能數(shù)字內(nèi)容孿生\h2智能數(shù)字內(nèi)容編輯\h3智能數(shù)字內(nèi)容創(chuàng)作\h5.2.2媒介轉(zhuǎn)變,提升數(shù)字內(nèi)容的感官體驗\h5.3AIGC重構(gòu)傳媒領(lǐng)域數(shù)字營銷\h5.3.1AIGC+數(shù)字營銷:激發(fā)內(nèi)容創(chuàng)意\h5.3.2營銷方案快速生成,提高效率\h5.3.3藍色光標(biāo):AIGC“創(chuàng)策圖文”營銷套件\h1AI生成創(chuàng)意\h2AI生成策略\h3AI生成圖片\h4AI生成文本\h第6章AIGC+電商:虛實交互,打造沉浸式購物體驗\h6.1賦能內(nèi)容:電商內(nèi)容智能生成\h6.1.1AIGC文本生成:產(chǎn)品命名+產(chǎn)品描述+營銷郵件\h6.1.2AIGC圖片生成:AIGC繪畫工具自動生成圖片\h6.1.3AIGC視頻生成:為視頻創(chuàng)作打開想象空間\h6.2賦能場景:電商場景三維建模\h6.2.1智能生成3D模型,實現(xiàn)商品展示與試用\h6.2.2實現(xiàn)虛擬商城搭建,提供全景式虛擬購物場景\h6.3虛擬主播:電商營銷的好幫手\h6.3.1虛擬主播與真人主播合作,實現(xiàn)全天候直播\h6.3.2搭建溝通渠道,加深品牌與消費者的連接\h6.4虛擬IP:邀請代言+自建虛擬IP\h6.4.1邀請代言:AI虛擬偶像成為代言新寵\h6.4.2自建虛擬IP:屈臣氏推出AI代言人“屈晨曦”\h第7章AIGC+影視:智能創(chuàng)作,為影視創(chuàng)作提供新思路\h7.1AIGC影視劇本創(chuàng)作,激發(fā)創(chuàng)作者靈感\(zhòng)h7.1.1劇本數(shù)據(jù)分析+內(nèi)容智能生成,形成劇本初稿\h7.1.2海馬輕帆:AI寫作實現(xiàn)小說轉(zhuǎn)劇本\h7.2AIGC實現(xiàn)角色和場景創(chuàng)作\h7.2.1AI換臉和AI換聲\h1面部識別和檢測\h2提取人臉特征\h3人臉替換\h4人臉重建\h5質(zhì)量評估\h7.2.2AIGC實現(xiàn)虛擬演員打造\h7.2.3AIGC虛擬場景制作節(jié)省影視成本\h7.3智能剪輯,升級后期制作\h7.3.1對象自動識別:智能剪輯影片\h7.3.2內(nèi)容修復(fù):修復(fù)影視內(nèi)容\h7.3.3內(nèi)容形式轉(zhuǎn)換:影視內(nèi)容2D自動轉(zhuǎn)3D\h第8章AIGC+娛樂:邊界擴展,帶來多重新奇體驗\h8.1趣味內(nèi)容生成,激發(fā)用戶參與熱情\h8.1.1“AI動漫臉”成為破圈利器,引發(fā)用戶參與\h8.1.2虛擬偶像內(nèi)容創(chuàng)作,激發(fā)粉絲熱情\h8.1.3短視頻內(nèi)容創(chuàng)作,為創(chuàng)作者提供創(chuàng)意輔助\h8.2虛擬形象創(chuàng)作,連接虛擬世界與現(xiàn)實世界\h8.2.1AI自動生成虛擬形象,優(yōu)化體驗\h1社交平臺\h2游戲\h8.2.2ReadyPlayerMe+VRChat:個性化虛擬形象創(chuàng)建\h8.2.3AI生成數(shù)字服裝和數(shù)字潮玩,助推數(shù)字時尚發(fā)展\h8.3游戲內(nèi)容創(chuàng)作,AIGC釋放游戲活力\h8.3.1ChatGPT游戲應(yīng)用指引游戲AIGC創(chuàng)作模式\h8.3.2AIGC游戲創(chuàng)作平臺成為發(fā)展新方向\h1游戲創(chuàng)作平臺\h2大數(shù)據(jù)分析平臺\h3渲染集群\h8.3.3布局方向:自研模型+第三方模型\h8.4音樂內(nèi)容制作,更新音樂體驗\h8.4.1微軟AI模型:AI生成多種音頻文件\h8.4.2AIGC助力AI歌曲創(chuàng)作\h8.4.3百度元宇宙歌會實現(xiàn)AIGC創(chuàng)新\h第9章AIGC+教育:雙管齊下,推動教育“數(shù)智”轉(zhuǎn)型\h9.1AIGC推動教育數(shù)字化轉(zhuǎn)型\h9.1.1數(shù)字化工具變革教學(xué)模式\h9.1.2搭建更加智慧的教學(xué)環(huán)境\h1智慧教學(xué)交互系統(tǒng)打造良好的教學(xué)體驗\h2場景化方案子系統(tǒng)實現(xiàn)教學(xué)創(chuàng)新\h3UClass智慧教學(xué)平臺實現(xiàn)教學(xué)管理\h4AI智能運維,避免教學(xué)事故\h9.1.3智慧校園解決方案:為校園筑起安全屏障\h1AI人臉核驗技術(shù)\h2訪客管理功能\h3智慧校區(qū)安全管理體系\h9.2AIGC推動教育智能化變革\h9.2.1智能生成3D場景,實現(xiàn)虛實交互\h1虛擬校園\h2虛擬實驗室\h3網(wǎng)絡(luò)教育虛擬教室\h9.2.2AI分析實現(xiàn)個性化精準(zhǔn)教學(xué)\h9.2.3網(wǎng)易有道:嘗試將AIGC在教育場景落地\h9.3更新體驗:教學(xué)與學(xué)習(xí)體驗的雙重更新\h9.3.1AIGC賦能教師:輔助備課、教學(xué)和作業(yè)批改\h9.3.2AIGC賦能學(xué)生:AI虛擬教師帶來全新教學(xué)體驗\h第10章AIGC+工業(yè):工具革新,工業(yè)設(shè)計模式迭代\h10.1AIGC為工業(yè)設(shè)計提供工具\h10.1.1AIGC為設(shè)計師提供工具,輔助內(nèi)容設(shè)計\h10.1.2AIGC拓展建筑圖紙設(shè)計維度\h1高信息量的生成\h2建筑信息的轉(zhuǎn)化\h3建筑方案的拓展\h4三維模型的生成\h10.1.3人機共存,AI數(shù)字人與設(shè)計師攜手共創(chuàng)\h10.2英偉達:AIGC賽道不斷布局\h10.2.1Omniverse平臺:AI實現(xiàn)內(nèi)容生產(chǎn)\h1OmniverseAvatar\h2OmniverseReplicator\h3OmniverseAudio2Face\h4OmniverseCreate\h5OmniverseMachinima\h6OmniverseView\h10.2.2Magic3D:3D模型智能生成應(yīng)用\h第11章創(chuàng)投機遇:找準(zhǔn)方向,抓住時代機遇\h11.1以技術(shù)入局:瞄準(zhǔn)AI頂層技術(shù)\h11.1.1AI芯片研發(fā):滿足爆發(fā)的算力需求\h11.1.2AI大模型研發(fā):通過海量數(shù)據(jù)對大模型進行訓(xùn)練\h11.2以產(chǎn)品入局:多角度打造AIGC產(chǎn)品\h11.2.1文字生成:騰訊推出自動化新聞撰稿機器人Dreamwriter\h1建立數(shù)據(jù)庫\h2機器學(xué)習(xí)\h3寫作\h4審核\h5分發(fā)\h11.2.2繪畫生成:百度發(fā)布AI輔助創(chuàng)作平臺—文心·一格\h11.2.3視頻生成:Meta公司推出文字生成短視頻系統(tǒng)Make-A-Video\h11.2.4音頻生成:喜馬拉雅為創(chuàng)作者提供AI音頻合成工具\h1TTS音色難以演繹小說\h2跨語言合成\h3語音轉(zhuǎn)文字技術(shù)\h11.3AIGC領(lǐng)域投資機會\h11.3.1關(guān)注上游廠商,瞄準(zhǔn)AIGC基礎(chǔ)設(shè)施建設(shè)\h1商湯科技\h2海天瑞聲\h11.3.2關(guān)注下游應(yīng)用,多家企業(yè)嶄露頭角\h第12章未來圖景:未來已來,迎接AI下一個時代\h12.1技術(shù)趨勢:AI技術(shù)迭代深化AIGC發(fā)展\h12.1.1深度學(xué)習(xí)技術(shù)迭代,AIGC內(nèi)容產(chǎn)出更加智能\h1前深度學(xué)習(xí)階段\h2深度學(xué)習(xí)階段\h3超級深度學(xué)習(xí)階段\h12.1.2多模態(tài)技術(shù)發(fā)展,AIGC模型通用化能力更強\h12.1.3MaaS有望成為現(xiàn)實\h12.2參與主體擴散:由B端向C端擴散\h12.2.1ToB端的AIGC產(chǎn)品豐富,賦能企業(yè)發(fā)展\h12.2.2ToC端的AIGC工具多樣,引發(fā)用戶多種消費\h12.3行業(yè)應(yīng)用賽道拓寬:行業(yè)滲透不斷提升\h12.3.1金屬行業(yè):優(yōu)化行業(yè)管理全流程\h1能夠解決礦產(chǎn)采選中的痛點\h2能夠節(jié)約人力資源\h3能夠?qū)饘傩袠I(yè)的供應(yīng)鏈進行管理\h4能夠節(jié)約各項成本\h12.3.2機械行業(yè):機械設(shè)備智能升級\h1大模型變革生產(chǎn)力工具\h2ChatGPTAPI已經(jīng)發(fā)布,商業(yè)化落地潛力巨大\h12.3.3銀行業(yè):優(yōu)化銀行業(yè)務(wù)流程\h1銀行客服\h2業(yè)務(wù)前端\h3業(yè)務(wù)中端\h12.4落地場景蔓延:滲透生活的方方面面\h12.4.1數(shù)字員工多領(lǐng)域落地,解放人工\h12.4.2AIGC營銷多領(lǐng)域落地,自動生成視頻第1章AIGC:引爆內(nèi)容生產(chǎn)力AIGC指的是利用人工智能(AI)技術(shù)生成內(nèi)容,這是近年來AI領(lǐng)域的一項重大科研成果。AIGC在一定程度上代表了AI發(fā)展的新趨勢,其不僅推動內(nèi)容創(chuàng)作生產(chǎn)力大幅提升,而且賦能元宇宙,為元宇宙的發(fā)展提供核心驅(qū)動力。1.1ChatGPT:AI新紀(jì)元已經(jīng)開啟隨著深度學(xué)習(xí)、自然語言處理等AI技術(shù)的深度發(fā)展,ChatGPT橫空出世,且在各大領(lǐng)域中得到應(yīng)用和發(fā)展。ChatGPT為眾多大型企業(yè)打造了更加便捷、高效的服務(wù)方式,幫助企業(yè)進一步實現(xiàn)了降本增效。如今,人類已經(jīng)進入AI發(fā)展的新紀(jì)元。1.1.1智能應(yīng)用ChatGPT掀起AIGC熱潮2022年11月30日,人工智能研究公司OpenAI推出了新一代聊天機器人—ChatGPT。智能應(yīng)用ChatGPT是AI文本處理方式的新研究和新突破,掀起了AIGC熱潮,刺激了眾多大型企業(yè)加快布局智能化內(nèi)容生成領(lǐng)域。ChatGPT基于GPT-3.5參數(shù)規(guī)模和底層數(shù)據(jù),對原有的數(shù)據(jù)規(guī)模進行了進一步拓展,也對原有的數(shù)據(jù)模型進行了進一步強化和完善,實現(xiàn)了人類知識和計算機數(shù)據(jù)的突破性結(jié)合。ChatGPT通過自然對話方式進行交互,可以自動生成文本內(nèi)容,自動回答復(fù)雜性語言。自推出后,ChatGPT用戶迅速增長,成為當(dāng)下火爆的消費級應(yīng)用。騰訊、亞馬遜、字節(jié)跳動等大型企業(yè)竭力將ChatGPT融入自身的業(yè)務(wù)中,以加深A(yù)I對企業(yè)業(yè)務(wù)的滲透,助力企業(yè)降本增效。例如,字節(jié)跳動利用ChatGPT加快“AI+”內(nèi)容的布局,實現(xiàn)了自動輔助寫作、自動生成短視頻等。而阿里巴巴利用AI技術(shù)自動生成高質(zhì)量的產(chǎn)品介紹文案,不僅提升了文案的生產(chǎn)效率,還極大地提升了文案質(zhì)量。騰訊將AI技術(shù)融入廣告制作中,實現(xiàn)了廣告視頻和文案的自動生成,極大地降低了廣告的制作成本。ChatGPT助力眾多大型企業(yè)加快AIGC應(yīng)用布局,在文本內(nèi)容設(shè)計和生成方面給企業(yè)提供了有力幫助,推動內(nèi)容生成的降本增效。2023年3月14日,OpenAI發(fā)布了新一代大型多模態(tài)模型—GPT-4。和ChatGPT所用的模型相比,GPT-4優(yōu)勢更為顯著。GPT-4的重大突破便是除了處理文本內(nèi)容,還可以處理圖像內(nèi)容。用戶可以同時輸入文本內(nèi)容和圖像內(nèi)容,GPT-4將根據(jù)這些內(nèi)容生成語言、代碼等。在官方演示中,GPT-4只用了2秒左右的時間就完成了網(wǎng)站圖片的識別,生成了網(wǎng)頁代碼,并制作出了相應(yīng)的網(wǎng)站。除了普通圖像,GPT-4還能夠處理論文截圖、漫畫等內(nèi)容復(fù)雜的圖像,提煉其中的要點內(nèi)容。GPT-4在語言方面的功能更加強大。在測試中,GPT-4在多種語言方面的表現(xiàn)均優(yōu)于此前的GPT系列大語言模型的語言性能。其中,GPT-4的英文準(zhǔn)確性為85.5%,中文準(zhǔn)確性為80.1%,兩者的語言準(zhǔn)確性較之前都有很大提高。與ChatGPT不同,GPT-4目前僅向付費用戶開放。同時,其也將作為API(應(yīng)用程序編程接口)提供給各大企業(yè),使這些企業(yè)將該模型集成到自己的應(yīng)用程序中。未來,伴隨著GPT-4應(yīng)用的普及,其將為企業(yè)發(fā)展提供更多助力。1.1.2應(yīng)用場景:ChatGPT的多場景應(yīng)用ChatGPT應(yīng)用場景廣泛,社會效應(yīng)顯著。隨著AI技術(shù)的快速發(fā)展,AIGC將代替人工完成大量的文本設(shè)計和創(chuàng)作工作。以下是ChatGPT的主要應(yīng)用場景,如圖1-1所示。1傳媒ChatGPT能夠幫助傳媒企業(yè)實現(xiàn)新聞的智能寫作,提升新聞發(fā)布時效。同時,ChatGPT基于算法模型,能夠自動策劃、編寫新聞,實現(xiàn)新聞自動化采編,幫助傳媒企業(yè)更加快速、精準(zhǔn)地生成內(nèi)容。圖1-1ChatGPT的主要應(yīng)用場景2電商ChatGPT能夠打造虛擬客服,助力電商企業(yè)為用戶提供24小時無縫對接服務(wù)。虛擬客服能夠填補電商平臺人工客服休息時的時間空白,實時為用戶提供服務(wù),更加全面、準(zhǔn)確、快速地了解和響應(yīng)用戶需求。ChatGPT對虛擬客服的話術(shù)有嚴(yán)格的約束,極大地增強了虛擬客服服務(wù)的可控性。3影視ChatGPT能夠分析海量劇本,并通過對分析結(jié)果的總結(jié)和歸納,為影視創(chuàng)作者提供更符合觀眾需求的創(chuàng)作思路。ChatGPT也能夠按照預(yù)設(shè)風(fēng)格自動生成劇本,影視創(chuàng)作者可以對ChatGPT生成的劇本進行篩選、加工和優(yōu)化,以更好地完善劇本,縮短影視作品的創(chuàng)作周期。4教育ChatGPT能夠?qū)崟r生成教育資料,為學(xué)生解答學(xué)習(xí)疑惑。學(xué)生可以通過ChatGPT提供的在線問答功能與虛擬語音機器人實時交流問題和困惑,極大地提升了學(xué)生學(xué)習(xí)的自主性。此外,ChatGPT還能夠幫助學(xué)校和教師快速生成大量教學(xué)課件、試卷和試題等。5金融ChatGPT能夠幫助金融企業(yè)為客戶提供更加及時、人性化的服務(wù)。金融企業(yè)利用ChatGPT能夠自動生成產(chǎn)品介紹和金融咨詢的文本,提升金融咨詢服務(wù)效率。同時,金融企業(yè)還能夠利用ChatGPT構(gòu)建虛擬客服,實現(xiàn)與客戶的在線實時交互,提升金融服務(wù)的效率和溫度。6醫(yī)療ChatGPT可以幫助醫(yī)院自動生成醫(yī)生與患者之間的對話交互文本,輔助醫(yī)院錄入電子病歷,在一定程度上減輕醫(yī)生的工作量,提升醫(yī)生的工作效率。ChatGPT多元化的應(yīng)用場景幫助諸多領(lǐng)域?qū)崿F(xiàn)了高效、高質(zhì)量的用戶交互和服務(wù)。同時,ChatGPT推動了眾多領(lǐng)域的技術(shù)和服務(wù)升級,加快了各個行業(yè)的智能化發(fā)展。1.1.3關(guān)注要點:安全性+版權(quán)保護+道德問題2023年年初,ChatGPT頻頻登上熱搜榜,引發(fā)了眾人的關(guān)注,其也在兩個月的時間內(nèi)收獲了2億個活躍用戶。在感嘆于ChatGPT的智能時,一些人也表達了對ChatGPT的擔(dān)憂。那么,關(guān)于ChatGPT,我們應(yīng)該關(guān)注什么?1安全性ChatGPT表現(xiàn)出了強大的智能性,展現(xiàn)出了巨大的市場價值。ChatGPT在為人們的生活提供便利的同時,也可能會因?qū)ζ錇E用而產(chǎn)生安全威脅。第一,ChatGPT可能會成為不法分子進行網(wǎng)絡(luò)攻擊的工具。不法分子可能會借助ChatGPT進行代碼編寫,并進行有規(guī)模的網(wǎng)絡(luò)安全攻擊。這將增加網(wǎng)絡(luò)安全攻擊的頻次。同時,以往以大型企業(yè)為目標(biāo)的攻擊模式或?qū)⑥D(zhuǎn)變,大中小企業(yè)都將成為網(wǎng)絡(luò)安全攻擊的目標(biāo)。第二,不法分子可能會借助ChatGPT的信息編寫功能生成規(guī)模化的釣魚軟件。同時,智能生成的詐騙信息更加難以識別真?zhèn)?,可能會?dǎo)致更多人受騙。第三,ChatGPT的算法邏輯中缺乏事實核查能力,很容易產(chǎn)生虛假信息,而這種風(fēng)險又會在社交媒體中不斷放大。網(wǎng)絡(luò)用戶難以識別出這些信息的真?zhèn)?,由此也會加大網(wǎng)絡(luò)輿情治理的壓力。針對以上安全性問題,我們應(yīng)該怎么做?當(dāng)前,我國已經(jīng)頒布了《中華人民共和國網(wǎng)絡(luò)安全法》《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》等法律法規(guī),對AI、算法等技術(shù)的應(yīng)用進行了詳細的規(guī)定,并建立了完善的監(jiān)管體系。這些可以應(yīng)對短期內(nèi)ChatGPT可能引發(fā)的網(wǎng)絡(luò)安全風(fēng)險。同時,各大網(wǎng)絡(luò)平臺也要更新監(jiān)管技術(shù),提升監(jiān)管力度,積極進行智能生成內(nèi)容審核產(chǎn)品的研發(fā)和推廣。2版權(quán)保護ChatGPT功能強大,能夠生成文案、論文、新聞等多內(nèi)容。從版權(quán)的角度來看存在一個問題,那就是使用ChatGPT生成的內(nèi)容是否受版權(quán)保護?《中華人民共和國著作權(quán)法》第三條規(guī)定:“本法所稱的作品,是指文學(xué)、藝術(shù)和科學(xué)領(lǐng)域內(nèi)具有獨創(chuàng)性并能以一定形式表現(xiàn)的智力成果。”而ChatGPT的生成邏輯是在海量數(shù)據(jù)和機器學(xué)習(xí)的基礎(chǔ)上,應(yīng)用算法而產(chǎn)生的結(jié)果。同時,人類創(chuàng)作內(nèi)容耗費了很多精力,能夠體現(xiàn)創(chuàng)作者想要傳達的情感,是一種復(fù)雜的智力勞動。這種智力勞動是值得著作權(quán)法保護的。ChatGPT生成的內(nèi)容雖具有人類智力創(chuàng)作成果的表象,但其生成過程與創(chuàng)作者的智力創(chuàng)作并不同,其生成的內(nèi)容并不屬于著作權(quán)法所涵蓋的作品。因此,ChatGPT生成的內(nèi)容并不受著作權(quán)法的保護。ChatGPT生成的內(nèi)容并不受著作權(quán)法的保護并不意味著他人可以自由使用ChatGPT生成的內(nèi)容。ChatGPT生成的內(nèi)容與作品市場的利益關(guān)系密切相關(guān),可能會在未來受到相關(guān)法律的關(guān)注和保護。目前,已經(jīng)有學(xué)者提出通過鄰接權(quán)制度對ChatGPT生成的內(nèi)容進行保護。鄰接權(quán)即與著作權(quán)有關(guān)的權(quán)利,如版式設(shè)計者權(quán)、表演者權(quán)等。未來,這一可行性設(shè)想或?qū)崿F(xiàn)。3道德問題ChatGPT引發(fā)的道德問題同樣值得關(guān)注。如果沒有輸出控制,ChatGPT很容易被用來生成不良言論、垃圾郵件等。除了直接生成有害內(nèi)容,我們還要警惕ChatGPT從海量的訓(xùn)練數(shù)據(jù)中嵌入一些偏見和錯誤看法。雖然為了規(guī)避出現(xiàn)以上問題,OpenAI公司為ChatGPT安裝了過濾器,但從目前來看,OpenAI公司的防護效果并不理想。未來,ChatGPT還需要進行技術(shù)迭代,加強在道德問題相關(guān)內(nèi)容方面的管理。1.1.4類ChatGPT產(chǎn)品出現(xiàn):阿里巴巴推出“通義千問”在2023年4月11日的阿里云峰會上,阿里巴巴正式推出了類ChatGPT產(chǎn)品“通義千問”?!巴x千問”的本質(zhì)是一個AI驅(qū)動的大語言模型,具備智能對話、文案創(chuàng)作、多模態(tài)理解、多語言支持等功能?;诙嗄B(tài)的知識理解,其還可以續(xù)寫小說、編寫郵件等。目前,一些阿里巴巴旗下產(chǎn)品已經(jīng)接入了“通義千問”,產(chǎn)品功能變得更加智能。以釘釘為例,在接入“通義千問”后,當(dāng)用戶進入一個新群聊時,釘釘可以根據(jù)群內(nèi)之前的聊天內(nèi)容生成聊天摘要,幫助用戶了解群內(nèi)概況。同時,釘釘可以根據(jù)用戶在釘釘文檔中所提的需求,進行相關(guān)內(nèi)容創(chuàng)作,生成創(chuàng)意圖片。在峰會上,阿里巴巴集團董事會主席兼CEO張勇表示:“面對AI時代,所有產(chǎn)品都值得用大模型重做一次?!倍⒗锇桶鸵彩沁@樣做的?;凇巴x千問”對各種應(yīng)用的智能賦能,阿里巴巴表示未來將會在旗下所有產(chǎn)品,如高德集團、閑魚、淘寶等產(chǎn)品中接入“通義千問”,提升旗下產(chǎn)品的智能性。此外,阿里巴巴還將面向企業(yè)提供更加普惠的大模型能力,助力企業(yè)發(fā)展。未來,所有企業(yè)都可以借助“通義千問”的大模型能力,結(jié)合行業(yè)知識、應(yīng)用場景等,訓(xùn)練專屬大模型。在此基礎(chǔ)上,所有企業(yè)都可以擁有專屬的智能客服、智能語音助手、AI設(shè)計師等。1.2發(fā)展梳理:從PGC到UGC再到AIGC隨著互聯(lián)網(wǎng)的不斷發(fā)展,內(nèi)容生產(chǎn)方式經(jīng)歷了PGC(專業(yè)生產(chǎn)內(nèi)容)、UGC(用戶生成內(nèi)容)、AIGC(人工智能生成內(nèi)容)3個階段。1.2.1PGC:企業(yè)和平臺是內(nèi)容創(chuàng)作的主體在Web1.0時代,內(nèi)容創(chuàng)作與發(fā)布的主體是專家。專家通過專業(yè)的方式將信息整合在一起,信息內(nèi)容具備更高的質(zhì)量和專業(yè)度,這種內(nèi)容生產(chǎn)方式被稱為PGC。瀏覽器、搜索引擎和門戶網(wǎng)站是當(dāng)時的主要產(chǎn)品。例如,亞馬遜的互聯(lián)網(wǎng)電影資料庫、雅虎的綜合指南網(wǎng)站等都是PGC的典型代表。雖然互聯(lián)網(wǎng)上的大多數(shù)內(nèi)容都是由專家創(chuàng)作的,但PGC概念的真正普及是由內(nèi)容平臺、知識付費企業(yè)和互聯(lián)網(wǎng)媒體機構(gòu)共同推動的。PGC內(nèi)容創(chuàng)作的主體是平臺和企業(yè),它們能夠保障內(nèi)容的專業(yè)性,具備較強的內(nèi)容生產(chǎn)能力。它們一般以用戶需求為中心對內(nèi)容進行加工,并借助高質(zhì)量原創(chuàng)內(nèi)容賺取內(nèi)容創(chuàng)作收益,如版權(quán)作品、在線課程等。同時,它們所生產(chǎn)的高價值內(nèi)容能夠收獲大批流量,并最終促成流量變現(xiàn)。現(xiàn)階段,PGC這一內(nèi)容生產(chǎn)方式仍被廣泛應(yīng)用。例如,騰訊視頻、優(yōu)酷、愛奇藝等平臺的影視作品,虎嗅、36氪等平臺的新聞資訊,網(wǎng)易云課堂、得到等平臺的音視頻課程等,都屬于PGC內(nèi)容生產(chǎn)的范疇。PGC具有針對性強、質(zhì)量高、易變現(xiàn)等優(yōu)勢,但也存在明顯的不足。例如,專業(yè)性內(nèi)容對質(zhì)量要求較高,導(dǎo)致內(nèi)容創(chuàng)作周期較長,創(chuàng)作門檻較高;PGC內(nèi)容的產(chǎn)量不足、多樣性欠缺,導(dǎo)致用戶的多樣化需求無法得到更好的滿足。PGC的諸多缺陷也催生了新的內(nèi)容生產(chǎn)方式的誕生。1.2.2UGC:用戶成為內(nèi)容創(chuàng)作主體隨著互聯(lián)網(wǎng)時代的發(fā)展,互聯(lián)網(wǎng)用戶逐漸增多,用戶對個性化、多樣化內(nèi)容的需求越來越大。同時,很多用戶不再滿足于單向地接收內(nèi)容,而是想?yún)⑴c到內(nèi)容創(chuàng)作中。此時,眾多社交媒體的誕生逐漸滿足了用戶的這一需求。在Web2.0時代,用戶從內(nèi)容的消費者轉(zhuǎn)變?yōu)閮?nèi)容的創(chuàng)作者,逐漸展現(xiàn)出自身的創(chuàng)造力。UGC這一內(nèi)容生產(chǎn)方式迎來爆發(fā)式增長,逐漸成為內(nèi)容生產(chǎn)新趨勢,內(nèi)容創(chuàng)作主體也逐漸從企業(yè)和平臺轉(zhuǎn)變?yōu)橛脩?。專業(yè)性已經(jīng)不再是內(nèi)容創(chuàng)作的主要門檻,非專業(yè)人士也能夠創(chuàng)作出大眾喜聞樂見的內(nèi)容,互聯(lián)網(wǎng)迎來了用戶創(chuàng)作內(nèi)容的新時代。在微博、微信等社交平臺上,用戶能夠通過圖文形式記錄、分享自己的生活,同時也能夠了解他人的生活;在豆瓣、貼吧、知乎等論壇上,用戶可以自由探討感興趣的文章、書籍和影視作品;在快手、抖音等自媒體平臺上,用戶能夠通過短視頻創(chuàng)作的形式獲取關(guān)注和流量,還能夠?qū)崿F(xiàn)流量變現(xiàn)。在各類平臺的角逐之下,內(nèi)容生產(chǎn)方式逐漸從PGC向UGC轉(zhuǎn)變,用戶成為內(nèi)容創(chuàng)作的主體。雖然UGC這一內(nèi)容生產(chǎn)方式具有一定的優(yōu)勢,但也存在一些問題。例如,用戶素質(zhì)參差不齊,平臺需要耗費大量的成本和精力去訓(xùn)練創(chuàng)作者,審核創(chuàng)作者發(fā)布的內(nèi)容,把控創(chuàng)作者的內(nèi)容版權(quán)。在UGC這一內(nèi)容生產(chǎn)方式下,雖然內(nèi)容供給問題得到了解決,但內(nèi)容質(zhì)量、內(nèi)容版權(quán)和內(nèi)容更新頻率等方面依然存在問題。相較于PGC的團隊協(xié)作,UGC的創(chuàng)作者更多的是“單打獨斗”。因此,內(nèi)容的原創(chuàng)程度、內(nèi)容質(zhì)量、內(nèi)容發(fā)布頻率難以得到更好的保障。在這種情形下,內(nèi)容創(chuàng)作生態(tài)很容易遭到污染和破壞,內(nèi)容生產(chǎn)效率也難以提升,這催生了Web3.0時代新型內(nèi)容生產(chǎn)方式—AIGC的誕生。1.2.3AIGC:AI成為內(nèi)容創(chuàng)作主體面對亟待解決的互聯(lián)網(wǎng)內(nèi)容生產(chǎn)問題,利用AI生成內(nèi)容的新型內(nèi)容生產(chǎn)方式—AIGC誕生了。AIGC不僅能夠識別出各種語義信息,還能夠進一步提升內(nèi)容生產(chǎn)力。在Web3.0時代,虛擬空間的發(fā)展需要高效的內(nèi)容生產(chǎn)方式,而AIGC承載了人們對Web3.0時代內(nèi)容生產(chǎn)方式的期待,滿足了人們對高效、高質(zhì)量的內(nèi)容生產(chǎn)的需求。讓AI學(xué)會創(chuàng)作絕非易事,科學(xué)家曾做過諸多嘗試。起初,科學(xué)家將這一領(lǐng)域稱為生成式AI,主要研究方向為智能文本創(chuàng)建、智能圖像創(chuàng)建、智能視頻創(chuàng)建等多模態(tài)。生成式AI通過小模型展開,這種小模型需要通過標(biāo)準(zhǔn)的數(shù)據(jù)訓(xùn)練,才能夠應(yīng)用于解決特定場景的任務(wù)。因此,生成式AI的通用性比較差,難以被遷移。同時,由于生成式AI需要依靠人工調(diào)整參數(shù),因此很快被基于強算法、大數(shù)據(jù)的大模型取代?;诖竽P偷纳墒紸I不再需要人工調(diào)整參數(shù),或者只需要少量調(diào)整,因此可以遷移到多種任務(wù)場景中。其中,GAN(GenerativeAdversarialNetworks,生成對抗網(wǎng)絡(luò))是AIGC基于大模型生成內(nèi)容的早期重要嘗試。GAN能夠利用判別器和生成器的對抗關(guān)系生成各種形態(tài)的內(nèi)容,基于大模型的AIGC應(yīng)用逐漸出現(xiàn)在市場中。直到新一代聊天機器人模型ChatGPT出現(xiàn),AIGC才實現(xiàn)真正的商業(yè)化落地。AIGC本質(zhì)上是一種生產(chǎn)力的變革,其對內(nèi)容生產(chǎn)力的提升主要體現(xiàn)在以下3個方面。(1)AIGC減少了內(nèi)容創(chuàng)作中的重復(fù)性工作,提升了內(nèi)容的生產(chǎn)效率和質(zhì)量。(2)AIGC將創(chuàng)作與創(chuàng)意相互分離,使創(chuàng)作者能夠在人工智能生成的內(nèi)容中尋找思路和靈感。(3)AIGC綜合了大量訓(xùn)練數(shù)據(jù)和模型,拓展了內(nèi)容創(chuàng)新的邊界,幫助創(chuàng)作者生產(chǎn)出更加獨特的內(nèi)容。AIGC有著不可逆轉(zhuǎn)的發(fā)展態(tài)勢,智能創(chuàng)作時代逐漸開啟。AIGC推動人類進入智能創(chuàng)作的新時代,其將成為智能化生產(chǎn)領(lǐng)域中的重量級新角色。1.3內(nèi)容生成:AIGC涵蓋多樣的內(nèi)容模態(tài)AIGC集成了AI領(lǐng)域的圖像處理、自然語言處理和聲音處理等多種技術(shù),能夠在不同的內(nèi)容模態(tài)下實現(xiàn)多種數(shù)據(jù)的協(xié)同生成和有效處理。AIGC通過整合不同模態(tài)的數(shù)據(jù),能夠?qū)崿F(xiàn)更加精準(zhǔn)、全面的智能預(yù)測和決策,在諸多領(lǐng)域都具有較高的應(yīng)用價值。1.3.1AI圖像:AI繪畫趨于普遍自2022年以來,AI繪畫成為藝術(shù)創(chuàng)作領(lǐng)域的發(fā)展趨勢之一。以Midjourney、DiscoDiffusion等為代表的AI繪畫軟件紛紛涌現(xiàn),廣受用戶歡迎。在使用AI繪畫軟件作畫時,用戶無須手動繪畫,只需在軟件中選擇自己想要的視角和風(fēng)格,并輸入關(guān)鍵詞,AI繪畫軟件便能夠按照用戶需求自動生成一幅高水準(zhǔn)畫作。AI繪畫憑借高超的技術(shù)水準(zhǔn)和創(chuàng)作能力,逐漸成為主流藝術(shù)創(chuàng)作形式。從生產(chǎn)力角度看,AI繪畫是圖像生產(chǎn)領(lǐng)域技術(shù)層面的飛躍,大幅提升了圖像的生產(chǎn)效率和質(zhì)量。AI圖像是AIGC在圖像生成領(lǐng)域的重要應(yīng)用。目前,AI圖像有兩種較為成熟的應(yīng)用工具,分別是圖像編輯工具和圖像自主生成工具。其中,圖像編輯工具的主要功能有增設(shè)濾鏡、提高圖片分辨率、去除圖片水印等。圖像自主生成工具聚焦功能性圖像生成,常應(yīng)用于海報、模特圖、品牌Logo等圖像制作方面。除上述兩種外,還有創(chuàng)意圖像生成工具,主要應(yīng)用于隨機或者按照特定屬性生成畫作。如今,很多互聯(lián)網(wǎng)用戶都在自己的朋友圈和短視頻平臺分享各種形式的AI畫作。從運用方式角度看,AI繪畫可以分為3類,分別是借助已有圖像生成新圖像、借助文字描述生成新圖像和二者的結(jié)合版。AI繪圖是AI圖像生成技術(shù)的具象表現(xiàn)。從技術(shù)場景來看,AI圖像生成技術(shù)的應(yīng)用場景可以分為圖像屬性編輯、圖像局部生成及更改、端到端的圖像生成3種,如表1-1所示。AI圖像生成技術(shù)不斷發(fā)展并實現(xiàn)商業(yè)化應(yīng)用,市場十分廣闊。未來,AI圖像將為藝術(shù)創(chuàng)作提供更多可能性。表1-1AI圖像生成技術(shù)的應(yīng)用場景1.3.2AI文本:方案、廣告、小說皆可智能生成隨著人工智能技術(shù)的快速發(fā)展,AI文本生成技術(shù)日趨成熟,并逐漸落地應(yīng)用。AI文本生成的方式主要有兩類,分別是交互式文本生成和非交互式文本生成。交互式文本生成多應(yīng)用于心理咨詢、文本交互游戲、虛擬交友等領(lǐng)域;非交互式文本生成多應(yīng)用于輔助性寫作、結(jié)構(gòu)化寫作和非結(jié)構(gòu)化寫作等領(lǐng)域。其中,輔助性寫作主要包括關(guān)聯(lián)內(nèi)容推薦和內(nèi)容潤色等功能。從嚴(yán)格意義上說,輔助性寫作不屬于AIGC的范疇。結(jié)構(gòu)化寫作常見于新聞資訊和文章標(biāo)題撰寫等領(lǐng)域,非結(jié)構(gòu)性寫作常見于營銷文本和劇情續(xù)寫等領(lǐng)域。結(jié)構(gòu)化寫作在早期便得到了應(yīng)用。例如,四川省綿陽市發(fā)生4.3級地震,中國地震臺網(wǎng)利用地震信息播報AI機器人在6秒內(nèi)便撰寫出一篇500字左右的新聞報道;四川省阿壩州九寨溝縣發(fā)生了7級地震,該AI機器人不僅在新聞報道中寫出了震源地地貌特征、天氣情況、人口密度等內(nèi)容,還自動為新聞報道配置了5張地震現(xiàn)場圖片,整個撰寫過程僅僅花費了二十幾秒的時間;在地震后續(xù)的新聞跟進中,該AI機器人撰寫并發(fā)布余震資訊僅僅花費了5秒左右的時間。AI結(jié)構(gòu)化寫作通常具有較強的規(guī)律性,能夠根據(jù)高度結(jié)構(gòu)化的數(shù)據(jù)生成文章。同時,AI結(jié)構(gòu)化寫作的行文相對客觀、嚴(yán)謹(jǐn),在地震信息播報、股市資訊報道、體育資訊報道和公司年報呈現(xiàn)等方面具有一定的優(yōu)勢。很多媒體機構(gòu)都有具有結(jié)構(gòu)化寫作能力的AI小編,如第一財經(jīng)的“DT稿王”、新華社的“快筆小新”、騰訊財經(jīng)的“Dreamwriter”、今日頭條的“Xiaomingbot”、封面新聞的“小封”和南方都市報的“小南”等。非結(jié)構(gòu)化寫作難度相對較高,需要更加獨特的創(chuàng)意,常見于詩歌、小說撰寫。即便如此,AI同樣展現(xiàn)出驚人的非結(jié)構(gòu)化寫作能力。例如,微軟推出的AI機器人“小冰”曾編寫并出版詩集《陽光失了玻璃窗》,詩歌整體上富有邏輯、情感和韻律,同時帶有朦朧的意象和美感。AI在交互式文本中的應(yīng)用具備十分突出的優(yōu)勢。例如,游戲開發(fā)者尼克·沃爾頓推出的一款名為《AI地下城2》的游戲就是一款利用AI文本生成打造的文字冒險游戲。在游戲中,用戶可以通過AI生成設(shè)定角色,以祈使句輸入行動,游戲AI能夠根據(jù)用戶輸入的行動生成對應(yīng)的故事。AI生成文本代替了大量文字創(chuàng)作領(lǐng)域的重復(fù)性勞動,幫助人類更好地與AI互動。未來,AI很可能成為文本內(nèi)容創(chuàng)作的主體,幫助人們在創(chuàng)作方面節(jié)省大量的時間和精力。1.3.3AI音樂:谷歌AI模型MusicLM實現(xiàn)音樂即興創(chuàng)作2023年1月27日,谷歌發(fā)布AI內(nèi)容生成領(lǐng)域的新模型—MusicLM。這是繼視頻生成工具ImagenVideo、文本生成模型Wordcraft之后,谷歌再次推出的內(nèi)容生成式AI模型,該模型瞄準(zhǔn)了音樂創(chuàng)作領(lǐng)域。其實,普通用戶想通過AI模型創(chuàng)作音樂并不是一件容易的事情。AI音樂是在很多信號的相互作用之下形成的,包括音色、音調(diào)、音律、音量等,這是一個充滿復(fù)雜性的綜合系統(tǒng)。因此,早期的一些AI自動生成工具所創(chuàng)作的音樂往往具備明顯的合成痕跡,聽起來很不自然。此前,可視化AI工具DanceDiffusion、Riffusion能自主創(chuàng)作音樂,OpenAI也曾推出AI音樂生成工具Jukebox。但是這些AI音樂生成工具受限于數(shù)據(jù)和技術(shù)等因素,只能創(chuàng)作簡單的音樂,而對于相對復(fù)雜的音樂,它們無法保障音樂的質(zhì)量和高保真度。AI模型要實現(xiàn)真正意義上的音樂自動生成,需要通過大量數(shù)據(jù)模擬和訓(xùn)練,這是AI自動生成工具在保障音樂質(zhì)量上必不可少的基礎(chǔ)性步驟。MusicLM能夠在更加復(fù)雜的場景中直接將圖像和文字進行合成,自動生成音樂,并且曲風(fēng)多樣。MusicLM生成的音樂不僅可以滿足用戶的多樣化需求,而且能夠最大限度地保障音樂的高保真度。MusicLM還支持通過圖像生成音樂,世界名作《星空》《格爾尼卡》《吶喊》等都可以作為生成音樂的內(nèi)容素材,這是AI音樂生成領(lǐng)域的一大突破。MusicLM不僅能夠幫助用戶識別樂器,還能夠融合各種音樂流派,通過用戶提供的抽象概念生成音樂。例如,用戶想為養(yǎng)成型游戲配置一段音樂,只需要輸入文字“養(yǎng)成型游戲的主配樂,動感且輕快”,MusicLM便可以按照要求自動生成音樂。MusicLM的訓(xùn)練數(shù)據(jù)很龐大,為理解深度、復(fù)雜的音樂場景提供堅實基礎(chǔ)。MusicLM針對音樂生成任務(wù)具有缺乏評估數(shù)據(jù)等問題,專門引入了MusicCaps來為音樂生成任務(wù)提供更好的評估。1.3.4AI編程:智能系統(tǒng)重新定義編程AI編程一直是人們對于人工智能應(yīng)用的一大期望。如今,人們的這一期望正在逐漸實現(xiàn),AI編程開始走入人們的生活中。AI編程的主要優(yōu)勢體現(xiàn)在以下三個方面,如圖1-2所示。圖1-2AI編程的主要優(yōu)勢1錯誤自動查找AI編程能夠利用機器學(xué)習(xí)和深度學(xué)習(xí)自動檢測代碼中的錯誤,避免了人工檢測錯誤不精準(zhǔn)的問題。AI編程通過給定一個代碼語料庫,自動生成訓(xùn)練數(shù)據(jù),再將這些訓(xùn)練數(shù)據(jù)輸入代碼,以向量的形式表現(xiàn)出來,用戶能夠通過訓(xùn)練好的文本分類器預(yù)測新代碼中可能存在的錯誤。2錯誤自動修復(fù)查找出代碼中的錯誤之后,如何修復(fù)錯誤是一個十分關(guān)鍵的問題。AI編程能夠建立編碼解碼器模型,輸入錯誤代碼后,解碼器中能夠生成一個修復(fù)后的代碼。對于原始數(shù)據(jù)集,AI編程可以修復(fù)一部分錯誤;對于合成數(shù)據(jù)集,AI編程可以修復(fù)大部分錯誤。3代碼搜索如果用戶想編寫特定的代碼,可以通過AI編程完成系統(tǒng)、標(biāo)準(zhǔn)的信息檢索。在代碼搜索中,AI編程能夠給定一組搜索結(jié)果。AI編程代碼搜索主要包含三個要素,分別是代碼描述、代碼片段和隨機錯誤描述。這三個要素能夠更好地捕捉語義的相似性。AI編程發(fā)展迅速,未來,AI編程有望替代人類大部分的編程工作,幫助人類解決眾多簡單或復(fù)雜的編程問題,推動AIGC不斷向前發(fā)展。1.4核心驅(qū)動力:AIGC賦能元宇宙隨著AIGC應(yīng)用領(lǐng)域不斷拓展、應(yīng)用價值不斷提升,其與元宇宙呈現(xiàn)出融合發(fā)展態(tài)勢,為元宇宙提供重要基礎(chǔ)設(shè)施,成為推動元宇宙發(fā)展的核心驅(qū)動力。AIGC技術(shù)逐漸趨于成熟,AIGC的應(yīng)用優(yōu)勢逐漸從降本增效向創(chuàng)造價值轉(zhuǎn)變。1.4.1AIGC是元宇宙實現(xiàn)的生產(chǎn)力工具AIGC是繼PGC、UGC之后的新型內(nèi)容生產(chǎn)方式,也是元宇宙實現(xiàn)的重要生產(chǎn)力工具,其在元宇宙領(lǐng)域的主要應(yīng)用有文字生成圖像、功能性圖像生成、創(chuàng)意圖像生成。AIGC與VR(虛擬現(xiàn)實)、NFT(非同質(zhì)化通證)一同成為元宇宙的三大重要基礎(chǔ)設(shè)施。AIGC進一步深化了PGC、UGC等內(nèi)容生產(chǎn)方式的優(yōu)勢,技術(shù)進步和模型優(yōu)化為AIGC的發(fā)展提供了核心動力,AIGC的核心技術(shù)逐漸從NLP(NaturalLanguageProcessing,自然語言處理)、GAN向Diffusion過渡。其中,GAN是相對傳統(tǒng)的圖像生成模型,廣泛應(yīng)用于文字轉(zhuǎn)圖像、圖像修復(fù)等領(lǐng)域。然而GAN具有樣本重復(fù)、訓(xùn)練不穩(wěn)定等缺陷,促使Diffusion逐漸流行起來。相較于GAN模型,Diffusion生成的圖像質(zhì)量和水平更高,其采用開源方式,成功掀起圖像生成領(lǐng)域AIGC的發(fā)展熱潮。雖然目前元宇宙的最終發(fā)展形態(tài)還不確定,但可以確定的是,元宇宙終將會大范圍拓展人類的生活空間。人類要想在元宇宙虛擬空間中創(chuàng)造更好的生活環(huán)境,就需要大量的數(shù)字內(nèi)容做支撐。而這僅僅依靠人工力量是難以完成的,AIGC能夠為人類提供幫助。在元宇宙中,游戲成為主要的生活場景,能夠為用戶提供高度沉浸和擬真的體驗。游戲的開發(fā)周期長、成本高,人工開發(fā)一般需要耗費大量的時間和精力,而AIGC開發(fā)工具能夠大幅提升元宇宙游戲的開發(fā)效率。在AIGC的加持下,用戶可以自主打造元宇宙中的游戲場景和游戲內(nèi)容。游戲中的主程序、人物、劇本、場景、道具、配音、特效和動作等都可以通過AIGC開發(fā)工具自動生成。就目前AIGC的發(fā)展形勢來看,在游戲開發(fā)設(shè)計方面,AIGC有望達到專業(yè)設(shè)計師和開發(fā)人員的水平。除游戲外,虛擬人也是元宇宙落地的一個重要領(lǐng)域。AIGC將廣泛應(yīng)用于打造虛擬人,可以為虛擬人設(shè)計形象、性格、動作、聲音及活動場景,增強虛擬人在元宇宙中的功能性,使虛擬人在元宇宙中有更加生動的表現(xiàn)。1.4.2由降本增效轉(zhuǎn)向創(chuàng)造價值,AIGC價值凸顯近年來,隨著元宇宙概念的興起,AIGC成為新的元宇宙內(nèi)容生成解決方案,同時也成為元宇宙的發(fā)展方向之一。AIGC價值不斷凸顯,其對元宇宙的賦能也將從降本增效逐步轉(zhuǎn)向創(chuàng)造價值。AIGC作為未來元宇宙發(fā)展的重要基礎(chǔ)技術(shù)之一,將在元宇宙中開拓出更廣泛的應(yīng)用場景,創(chuàng)造更多更有趣的人與人、人與物之間的交互體驗。AIGC展現(xiàn)的應(yīng)用場景令元宇宙用戶向往,無論是工業(yè)化應(yīng)用領(lǐng)域,還是娛樂應(yīng)用領(lǐng)域,AIGC的價值已經(jīng)初步顯現(xiàn)。隨著AI技術(shù)的不斷發(fā)展,AIGC將推動元宇宙生態(tài)更加成熟。AIGC賦能元宇宙內(nèi)容生產(chǎn),給用戶提供了大量內(nèi)容創(chuàng)作的靈感和思路,使內(nèi)容創(chuàng)作更加輕松、簡單、便捷,用戶能夠更加積極、主動地參與元宇宙的內(nèi)容創(chuàng)作,用戶對內(nèi)容生產(chǎn)和創(chuàng)造的真實需求能夠得到最大限度的滿足。AIGC改變了內(nèi)容創(chuàng)作形式,使內(nèi)容價值進一步凸顯。隨著AIGC的不斷發(fā)展和升級,其將助力元宇宙創(chuàng)造出更多、更豐富的價值。第2章技術(shù)構(gòu)成:AIGC實現(xiàn)的關(guān)鍵技術(shù)AIGC概念全面爆發(fā),迎來了快速發(fā)展。AIGC生成的內(nèi)容類型豐富、質(zhì)量較高。AIGC的繁榮發(fā)展離不開關(guān)鍵技術(shù)的支持:自然語言處理賦予AI理解與生成能力,AIGC生成算法提升了AI創(chuàng)作能力,深度學(xué)習(xí)的不斷完善為AIGC提供更多算法模型,多模態(tài)交互技術(shù)實現(xiàn)全方位的人機交互。2.1自然語言處理:賦予AI理解與生成能力自然語言處理是一門借助構(gòu)建算法使計算機能夠理解、生成和分析人類自然語言的技術(shù)。自然語言處理包括自然語言理解與自然語言生成兩部分,前者能夠使計算機理解自然語言,后者能夠使計算機生成自然語言。這兩種技術(shù)賦予了AI理解與生成能力。2.1.1核心能力一:自然語言理解自然語言理解(NaturalLanguageUnderstanding,NLU)是一種幫助計算機理解文本內(nèi)容的技術(shù),能夠賦予AI理解人類自然語言的能力,并完成語言理解領(lǐng)域的特定任務(wù)。NLU的應(yīng)用范圍十分廣泛,如圖2-1所示。圖2-1NLU的應(yīng)用范圍1篇章理解AI能夠借助NLU技術(shù)處理給定的文章,把握文章的主要內(nèi)容并按照文章的主題進行分類。AI進行篇章理解大多基于有監(jiān)督學(xué)習(xí),即提供具有標(biāo)注的訓(xùn)練集和待測試的測試集。通過訓(xùn)練,AI將具有準(zhǔn)確提取信息、全面把握內(nèi)容的能力,能夠被應(yīng)用于測試集的分類任務(wù)中。2文本摘要文本摘要指的是為AI提供大量文本,AI借助NLU技術(shù)提取文本的中心思想和主要內(nèi)容,并生成簡潔的摘要。文本摘要有兩種,分別是生成式和提取式。生成式是AI在原文本的基礎(chǔ)上,生成原文本沒有的詞句并組合成摘要;提取式是直接從文本中提取代表性詞匯,經(jīng)過語句組合形成摘要。生成式比提取式更復(fù)雜,但更符合人類的語言習(xí)慣,人類在進行文本摘要時,也是先閱讀后理解,并用自己的語言進行融合、總結(jié)。3情感分析情感分析指的是AI借助NLU技術(shù),根據(jù)語句中的情感詞匯判斷整個語句想要表達的情感傾向。例如,判斷網(wǎng)友的留言是否友好。AI可以借助情感詞典,對語句中出現(xiàn)的情感詞匯進行加權(quán)組合,得出整個語句的情感傾向;也可以利用有監(jiān)督學(xué)習(xí),借助標(biāo)注數(shù)據(jù)訓(xùn)練情感分類。4文本翻譯文本翻譯是NLU應(yīng)用頻率最高的方向之一。每位用戶都或多或少地使用過語言翻譯器,將文本從一種語言翻譯成另一種語言。文本翻譯實質(zhì)上是一種序列到序列的映射,通過人工標(biāo)注數(shù)據(jù)集實現(xiàn)。目前,AI進行文本翻譯最大的挑戰(zhàn)是不能將源文本中的每個字翻譯成目標(biāo)語言并拼接,而是需要結(jié)合語言的語法特點及具體的語用情境有針對性地進行調(diào)整。例如,禮來公司曾經(jīng)依靠NLU技術(shù)在全球開展業(yè)務(wù)。禮來公司多年來一直依靠第三方機構(gòu)翻譯各種內(nèi)容,如公司內(nèi)部的培訓(xùn)資料、與其他公司技術(shù)交流的內(nèi)容等。為了改變這種依賴第三方的現(xiàn)狀,禮來公司借助NLU技術(shù)和深度學(xué)習(xí)技術(shù),開發(fā)了一套名為“LillyTranslate”的本土IT解決方案。LillyTranslate能夠為用戶提供多種辦公軟件的實時翻譯,并通過不斷學(xué)習(xí)提高了翻譯的準(zhǔn)確性。LillyTranslate為禮來公司節(jié)約了資金,提高了效率。5問答系統(tǒng)傳統(tǒng)搜索引擎根據(jù)用戶的搜索關(guān)鍵詞,按照相關(guān)性從強到弱顯示搜索結(jié)果。這種顯示方式需要用戶依次瀏覽才能夠找到想要的內(nèi)容。問答系統(tǒng)則是通過NLU系統(tǒng)為用戶提供最準(zhǔn)確的答案,提高搜索準(zhǔn)確性。語言是人類思維的載體,AI理解自然語言,實際上是學(xué)習(xí)自然語言背后所指代的真實世界,以及符號與符號之間隱藏的人類認(rèn)知思維過程。NLU是一項關(guān)鍵技術(shù),對于AI理解人類社會具有重要作用。2.1.2核心能力二:自然語言生成自然語言生成(NaturalLanguageGeneration,NLG)主要用于提高人類與計算機之間的溝通效率,將計算機生成的數(shù)據(jù)轉(zhuǎn)換為人類可以理解的語言形式。例如,用戶詢問智能音箱時間,智能音箱需要先利用NLU技術(shù)理解用戶的意思,再利用NLG技術(shù)進行回復(fù)。自然語言生成主要有文本到語言的生成(text-to-text)和數(shù)據(jù)到語言的生成(data-to-text)兩種方式。自然語言生成需要經(jīng)過六個步驟:(1)內(nèi)容確定。NLG需要對信息進行確認(rèn),確認(rèn)部分信息是否應(yīng)該包含在建構(gòu)的文本中。內(nèi)容確定時會篩選一部分信息,最終傳達的信息往往少于數(shù)據(jù)中包含的信息。(2)文本結(jié)構(gòu)。NLG在確定內(nèi)容后,會對文本順序進行合理的排序。例如,描述一場會議時,會首先說明會議的時間、地點與參加人員,其次表明會議的內(nèi)容,最后描述會議的結(jié)果。(3)組合語句。NLG會對語句進行合并,使得語句更加簡潔、流暢。(4)注重語法。NLG會注重語法,且在各個語句之間添加關(guān)鍵詞,使其拼成一個完整的句子。(5)參考表達式生成。這一步驟與上一個步驟相似,但區(qū)別在于,這一步驟會識別文本內(nèi)容所屬的領(lǐng)域,使用該領(lǐng)域的詞匯。(6)語言實現(xiàn)。在確定好所有的詞和短語后,將它們組合成完整的句子。自然語言生成的潛力巨大,可以運用到多個場景中。1相似問生成面對全新的業(yè)務(wù)場景,AI可能會缺少相關(guān)標(biāo)注數(shù)據(jù),這時可以使用自然語言生成技術(shù)擴充標(biāo)注數(shù)據(jù)。相似問生成完全適配這個場景,其任務(wù)是輸入一個問句,利用模型生成許多意思相近的問句。AI模型一般會利用文本生成與相似度匹配同時進行訓(xùn)練。例如,輸入文字“QQ音樂與網(wǎng)易云音樂哪個更好用?”,下面會生成許多相似的問句,按照關(guān)聯(lián)度從大到小進行排列。關(guān)聯(lián)度最大的句子較為完整地表述了原句的意思,關(guān)聯(lián)度最小的句子則背離了原句的意思。在實際操作中,關(guān)聯(lián)度的閾值可以靈活調(diào)整。2可控文本生成可控文本生成指的是在生成的文本中添加一些控制因素,使文本符合一定的要求,如生成文本的感情控制、風(fēng)格切換等。例如,對生成的文本進行風(fēng)格控制,可以輸入彩妝廣告標(biāo)題,將其對應(yīng)的廣告分類作為控制條件。借助這個功能,可以生成符合指定語境的標(biāo)題。NLG技術(shù)的不斷成熟,為自然語言處理技術(shù)的發(fā)展帶來更多的可能性。同時,自然語言處理技術(shù)將賦能AIGC,創(chuàng)作出更多優(yōu)秀的作品。2.2AIGC生成算法:提升AI創(chuàng)作能力隨著AI技術(shù)的發(fā)展,生成式AI隨之出現(xiàn)。生成式AI能夠提升AI創(chuàng)作能力,大幅推動數(shù)字化內(nèi)容生產(chǎn)與創(chuàng)造,助力AI創(chuàng)作進入爆發(fā)期。2.2.1生成式AIVS分析式AIAI模型主要有兩種:一種是生成式AI,另一種是分析式AI。生成式AI指的是借助機器學(xué)習(xí)對已有數(shù)據(jù)進行學(xué)習(xí),進而創(chuàng)造出全新的、原創(chuàng)的內(nèi)容。分析式AI能夠?qū)Υ罅繑?shù)據(jù)進行分析,在此基礎(chǔ)上進行判斷、預(yù)測,更有利于用戶做出決策。生成式AI與分析式AI各有利弊,應(yīng)用的領(lǐng)域也各不相同。1生成式AI生成式AI的應(yīng)用范圍廣,既能夠在內(nèi)容領(lǐng)域滿足用戶日益增長的創(chuàng)作需求,又能夠在垂直領(lǐng)域大幅提高生產(chǎn)力,創(chuàng)造巨大的市場價值。(1)生成式AI應(yīng)用于娛樂媒體領(lǐng)域。生成式AI具有文本糾錯、文本轉(zhuǎn)語音、語音轉(zhuǎn)文本、智能編輯圖像、智能編輯視頻等功能,不僅能夠取代機械性勞動,而且能夠通過不斷學(xué)習(xí),為用戶提供新奇創(chuàng)意。隨著AI算力、數(shù)據(jù)的進一步提高,生成式AI可能會達到專業(yè)水平或者擁有獨特的創(chuàng)意,從而替代一部分內(nèi)容創(chuàng)作者。例如,2022年8月,在一場數(shù)字藝術(shù)家比賽中,一名參賽者憑借一幅AIGC繪畫作品《太空歌劇院》(如圖2-2所示)獲得了第一名,這表明生成式AI在繪畫領(lǐng)域的水平有超越人類的趨勢。圖2-2AIGC繪畫作品《太空歌劇院》(2)生成式AI應(yīng)用于多個垂直領(lǐng)域。例如,生成式AI能夠進行代碼生成,將自然語言快速翻譯成代碼,推動了計算機編程的智能化,提高了程序員的工作效率;ChatGPT是一個聊天機器人模型,不僅能夠?qū)⒆匀徽Z言轉(zhuǎn)化為代碼,還能夠?qū)Υa進行挑錯并提出修改意見。相較于傳統(tǒng)搜索引擎,ChatGPT給用戶帶來了更好的體驗。但是,生成式AI也存在一些隱患,例如,生成式AI容易陷入抄襲風(fēng)波。當(dāng)用戶利用ChatGPT生成內(nèi)容時,所生成的內(nèi)容只是基于曾經(jīng)訓(xùn)練過的模型,從各類數(shù)據(jù)中復(fù)制粘貼合成的,在人類社會中這種行為會被定義為“抄襲”。生成式AI生成的內(nèi)容由大量文本拼接而成,很難對其進行溯源。而且盡管生成式AI生成的內(nèi)容十分強大,但缺乏獨特性,不能在創(chuàng)新性方面有所突破。2分析式AI隨著AI技術(shù)大爆發(fā),分析式AI得到了發(fā)展,其主要被應(yīng)用于推薦系統(tǒng)、圖像識別等領(lǐng)域。分析式AI在電商領(lǐng)域的顯著應(yīng)用之一是推薦系統(tǒng)。推薦系統(tǒng)能夠深度挖掘用戶與產(chǎn)品之間的關(guān)系,將用戶感興趣的產(chǎn)品精準(zhǔn)地推送給用戶,提升產(chǎn)品購買率;推薦系統(tǒng)能夠借助算法,實現(xiàn)商品與用戶需求的精準(zhǔn)匹配,節(jié)省用戶的檢索用時;推薦系統(tǒng)能夠提升電商平臺的銷售額。分析式AI能夠利用推薦系統(tǒng)幫助音頻、視頻等娛樂領(lǐng)域快速發(fā)展。分析式AI能夠?qū)τ脩舻囊曨l數(shù)據(jù)進行分析,并通過分析結(jié)果將用戶可能感興趣的內(nèi)容推送給他們,顯著提高了用戶的觀看率,增加了用戶黏性。分析式AI能夠利用圖像識別技術(shù)促進自動駕駛領(lǐng)域的發(fā)展。自動駕駛汽車可以根據(jù)分析式AI提供的分析結(jié)果判斷路況,對路上的障礙物進行識別,減少了安全事故的發(fā)生。分析式AI也存在弊端,即無法對數(shù)據(jù)進行精確判斷,無法在需要精確判斷的場景中使用。因此,分析式AI在與安全有關(guān)的領(lǐng)域具有一定的局限性。同時,分析式AI難以在未知領(lǐng)域應(yīng)用,因為其太過于依賴大量數(shù)據(jù)的輸入與算法優(yōu)化。分析式AI更傾向于利用給定的模型不斷地試錯并做出判斷,試錯越多,判斷越準(zhǔn)確。在判斷后,分析式AI會給出數(shù)據(jù)反饋,并對參數(shù)進行調(diào)整,使下一次判斷更準(zhǔn)確。生成式AI傾向于在已有的知識上進行模仿與生成,二者的使用領(lǐng)域不同,工作原理也不大相同。2.2.2AI算法成熟,創(chuàng)作能力爆發(fā)目前,ChatGPT獲得了廣大用戶的歡迎。ChatGPT能夠與用戶以對話的方式進行交互,進行高質(zhì)量的回復(fù),給用戶帶來新鮮感。ChatGPT的發(fā)展吸引了眾多用戶的目光,也標(biāo)志著AI算法趨于成熟,創(chuàng)作能力即將實現(xiàn)爆發(fā)。在AI的助力下,多樣化的產(chǎn)品爭相出現(xiàn)。生成式AI在2021年、2022年連續(xù)兩年入選Gartner發(fā)布的HypeCycleforArtificialIntelligence(《人工智能技術(shù)成熟度曲線報告》),被認(rèn)為是AI在未來重要的發(fā)展趨勢之一。除ChatGPT外,AI模型—MusicLM也大放異彩,可以根據(jù)輸入的文本、圖像生成音樂,而且曲風(fēng)多樣。這些AI模型的出現(xiàn)意味著AI的觸角已經(jīng)深入藝術(shù)創(chuàng)作領(lǐng)域。2022年,擴散模型Diffusion引發(fā)了人們的討論熱潮,越來越多的人開始選擇研究Diffusion。Diffusion作為一個高性能深度學(xué)習(xí)模型,能夠根據(jù)輸入的文字輸出精美圖片,提高AI圖像的生成效率與精度。用戶只需要在其基礎(chǔ)終端設(shè)備內(nèi)輸入關(guān)鍵詞,便可以獲得高質(zhì)量的AI圖像。生成式AI的火熱促使許多企業(yè)不斷研發(fā)相關(guān)產(chǎn)品。例如,用戶在百度研發(fā)的產(chǎn)品“文心ERNIE3.0”中輸入一個題目,就可以獲取體裁、風(fēng)格不同的內(nèi)容;華為云推出了可用于虛擬直播、虛擬視頻內(nèi)容制作的數(shù)字內(nèi)容生產(chǎn)線—MetaStudio;Midjourney作為一個圖片生成應(yīng)用,在Discord中擁有百萬粉絲;ChatGPT僅上線一周,粉絲數(shù)量便直逼百萬。例如,在論壇上,一個名為“Reddit”的用戶發(fā)布了一段自己與ChatGPT的對話。在對話中,Reddit詢問ChatGPT“如何用JavaScript方法在調(diào)制控制臺中打印一只狗?”ChatGPT立即做出了回應(yīng),并利用代碼在屏幕中拼湊出狗的形狀。看似簡單的一段對話,卻顯示出了ChatGPT的強大能力,用戶只需要輸入一段文字便可以解決難題。由于ChatGPT的能力過于強大,因此越來越多的用戶認(rèn)為其在將來有可能完全取代搜索引擎,甚至取代學(xué)校中的助教。雖然生成式AI的未來發(fā)展前景廣闊,但是其在目前發(fā)展階段還存在一些問題,例如,生成式AI在生成文本方面缺乏可控性與穩(wěn)定性,具體表現(xiàn)為:AI在回復(fù)論文方面的問題時,可能會使用一些不恰當(dāng)?shù)睦?;AI在寫代碼時,可能會生成一些錯誤代碼。在圖片生成方面,生成式AI面臨著AI創(chuàng)作的畫作質(zhì)量不高、設(shè)計侵權(quán)等問題。AI創(chuàng)作畫作時,會根據(jù)用戶給出的關(guān)鍵詞借鑒其他畫作,因此生成的畫作可能與其借鑒的畫作相似性高,由此引發(fā)許多爭議。為了表達對AI創(chuàng)作侵權(quán)的不滿,一些藝術(shù)作品展示平臺積極呼吁“NOTOAIGENERATEDIMAGES”(拒絕AI繪畫),并且有的平臺還添加了過濾功能,用來屏蔽AI作品。生成式AI的創(chuàng)作數(shù)據(jù)在AI技術(shù)與深度學(xué)習(xí)的助力下不斷發(fā)展,甚至有些內(nèi)容的創(chuàng)作水平極高。但是,除侵權(quán)問題外,“換臉”“變聲”等AI生成內(nèi)容可能會加速虛假信息的傳播,增加了監(jiān)管隱患。雖然目前生成式AI發(fā)展迅速,但是在減少模型訓(xùn)練成本、打造差異化優(yōu)勢、改變用戶獲取策略等方面仍需不斷努力,以逐步構(gòu)建起可持續(xù)發(fā)展的AI商業(yè)模式,幫助用戶快速、高效、低成本地創(chuàng)作。2.3預(yù)訓(xùn)練大模型崛起,賦能深度學(xué)習(xí)當(dāng)今時代是數(shù)字化時代,得益于數(shù)據(jù)挖掘、數(shù)據(jù)分析、大數(shù)據(jù)等技術(shù)的飛速發(fā)展,預(yù)訓(xùn)練大模型也實現(xiàn)了崛起。預(yù)訓(xùn)練大模型是深度學(xué)習(xí)的一次重要變革,能夠降低AI開發(fā)與落地的門檻。預(yù)訓(xùn)練大模型作為一種“大算力+強算法”的產(chǎn)物,能夠賦能深度學(xué)習(xí),促進AI發(fā)展。2.3.1預(yù)訓(xùn)練大模型發(fā)展,破解深度學(xué)習(xí)難題隨著數(shù)據(jù)越來越多,算法越來越強大,算力也越來越強大。在這種背景下,預(yù)訓(xùn)練大模型得到了重視。想要實現(xiàn)AI的發(fā)展,就需要運用大量的數(shù)據(jù)進行訓(xùn)練,訓(xùn)練質(zhì)量的高低取決于數(shù)據(jù)的數(shù)量與質(zhì)量。預(yù)訓(xùn)練大模型是預(yù)先訓(xùn)練好的模型,通過對大量數(shù)據(jù)的挖掘與學(xué)習(xí),進入可大規(guī)模量產(chǎn)的落地階段,幫助用戶降低創(chuàng)建模型和訓(xùn)練的成本。預(yù)訓(xùn)練大模型是多種技術(shù)的結(jié)合,既需要深度學(xué)習(xí)算法的支撐,也需要大量數(shù)據(jù)、超高算力與自監(jiān)督學(xué)習(xí)能力,還需要在多種任務(wù)、多種場景內(nèi)進行遷移學(xué)習(xí),確保模型能夠應(yīng)用于多個場景,賦能各行各業(yè)。深度學(xué)習(xí)彌補了傳統(tǒng)機器學(xué)習(xí)的不足,是從數(shù)據(jù)中進行學(xué)習(xí),而預(yù)訓(xùn)練大模型則是借助大量模型訓(xùn)練數(shù)據(jù)。深度學(xué)習(xí)的優(yōu)勢是可以對各種類型的數(shù)據(jù)進行處理,如圖片、文本等很難通過機器處理的數(shù)據(jù)。而預(yù)訓(xùn)練大模型的優(yōu)勢不僅體現(xiàn)在處理數(shù)據(jù)的類型更加廣泛上,還體現(xiàn)在處理數(shù)據(jù)的級別更高上。此外,深度學(xué)習(xí)不需要借助大量的數(shù)據(jù)模型來挖掘數(shù)據(jù)特征之間的關(guān)聯(lián),但是預(yù)訓(xùn)練大模型需要,這表明其需要更強的算力支撐。預(yù)訓(xùn)練大模型在訓(xùn)練過程中會運用大量數(shù)據(jù),深度學(xué)習(xí)過程中也需要大量數(shù)據(jù),預(yù)訓(xùn)練大模型能夠為深度學(xué)習(xí)賦能,并推動AI不斷發(fā)展。1預(yù)訓(xùn)練大模型能夠推進AI產(chǎn)業(yè)化發(fā)展,實現(xiàn)AI轉(zhuǎn)型雖然AI發(fā)展得如火如荼,但其仍處在商業(yè)落地的初級階段,面臨著一系列問題,如碎片化的場景需求、人力成本過高、缺乏場景數(shù)據(jù)等。而預(yù)訓(xùn)練大模型能夠有效解決模型通用性、研發(fā)成本等方面的問題,加快AI落地。AI模型在使用深度學(xué)習(xí)技術(shù)時,僅對特定的應(yīng)用場景進行訓(xùn)練,采取傳統(tǒng)定制化的開發(fā)方式,然而傳統(tǒng)AI模型的流程較長,涵蓋了從研發(fā)到應(yīng)用的整條路徑。完成這一整套流程對研發(fā)人員的要求很高,研發(fā)人員不僅需要扎實的專業(yè)知識,而且需要齊心協(xié)力、通力合作,這樣才能完成瑣碎、復(fù)雜的工作。預(yù)訓(xùn)練大模型的訓(xùn)練原理是借助龐大、多樣的場景數(shù)據(jù),訓(xùn)練出適合不同場景、不同業(yè)務(wù)的通用能力,使預(yù)訓(xùn)練大模型能夠適配全新業(yè)務(wù)場景。預(yù)訓(xùn)練大模型的通用能力解決了AI多樣化的需求,降低了AI應(yīng)用落地的門檻。2預(yù)訓(xùn)練大模型借助自監(jiān)督學(xué)習(xí)功能降低AI開發(fā)成本傳統(tǒng)模型訓(xùn)練過程需要研發(fā)人員參與調(diào)參調(diào)優(yōu)工作,模型訓(xùn)練還需要大規(guī)模標(biāo)注數(shù)據(jù),對數(shù)據(jù)要求很高。但是,許多行業(yè)面臨著原始數(shù)據(jù)收集困難、收集數(shù)據(jù)成本高的問題。例如,在醫(yī)療行業(yè)中,為了保護用戶的隱私,難以大規(guī)模獲取用戶數(shù)據(jù)進行AI模型訓(xùn)練。預(yù)訓(xùn)練大模型的自監(jiān)督學(xué)習(xí)功能能夠很好地解決傳統(tǒng)模型訓(xùn)練所面臨的問題。自監(jiān)督學(xué)習(xí)功能無須或很少依靠人工對數(shù)據(jù)進行標(biāo)注,能夠自動學(xué)習(xí)區(qū)分原始數(shù)據(jù),并構(gòu)建學(xué)習(xí)任務(wù),解決了人工標(biāo)注成本高的問題。與傳統(tǒng)AI模型開發(fā)模式相比,預(yù)訓(xùn)練大模型更具有通用性,能夠?qū)崿F(xiàn)多個場景的廣泛應(yīng)用。自監(jiān)督學(xué)習(xí)功能有效降低了研發(fā)成本,為AI產(chǎn)業(yè)化提供助力。預(yù)訓(xùn)練大模型作為深度學(xué)習(xí)的一種模型,具有大量處理數(shù)據(jù)、提高模型準(zhǔn)確性等優(yōu)點。預(yù)訓(xùn)練大模型還能夠為深度學(xué)習(xí)提供支持,提高深度學(xué)習(xí)的訓(xùn)練效率。2.3.2破解通用性難題,應(yīng)用全方位突破深度學(xué)習(xí)作為建構(gòu)、訓(xùn)練AI的基石,為AI的發(fā)展提供了核心技術(shù),但是AI模型仍然面臨著很多挑戰(zhàn),其中的重要挑戰(zhàn)之一是AI模型的通用性太差,即A模型只能用于A領(lǐng)域,而無法適配B領(lǐng)域。針對這一問題,預(yù)訓(xùn)練大模型提供了解決方案。預(yù)訓(xùn)練大模型能夠使AI模型具有泛化能力,從而具有通用性與實用性。傳統(tǒng)AI模型往往使用已知數(shù)據(jù)進行訓(xùn)練,然而已知數(shù)據(jù)與實際數(shù)據(jù)可能存在一定的誤差,擬合程度不高。如果在測試環(huán)境中,還可以對AI模型進行調(diào)整,但在實際應(yīng)用中,重新調(diào)整的經(jīng)濟成本過高,也很難發(fā)揮更好的作用。碎片化、適配性差、成本高等問題,給AI規(guī)?;涞卦斐勺璧K。預(yù)訓(xùn)練大模型能夠解決這些問題,提高AI的開發(fā)效率。預(yù)訓(xùn)練大模型可以通過大規(guī)模的數(shù)據(jù)訓(xùn)練適應(yīng)下游任務(wù),即借助“大規(guī)模訓(xùn)練+微調(diào)”的方式破解通用性難題,實現(xiàn)全方位突破。例如,2022年12月,百度與鵬城實驗室共同研發(fā)了知識增強千億大模型—鵬城-百度·文心。鵬城-百度·文心的通用性很強,能夠完美完成閱讀理解、文本生成、跨模態(tài)語義理解等60多項任務(wù)。同時,鵬城-百度·文心還具有泛化能力,能夠在30多項小樣本任務(wù)上刷新基準(zhǔn)。鵬城-百度·文心以解決AI模型泛化能力弱、落地成本高為目的,賦能各行各業(yè)。目前,文心大模型已經(jīng)對外開放,在工業(yè)、金融等多個領(lǐng)域得到應(yīng)用。預(yù)訓(xùn)練大模型的出現(xiàn)解決了AI模型通用性難題,未來,預(yù)訓(xùn)練大模型將向著促進AI模型便捷化、高效化的方向發(fā)展。2.4多模態(tài)交互技術(shù):實現(xiàn)全方位的人機交互多模態(tài)交互技術(shù)是一種感官融合技術(shù),用戶可通過文字、語言、視覺、動作與計算機進行交互。借助多模態(tài)交互技術(shù),AI能夠充分模擬人與人之間的交互,實現(xiàn)全方位的人機交互,為用戶提供更好的體驗。2.4.1多模態(tài)交互:文字+語音+視覺+動作近年來,多模態(tài)交互技術(shù)得到了廣泛的應(yīng)用。多模態(tài)交互技術(shù)實現(xiàn)了文字、語音、視覺、動作4個方面的感官交互,使用戶與計算機的交互從單模態(tài)走向多模態(tài),為AIGC智能創(chuàng)作賦能。在我們的日常生活中,最常見的兩種模態(tài)是文字與視覺。視覺模型可以為AI提供強大的環(huán)境感知能力,文字模型使AI具有認(rèn)知能力。如果AIGC僅能生成單模態(tài)內(nèi)容,會對AIGC應(yīng)用場景的拓展、內(nèi)容生產(chǎn)方式的革新造成阻礙。由此,多模態(tài)營運而生。多模態(tài)能夠處理多種數(shù)據(jù),為人機交互提供動力。多模態(tài)大模型擁有兩種能力:一種是尋找不同模態(tài)數(shù)據(jù)之間的內(nèi)在關(guān)系。例如,將一段文字與圖片聯(lián)系起來;另一種是實現(xiàn)數(shù)據(jù)在不同模態(tài)之間的相互轉(zhuǎn)換。例如,根據(jù)動作生成對應(yīng)的圖片。多模態(tài)大模型的工作原理是將不同模態(tài)的數(shù)據(jù)放到相似或相同的語義空間中,通過不同模態(tài)之間的理解尋找不同模態(tài)數(shù)據(jù)的對應(yīng)關(guān)系。例如,在網(wǎng)頁中搜索圖片,需要輸入與之相關(guān)的文字。多模態(tài)交互也在人機交互中實現(xiàn)了廣泛應(yīng)用。AI的發(fā)展使服務(wù)機器人逐步走近用戶,在商場、餐廳、酒店等場景中,能看到服務(wù)機器人忙碌的身影。但是,大多數(shù)服務(wù)機器人都不夠智能,僅能如同平板電腦一般在用戶發(fā)出需求后響應(yīng),無法主動為用戶提供服務(wù)。在推動服務(wù)機器人智能化、人性化的需求下,百度率先對小度機器人進行了技術(shù)革新。百度借助多模態(tài)交互技術(shù),使小度機器人能夠快速理解當(dāng)前場景,理解用戶的意圖,主動和用戶互動。雖然讓機器人擁有主動互動能力并不是一項全新的技術(shù)創(chuàng)舉,但相較于以往的互動模式,機器人的互動能力有了很大提升。百度自主研制了人機主動交互系統(tǒng),設(shè)計了上千個模態(tài)動作,在觀察服務(wù)場景后,小度機器人能夠提供主動迎賓、引領(lǐng)講解、問答咨詢、互動娛樂等服務(wù),推動了機器人行業(yè)和AI行業(yè)的發(fā)展。多模態(tài)大模型能夠幫助AI進行多種交互,是AI邁向通用人工智能的重要步驟。未來,AI將借助多模態(tài)大模型,擁有更多認(rèn)知,幫助人類解決更多難題。2.4.2多模態(tài)人機交互讓虛擬數(shù)字人更加鮮活手機廠商紛紛推出虛擬數(shù)字人智能助手,京東、阿里巴巴等互聯(lián)網(wǎng)企業(yè)推出自己的數(shù)字人,美妝品牌紛紛邀請?zhí)摂M數(shù)字人代言……各行各業(yè)中的企業(yè)布局動作不斷,虛擬數(shù)字人成為熱門應(yīng)用,逐步走進人們的生活。虛擬數(shù)字人的火爆并不是偶然,而是用戶對于人機交互的深層次需求的體現(xiàn)。用戶不再滿足于單模態(tài)的單向輸出,而是渴望多模態(tài)的聽覺、視覺、動作和語言的融合。多模態(tài)人機交互技術(shù)的出現(xiàn),能滿足用戶的需求,使虛擬數(shù)字人更加鮮活。例如,百度推出了可交互數(shù)字人—度曉曉。度曉曉具有豐富多彩的聊天功能:基于“人設(shè)”與用戶互動,充分體現(xiàn)自己的個性;支持表情包、語音、視頻等多種聊天形式;擁有講故事、唱歌等多種玩法。度曉曉如同活在電子世界的真人,為用戶帶來真實的交互體驗。而這一切都離不開百度的技術(shù)支持。度曉曉運用多模態(tài)交互技術(shù),能夠在學(xué)習(xí)大量數(shù)據(jù)后,實現(xiàn)對語言、圖片和視頻的理解,不僅能夠與用戶產(chǎn)開交流,還能夠在長久的互動中實現(xiàn)成長。目前,多模態(tài)交互技術(shù)已經(jīng)在多個領(lǐng)域?qū)崿F(xiàn)落地。未來,這一技術(shù)會進入多場景應(yīng)用新階段,賦能各行各業(yè),催生更加鮮活的虛擬數(shù)字人。第3章產(chǎn)業(yè)生態(tài):產(chǎn)業(yè)生態(tài)已現(xiàn)雛形自2022年以來,從頻頻出圈的AI繪畫到火爆社交網(wǎng)絡(luò)的聊天機器人ChatGPT,AIGC相關(guān)應(yīng)用引發(fā)熱議。其強大的內(nèi)容生產(chǎn)力讓很多企業(yè)看到了發(fā)展機遇,企業(yè)紛紛加快布局。在越來越多的企業(yè)紛紛擁抱AIGC的態(tài)勢下,AIGC產(chǎn)業(yè)生態(tài)已現(xiàn)雛形。3.1產(chǎn)業(yè)生態(tài)拆解:上中下游產(chǎn)業(yè)鏈逐步搭建AIGC產(chǎn)業(yè)生態(tài)呈現(xiàn)3層架構(gòu):產(chǎn)業(yè)上游為AIGC提供技術(shù)基礎(chǔ),搭建基礎(chǔ)設(shè)施;產(chǎn)業(yè)中游提供各種算法模型,為AIGC的應(yīng)用提供工具;產(chǎn)業(yè)下游是AIGC的多領(lǐng)域應(yīng)用,聚集著諸多嘗試將AIGC落地的企業(yè)。3.1.1產(chǎn)業(yè)上游:提供核心數(shù)據(jù)服務(wù)在AIGC產(chǎn)業(yè)發(fā)展的過程中,人工智能的分析、決策、創(chuàng)作等功能的實現(xiàn)都離不開海量數(shù)據(jù)的支持。而AIGC產(chǎn)業(yè)的上游供應(yīng)商,主要提供的就是各種各樣的數(shù)據(jù)服務(wù)。整體而言,AIGC產(chǎn)業(yè)上游生態(tài)如表3-1所示。表3-1AIGC產(chǎn)業(yè)上游生態(tài)AIGC產(chǎn)業(yè)上游提供的數(shù)據(jù)服務(wù)包括數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注、數(shù)據(jù)治理等。1數(shù)據(jù)處理一般而言,數(shù)據(jù)庫有兩類:一類數(shù)據(jù)庫匯集各類數(shù)據(jù)但不做區(qū)分;另一類數(shù)據(jù)庫會分門別類地存儲數(shù)據(jù)。隨著技術(shù)的發(fā)展,供應(yīng)商往往會將兩種數(shù)據(jù)庫進行結(jié)合,以打造完善的數(shù)據(jù)庫,使數(shù)據(jù)庫同時具有易用性和規(guī)范性的特點,為用戶提供多元化的服務(wù)。從數(shù)據(jù)處理時效性的角度看,提供數(shù)據(jù)處理服務(wù)的供應(yīng)商包括異步處理型企業(yè)和實時處理型企業(yè)兩類。數(shù)據(jù)處理包括數(shù)據(jù)提取、數(shù)據(jù)加載、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集成等。根據(jù)處理方式的不同,提供數(shù)據(jù)處理服務(wù)的供應(yīng)商又分為本地部署型企業(yè)和云原生型企業(yè)兩種。2數(shù)據(jù)標(biāo)注無論哪種機器學(xué)習(xí)模型,都需要對數(shù)據(jù)進行標(biāo)注、管理、訓(xùn)練,從而形成算法模型。當(dāng)前市場上,谷歌推出AI系統(tǒng)LaMDA,與一家美國數(shù)據(jù)標(biāo)注服務(wù)商合作;Meta推出對話機器人BlenderBot3,與數(shù)據(jù)標(biāo)注平臺亞馬遜MTurk合作。不難看出,很多大模型的背后都有數(shù)據(jù)標(biāo)注平臺的支撐。在技術(shù)、需求的驅(qū)動下,數(shù)據(jù)標(biāo)注公司借助AI輔助標(biāo)注、模擬仿真等技術(shù)不斷提高數(shù)據(jù)標(biāo)注的質(zhì)量和效率,為用戶提供更優(yōu)質(zhì)的服務(wù)。3數(shù)據(jù)治理在AIGC蓬勃發(fā)展的數(shù)字經(jīng)濟時代,數(shù)據(jù)是重要的生產(chǎn)資料。因此,數(shù)據(jù)資產(chǎn)管理需要有明確的規(guī)范,數(shù)據(jù)訪問、數(shù)據(jù)調(diào)取等要做到合規(guī)。數(shù)據(jù)合規(guī)服務(wù)供應(yīng)商可以為企業(yè)提供多樣的數(shù)據(jù)治理工具和定制化的數(shù)據(jù)治理方案,為企業(yè)的AIGC探索提供數(shù)據(jù)支撐。3.1.2產(chǎn)業(yè)中游:搭建算法模型AIGC產(chǎn)業(yè)中游提供各種算法模型,這是AIGC最終落地應(yīng)用的關(guān)鍵環(huán)節(jié)。從整體來看,AIGC產(chǎn)業(yè)中游生態(tài)如表3-2所示。表3-2AIGC產(chǎn)業(yè)中游生態(tài)AIGC產(chǎn)業(yè)中游主要包括3類參與者。1AI實驗室算法模型是AI系統(tǒng)實現(xiàn)智能決策的關(guān)鍵,也是AI系統(tǒng)完成任務(wù)的基礎(chǔ)。為了更好地研究算法、推動AIGC商業(yè)化落地,很多企業(yè)打造了專業(yè)的AI實驗室。例如,谷歌收購了AI實驗室DeepMind,將機器學(xué)習(xí)、系統(tǒng)神經(jīng)科學(xué)等先進技術(shù)結(jié)合起來,構(gòu)建強大的算法模型。除附屬于企業(yè)的AI實驗室外,還有獨立的AI實驗室。當(dāng)下獲得諸多關(guān)注的OpenAI就是一個獨立的AI實驗室,致力于AI技術(shù)的開發(fā)。OpenAI推出的大型語言模型經(jīng)過了海量數(shù)據(jù)訓(xùn)練,可以準(zhǔn)確地生成文本,完成各種任務(wù)。2企業(yè)研究院一些實力強勁的大型企業(yè)往往會設(shè)立專注于前沿科技研發(fā)的研究院,以加強頂層設(shè)計,構(gòu)建企業(yè)創(chuàng)新的主體,推動企業(yè)進行新一輪變革。例如,阿里巴巴達摩院就是一家典型的企業(yè)研究院,旗下的M6團隊專注于認(rèn)知智能方向的研究,發(fā)布了大規(guī)模圖神經(jīng)網(wǎng)絡(luò)平臺AIiGraph、AI預(yù)訓(xùn)練模型M6等。其中,AI預(yù)訓(xùn)練模型M6功能強大,可以完成設(shè)計、對答、寫作等任務(wù),在電商、工業(yè)制造、藝術(shù)創(chuàng)作等領(lǐng)域都有所應(yīng)用。3開源社區(qū)開源社區(qū)對AIGC的發(fā)展十分重要。它提供了一個代碼共創(chuàng)的平臺,支持多人協(xié)作,可以推動AIGC技術(shù)的進步。例如,GitHub就是一個知名的開源社區(qū),它可以通過不同編程語言托管用戶的源代碼項目。其功能主要包括以下4個方面。(1)實現(xiàn)代碼項目
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 長春地理中考試卷及答案
- 空調(diào)系統(tǒng)操作員面試題詳解與答案
- 企業(yè)資源規(guī)劃系統(tǒng)管理員面試題及答案
- 體育教練員面試題目及專業(yè)答案
- 青島海爾集團設(shè)備管理經(jīng)理年度考核含答案
- 面試者如何準(zhǔn)備SAP業(yè)務(wù)分析師面試題
- 安徽省皖江名校聯(lián)盟2025-2026學(xué)年高一上學(xué)期12月聯(lián)考政治試卷
- 2025年高端裝備制造技術(shù)創(chuàng)新項目可行性研究報告
- 2025年室外運動設(shè)施更新改造可行性研究報告
- 2025年汽車租賃平臺優(yōu)化項目可行性研究報告
- 2025中國紅十字會總會備災(zāi)救災(zāi)中心招聘筆試歷年參考題庫附帶答案詳解
- 裝修工程檢測方案模板(3篇)
- CWPC2025第十一屆中國國際風(fēng)電復(fù)合材料創(chuàng)新發(fā)展論壇暨展覽會:大型風(fēng)電葉片夾芯材料應(yīng)用探討
- 鋼筋工入場安全教育試卷及答案
- 噴淋頭消防知識培訓(xùn)內(nèi)容課件
- 2025年陜西省專業(yè)技術(shù)人員繼續(xù)教育公需課試題及答案
- 超聲引導(dǎo)技術(shù)用于疼痛治療中國專家共識解讀
- 院前急救的風(fēng)險管理
- 2025年陜鐵院單招試題及答案
- 消防清包工勞務(wù)合同范本
- 中醫(yī)護理技術(shù)推拿
評論
0/150
提交評論