AI 系列專題跟蹤：視頻及圖像生成模型

上傳人：1*** IP屬地：山西上傳時(shí)間：2025-07-22 格式：DOCX 頁數(shù)：127 大?。?.20MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩122頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明證券研究報(bào)告?zhèn)髅絣生成式AI模型開源閉源并行發(fā)展，模型版本持續(xù)迭代l生成式AI模型開源閉源并行發(fā)展，模型版本持續(xù)迭代66%49%32%16%-1%-18%執(zhí)業(yè)證書號(hào)：S0010521080002郵箱：jinrong@限，穩(wěn)定幣概念或持續(xù)發(fā)酵2025-念行情2025-06-22l生成式AI在影視行業(yè)內(nèi)全鏈路布局，多維度提升影成式AI在劇本生成，角色/場(chǎng)景建模，動(dòng)畫生成，后期配音，剪輯調(diào)色壓縮的情況，這也就對(duì)視頻生成的前后一致性有了更高的要求。l助力游戲內(nèi)容生成，游戲內(nèi)賦能交互場(chǎng)景l(fā)生成式AI未來趨勢(shì)“局部合理，整體荒謬”情況，穩(wěn)定性有待提高。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明2/67l投資建議快手可靈大模型從23年推出開始，先后經(jīng)歷了6個(gè)版本迭代至可靈端包括：分眾傳媒，藍(lán)色光標(biāo)、省廣集團(tuán)、l風(fēng)險(xiǎn)提示敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明3/67正文目錄1AI視頻及圖像生成模型未來展望 81.1AI視頻圖像模型技術(shù)發(fā)展趨勢(shì) 81.2AI視頻圖像模型未來應(yīng)用場(chǎng)景展望 2RUNWAY 152.1GEN系列模型迭代更新，內(nèi)容生成技術(shù)不斷精進(jìn) 152.2GEN系列模型應(yīng)用場(chǎng)景案例及核心技術(shù) 162.3RUNWAY產(chǎn)品價(jià)格模式 223可靈AI 233.1可靈AIB端C端同步發(fā)展 233.2可靈AI商業(yè)化模式及運(yùn)營(yíng)數(shù)據(jù) 273.3近期更新 294即夢(mèng)AI 304.1即夢(mèng)AI模型版本迭代、核心功能及技術(shù) 304.2即夢(mèng)AI模型應(yīng)用場(chǎng)景、生成效果及同行業(yè)產(chǎn)品對(duì)比 324.3即夢(mèng)AI產(chǎn)品價(jià)格模式 355MIDJOURNEY 365.1MIDJOURNEY版本迭代、優(yōu)化情況及效果圖比較 365.2MIDJOURNEY核心技術(shù)及應(yīng)用場(chǎng)景 375.3MIDJOURNEY產(chǎn)品價(jià)格模式 396STABLEDIFFUSION 406.1STABLEDIFFUSION版本迭代與變體及核心功能 406.2STABLEDIFFUSION核心技術(shù)及應(yīng)用場(chǎng)景 426.3STABLEDIFFUSION產(chǎn)品價(jià)格模式 457豆包 457.1豆包大模型關(guān)鍵更新迭代、主要功能變化 457.2豆包大模型核心技術(shù)及應(yīng)用場(chǎng)景 477.3豆包視覺理解模型、圖片及視頻生成模型產(chǎn)品價(jià)格模式 488海藝AI-SEAARTAI 508.1SEAARTAI版本迭代、核心技術(shù)及合作情況 508.2SEAARTAI用戶分層及應(yīng)用場(chǎng)景 518.3SEAARTAI產(chǎn)品價(jià)格模式 539LIBLIBAI 54敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明4/67 9.1LIBLIBAI概況、融資情況及核心功能 549.2LIBLIBAIX星流STAR-3ALPHA大模型功能及應(yīng)用場(chǎng)景 559.3全球第一款專業(yè)設(shè)計(jì)AIAGENT：LOVART 589.4LIBLIBAI產(chǎn)品價(jià)格模式 5910美圖AIAGENTROBONEO 6011投資建議 6211.1影視行業(yè)應(yīng)用 6211.2游戲行業(yè)應(yīng)用 6411.3相關(guān)公司 65風(fēng)險(xiǎn)提示： 66敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明5/67 圖表12024年11月至2025年4月AI視頻圖像模型發(fā)展圖 8圖表2近期3D生成模型及核心技術(shù)介紹 9圖表3CUBE3D生成3D模型效果圖 10圖表4UNI-3DAR生成3D模型效果圖 10圖表5KISS3DGEN生成3D模型效果圖 10圖表6TRIPOSG和TRIPOSF生成3D模型效果圖圖表7《WHISPERSFROMTHESTAR》游戲圖表8自然選擇《EVE》游戲場(chǎng)景圖表9AI陪伴產(chǎn)品《EVE》主要功能 12圖表10上海電影X即夢(mèng)AI“未來影像計(jì)劃·AL動(dòng)畫創(chuàng)作周”-1 12圖表11上海電影X即夢(mèng)AI“未來影像計(jì)劃·AL動(dòng)畫創(chuàng)作周”-2 13圖表12天貓AI聯(lián)動(dòng)明星、企業(yè)共創(chuàng)年畫 13圖表13康師傅A(chǔ)I寫春聯(lián) 13圖表14可口可春節(jié)數(shù)字人新年祝福 14圖表15伊利《千年江南》短片 14圖表16二手玫瑰、京東家電《我要開花AIGC版》 14圖表17《我要開花AIGC版》工作流節(jié)選 14圖表18武漢警官職業(yè)學(xué)院新校區(qū)（AI輔助生成圖） 15圖表19鄂州花湖機(jī)場(chǎng)BIM設(shè)計(jì)圖 15圖表20LOVART設(shè)計(jì)一款包 15圖表21LOVART設(shè)計(jì)一款寵物食品品牌 15圖表22RUNWAYGEN系列模型迭代情況、主要特點(diǎn)及應(yīng)用場(chǎng)景 16圖表23GEN-1模型應(yīng)用示例：使用幾個(gè)包裝盒視頻，生成工廠視頻 17圖表24GEN-2模型應(yīng)用示例：文本生成視頻（TEXTTOVIDEO） 17圖表25GEN-2模型應(yīng)用示例：圖片生成視頻（IMAGETOVIDEO） 17圖表26GEN-2模型應(yīng)用示例：文本+圖片生成視頻（TEXT+IMAGETOVIDEO） 18圖表27GEN-2模型應(yīng)用示例：故事板（STORYBOARD） 18圖表28GEN-2模型應(yīng)用示例：渲染（RENDER） 18圖表29GEN-3ALPHA模型應(yīng)用示例：精細(xì)的時(shí)間控制 19圖表30GEN-3ALPHA模型應(yīng)用示例：逼真的人類角色 19圖表31GEN-3ALPHA模型應(yīng)用示例：藝術(shù)家創(chuàng)作 19圖表32GEN-3ALPHA模型應(yīng)用示例：行業(yè)定制 20圖表33GEN-4模型應(yīng)用示例：《THELONELYLITTLEFLAME》 20圖表34GEN-4模型應(yīng)用示例：《NEWYORKISAZOO》 20圖表35GEN-4模型應(yīng)用示例：《THEHERD》 21圖表36RUNWAYGEN-4自制短片故事內(nèi)容及技術(shù) 21圖表37GEN-4TURBO模型應(yīng)用示例： 21圖表38RUNWAYGEN系列模型核心技術(shù) 22圖表39RUNWAYC端用戶月度訂閱價(jià)格 22圖表40可靈AIWEB端界面 23圖表41可靈AIAPP端界面 23敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明6/67 圖表42可靈AI版本迭代情況 24圖表43可靈AI運(yùn)營(yíng)數(shù)據(jù) 25圖表44“2025年AI視頻生成企業(yè)TOP20”榜單 25圖表45VIT架構(gòu) 26圖表46256X256圖像下架構(gòu)評(píng)測(cè) 26圖表47可靈會(huì)員價(jià)格 27圖表48可靈視頻生成資源包 27圖表49可靈圖片生成資源包 27圖表50可靈AIWEB端全球訪問量 28圖表51可靈AIAPP端國(guó)內(nèi)下載量 28圖表52CONCEPTMASTER多主體生成示例 29圖表53文生視頻模型勝負(fù)比 30圖表54圖生視頻模型勝負(fù)比 30圖表55即夢(mèng)AI模型迭代及核心功能突破情況 31圖表56即夢(mèng)AI核心技術(shù) 31圖表57即夢(mèng)3.0對(duì)齊比較（ALIGNMENTCOMPARISON） 32圖表58即夢(mèng)3.0結(jié)構(gòu)比較（STRUCTURECOMPARISON） 33圖表59即夢(mèng)3.0美學(xué)比較（AESTHETICCOMPARISON） 33圖表60即夢(mèng)3.0設(shè)計(jì)比較（DESIGNCOMPARISON） 33圖表61即夢(mèng)3.0文本渲染比較（TEXTRENDERING） 34圖表62即夢(mèng)3.0超現(xiàn)實(shí)主義肖像比較（PHOTOREALISTICPORTRAIT） 34圖表63即夢(mèng)3.0超現(xiàn)實(shí)主義肖像效果圖 35圖表64即夢(mèng)AI用戶月度訂閱價(jià)格及積分情況 35圖表65MIDJOURNEY模型版本迭代、優(yōu)化情況及效果圖比較 36圖表66MIDJOURNEYV7模型核心技術(shù)亮點(diǎn) 37圖表67MIDJOURNEY應(yīng)用場(chǎng)景：繪畫創(chuàng)作 38圖表68MIDJOURNEY應(yīng)用場(chǎng)景：家居設(shè)計(jì)和裝修 38圖表69MIDJOURNEY應(yīng)用場(chǎng)景：電商海報(bào)宣傳 38圖表70MIDJOURNEY應(yīng)用場(chǎng)景：LOGO和徽章設(shè)計(jì) 39圖表71MIDJOURNEY應(yīng)用場(chǎng)景：插畫、漫畫和油畫 39圖表72MIDJOURNEY產(chǎn)品訂閱價(jià)格及說明 40圖表73STABLEDIFFUSION版本迭代與變體情況及性能介紹 40圖表74STABLEDIFFUSION核心功能及技術(shù)實(shí)現(xiàn) 41圖表75STABLEDIFFUSION用戶類型及核心需求 42圖表76STABLEDIFFUSION工作流程及U-NET網(wǎng)絡(luò)+SCHEDULE算法迭代去噪過程 42圖表77STABLEDIFFUSION包含模型及核心技術(shù) 43圖表78STABLEDIFFUSION應(yīng)用場(chǎng)景： 43圖表79STABLEDIFFUSION應(yīng)用場(chǎng)景：設(shè)計(jì)師/插畫師 44圖表80STABLEDIFFUSION應(yīng)用場(chǎng)景：游戲開發(fā) 44圖表81STABLEDIFFUSION應(yīng)用場(chǎng)景：AI研究 44圖表82STABLEDIFFUSIONB端及C端產(chǎn)品訂閱價(jià)格及說明 45圖表83豆包大模型更新迭代情況 46圖表84豆包產(chǎn)品功能更新情況 47圖表85豆包大模型家族九款模型 48敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明7/67 圖表86豆包九款模型主要功能及應(yīng)用場(chǎng)景簡(jiǎn)介 48圖表87豆包視覺理解模型收費(fèi)價(jià)格 49圖表88視覺理解TOKEN用量說明 49圖表89豆包視頻生成模型收費(fèi)價(jià)格 49圖表90豆包圖片生成模型收費(fèi)價(jià)格 49圖表91SEAARTAI核心技術(shù)優(yōu)勢(shì) 50圖表92SEAARTAI與亞馬遜云科技、阿里云、華為云技術(shù)合作情況 51圖表93海藝互娛基于亞馬遜云科技服務(wù)于海外用戶的技術(shù)架構(gòu)示意圖 51圖表94SEAARTAI落地頁功能界面：免費(fèi)AI藝術(shù)生成器與創(chuàng)意社區(qū)、廣場(chǎng) 52圖表95COMFYUI核心功能介紹 52圖表96SEAARTAI游戲內(nèi)容生成效果圖：像素游戲場(chǎng)景生成器、貓狗斗爭(zhēng)游戲場(chǎng)景 53圖表97SEAARTAI產(chǎn)品訂閱價(jià)格及說明 53圖表98LIBLIBAI2023年至今融資情況 54圖表99LIBLIBAI核心功能介紹 54圖表100STAR-3ALPHA大模型與MIDJOURNEYV6.1、DALLE-3、FLUX.1DEV評(píng)測(cè)比較 55圖表101STAR-3ALPHA大模型功能特性 55圖表102STAR-3ALPHA應(yīng)用場(chǎng)景：電商與產(chǎn)品展示 56圖表103STAR-3ALPHA應(yīng)用場(chǎng)景：廣告與市場(chǎng)推廣 56圖表104STAR-3ALPHA應(yīng)用場(chǎng)景：插畫與藝術(shù)創(chuàng)作 57圖表105STAR-3ALPHA應(yīng)用場(chǎng)景：室內(nèi)設(shè)計(jì)與建筑可視化 57圖表106STAR-3ALPHA應(yīng)用場(chǎng)景：社交媒體內(nèi)容創(chuàng)作 57圖表107LOVART一站式調(diào)用GPTIMAGE-1等模型 58圖表108LOVART智能任務(wù)分解流程 58圖表109LOVART設(shè)計(jì)PUPU品牌包并生成海報(bào) 59圖表110LOVART生成寵物零食廣告圖 59圖表111LIBLIBAIB端及C端產(chǎn)品訂閱價(jià)格及說明 60 60圖表113ROBONEO產(chǎn)品交互品牌設(shè)計(jì)——“設(shè)計(jì)一個(gè)科技感LOGO，主色為藍(lán)色，搭配簡(jiǎn)約線條”分析過程 61圖表114ROBONEO產(chǎn)品交互品牌設(shè)計(jì)——輸出成果圖 62圖表115SORA生成視頻出現(xiàn)椅子漂浮情況 63圖表116《海上女王鄭一嫂》劇照 63圖表117不同AI技術(shù)適用場(chǎng)景 64圖表118生成式AI在游戲開發(fā)過程中應(yīng)用架構(gòu)圖 65敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明8/67 款新版本視頻及圖像生成模型，包括OpenAIGPT-image-1、RunwayGen-4、義QVQ-72B-Preview模型參數(shù)規(guī)模迅速擴(kuò)大，計(jì)算能力及復(fù)雜場(chǎng)景處理性能不斷源模型降低中小開發(fā)者門檻，在游戲、短視頻等圖表12024年11月至2025年4月AI視頻圖像模型發(fā)展圖PixelDance,SeaweedS2.0Pro，P2.0Pro生數(shù)科技ViduAI2024.11CogVideo-Xv1.55B,I2VHunyuan-LargeAmazonNova系列(Micro,Lite,Pro,Canvas,Reel,Sonic)TeleAI-VASTSORASee3DCCDoubao-vision-pro-32kVideoOceanV2.0MiniMax-VL-01ViduAI2.0Ray22025.013D港科大3D生成模型：Kiss3DGenGen-4MidjourneyV7halSeaweed-7B，Seedream3.0，Doubao-1.5-thinking-pro-vision路快手可靈2.0,可圖2.0ViduQ1FireflyImageModel4，F(xiàn)ireflyImageModel4UltraGPT-image-12025.02阿里通義萬相2025.02阿里通義萬相：Wan2.1Apache2.協(xié)議騰訊混元：HunyuanVideoFastHunyuanCosmos阿里通義：QVQ-72B-Preview2025.03Google：GeminiFlash2.0Roblox：CubeNVIDIA：更新Cosmos系列Cosmos-Reason1-8B,Cosmos-Reason1-56B深勢(shì)科技、北京科學(xué)智能研究3DAR阿里通義：Qwen2.5-VL-32B-Instruct，Qwen2.5-Omni-7B，QVQ-Max清華大學(xué)、騰訊：Video-T1VAST3D生成模型：TripoSG、TripoSF2025.04SandAI(三呆科技)：MAGI-1敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明9/67Uni-3DAR，未來可應(yīng)用于構(gòu)建通用科學(xué)智能體構(gòu)、統(tǒng)一生成和理解的自回歸框架，后期可以引入多模態(tài)信息并結(jié)合大語言模型與圖表2近期3D生成模型及核心技術(shù)介紹深勢(shì)科技、北京科學(xué)智能研究和理解任務(wù)能夠在單一模型內(nèi)同時(shí)進(jìn)行，使不同任務(wù)對(duì)應(yīng)token在模香港科技大學(xué)技），）；訓(xùn)練策略：借鑒實(shí)時(shí)渲染中的視錐體剔除技術(shù)，在訓(xùn)練時(shí)僅激活相機(jī)視角內(nèi)的體構(gòu)更加精細(xì)，紋理色彩更加豐富，目前3D生成大模型已幅提高生成效率并降低人工建模成本，通過AI重構(gòu)3D創(chuàng)作流程用領(lǐng)域覆蓋消費(fèi)級(jí)市場(chǎng)和工業(yè)制造，在手辦潮玩、課程教育、定制化設(shè)計(jì)等細(xì)分領(lǐng)域應(yīng)用雛形初現(xiàn)。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明10/67 圖表3Cube3D生成3D模型效果圖圖表4Uni-3DAR生成3D模型效果圖圖表5Kiss3DGen生成3D模型效果圖敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明11/67 圖表6TripoSG和TripoSF生成3D模型效果圖發(fā)展，玩家任務(wù)是幫助主角Stella在外星星球生存并找到回家的路，在此過程中可以通過視頻、語音和文字多模態(tài)輸入與Stell面通過自研AI對(duì)話模型Vibe深度理解用圖表7《WhispersfromtheStar》游戲圖表8自然選擇《EVE》游戲場(chǎng)景資料來源：WhispersfromtheStar官網(wǎng)，華安證券研究所資料來源：AIHub，華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明12/67圖表9AI陪伴產(chǎn)品《EVE》主要功能能夠深度理解用戶的輸入，提供如真人般的自然交流體驗(yàn)，專為情感陪伴設(shè)計(jì)，旨在滿足結(jié)合了實(shí)時(shí)內(nèi)容推薦系統(tǒng)和游戲級(jí)別的劇情設(shè)計(jì)，提供豐富的交互體驗(yàn)，用戶可以參與到精心設(shè)“AI+影視動(dòng)畫”合作成果初現(xiàn)，AI技術(shù)賦能展廳三個(gè)維度逐步落地雙方的戰(zhàn)略合作。上海電影與即夢(mèng)AI將視動(dòng)畫”，推進(jìn)AI技術(shù)在影視內(nèi)容生成、IP運(yùn)營(yíng)、宣發(fā)模式等全鏈條的創(chuàng)新應(yīng)用。圖表10上海電影X即夢(mèng)AI“未來影像計(jì)劃·Al動(dòng)畫創(chuàng)作周”-1敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明13/67 圖表11上海電影X即夢(mèng)AI“未來影像計(jì)劃·Al動(dòng)畫創(chuàng)作周”-2多位明星與多個(gè)熱門IP，發(fā)起AI共創(chuàng)年畫活動(dòng)，用戶通過AI互動(dòng)在明星或IP制作模式吸引大量粉絲參與，持續(xù)助力品牌營(yíng)銷；2）康師頻生成技術(shù)制作明星數(shù)字形象，配合獨(dú)特的主題視覺以及辨識(shí)度極高的音樂。圖表12天貓AI聯(lián)動(dòng)明星、企業(yè)共創(chuàng)年畫圖表13康師傅A(chǔ)I寫春聯(lián)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明14/67 圖表14可口可春節(jié)數(shù)字人新年祝福圖表圖表14可口可春節(jié)數(shù)字人新年祝福圖表16二手玫瑰、京東家電《我要開花AIGC版》圖表17《我要開花AIGC版》工作流節(jié)選資料來源：數(shù)英DIGITALING，華安證券研究所資料來源：數(shù)英DIGITALING，Agent）Lovart，創(chuàng)始人陳冕曾任字節(jié)跳動(dòng)剪映全球商業(yè)化負(fù)責(zé)人：聚焦品牌設(shè)計(jì)，師通過“GiantAI”軟件（建筑創(chuàng)意具現(xiàn)軟件）勾畫，使得需要設(shè)計(jì)師數(shù)日渲染修改的助設(shè)計(jì)已應(yīng)用于武漢警官職業(yè)學(xué)院新校區(qū)、天門石家河遺址博物館、陜西省政務(wù)和拆解到專業(yè)交付的全鏈路設(shè)計(jì)，給出具體英文提示即可設(shè)計(jì)出一款前衛(wèi)、時(shí)尚的包毛貴賓犬、充滿趣味的線描插畫、手繪涂鴉風(fēng)格并保留筆觸感。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明15/67 圖表19鄂州花湖機(jī)場(chǎng)BIM設(shè)計(jì)圖圖表圖表19鄂州花湖機(jī)場(chǎng)BIM設(shè)計(jì)圖資料來源：極目新聞，華安證券研究所資料來源：極目新聞，華安證券研究所圖表20Lovart設(shè)計(jì)一款包圖表21Lovart設(shè)計(jì)一款寵物食品品牌資料來源：Lovart官網(wǎng)，華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明16/67圖表22RunwayGen系列模型迭代情況、主要特點(diǎn)及應(yīng)用場(chǎng)景發(fā)布時(shí)間模型名稱主要特點(diǎn)應(yīng)用場(chǎng)景應(yīng)用文本prompt或參考圖像指定的任何風(fēng)控和內(nèi)容感知引導(dǎo)的視頻擴(kuò)散模型，能夠?qū)σ咽褂脦讉€(gè)包裝盒視頻，根據(jù)視頻形狀從頭開始直接生成視頻的技術(shù)突破，在原有技派拉蒙和迪士尼等頂級(jí)電影制片公司，可用于改進(jìn)特效制作和多語言配音等方面，如為靜態(tài)圖像添加動(dòng)態(tài)元列信息的描述性字幕，使得其能夠精確控制視助導(dǎo)演和制片人預(yù)覽場(chǎng)景和故事情企業(yè)宣傳：企業(yè)可以制作高質(zhì)量宣傳視頻，展示產(chǎn)品特點(diǎn)、企業(yè)文化或服新的藝術(shù)表現(xiàn)形式，創(chuàng)作出獨(dú)特的視真、充滿動(dòng)態(tài)感的視頻內(nèi)容，為影視短片《TheLonelyLittleFlame》、游戲開發(fā)：高度一致性和動(dòng)態(tài)運(yùn)動(dòng)捕捉能力，能夠快速生成高質(zhì)量的和視后將現(xiàn)有視頻轉(zhuǎn)化為新視頻。技術(shù)端Gen-1提出了可控的結(jié)構(gòu)和內(nèi)容感知的視頻擴(kuò)散模型，通過大規(guī)模無字幕視頻和配對(duì)文本-圖像數(shù)轉(zhuǎn)換為與用戶提供的圖像或文本提示相匹配的效果，同時(shí)靈活控制模型對(duì)視頻結(jié)構(gòu)的控制力度，通過自定義的指導(dǎo)方法來調(diào)整推理過程，以控制生成視頻與原視頻的敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明17/67 圖表23Gen-1模型應(yīng)用示例：使用幾個(gè)包裝盒視頻，生成工廠視頻圖表24Gen-2模型應(yīng)用示例：文本生成視頻（TexttoVideo）圖表25Gen-2模型應(yīng)用示例：圖片生成視頻（ImagetoVideo）敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明18/67 圖表26Gen-2模型應(yīng)用示例：文本+圖片生成視頻（Text+ImagetoVideo）圖表27Gen-2模型應(yīng)用示例：故事板（Storyboard）輸入視頻：轉(zhuǎn)換為完全風(fēng)格化和動(dòng)畫化的渲染輸出視頻圖表28Gen-2模型應(yīng)用示例：渲染（Render）RunwayGen-3Alpha模型技術(shù)端在全新基礎(chǔ)設(shè)施上進(jìn)行大規(guī)模多模態(tài)訓(xùn)練，保真度、一致性和運(yùn)動(dòng)表現(xiàn)上有重大提升，同時(shí)推出多種高級(jí)控制工具并帶有保護(hù)措施，包敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明19/67 括內(nèi)部視覺審核系統(tǒng)和C2PA溯源標(biāo)準(zhǔn)。以下應(yīng)用場(chǎng)景包括精細(xì)的時(shí)間控制、逼真的人類角色、藝術(shù)家創(chuàng)作、行業(yè)定制等。通過高描述性、時(shí)間密集型的訓(xùn)練，可實(shí)現(xiàn)富有想象力的過渡和場(chǎng)景中元素的精確關(guān)鍵幀。圖表29Gen-3Alpha模型應(yīng)用示例：精細(xì)的時(shí)間控制生成具有各種動(dòng)作、手勢(shì)和情感的富有表現(xiàn)力的人類角色，解鎖新故事講述。圖表30Gen-3Alpha模型應(yīng)用示例：逼真的人類角色科學(xué)家、工程師和藝術(shù)家組成的跨學(xué)科團(tuán)隊(duì)的協(xié)作努力，解釋各種風(fēng)格和電影術(shù)語。圖表31Gen-3Alpha模型應(yīng)用示例：藝術(shù)家創(chuàng)作敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明20/67 領(lǐng)先的娛樂和媒體組織合作創(chuàng)建定制版本，對(duì)角色進(jìn)行更風(fēng)格控制和更一致的角色。圖表32Gen-3Alpha模型應(yīng)用示例：行業(yè)定制RunwayGen-4模型技術(shù)核心在于世界一致性（Wor生成式視覺特效（GVFX）技術(shù)，能夠通過AI驅(qū)動(dòng)的生成能力，大幅縮短視覺特效制作中的建模、渲染和后期調(diào)整過程。以下應(yīng)用場(chǎng)景包括Runway使用Gen-4圖表33Gen-4模型應(yīng)用示例：《TheLonelyLittleFlame》圖表34Gen-4模型應(yīng)用示例：《NewYorkisaZoo》敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明21/67圖表35Gen-4模型應(yīng)用示例：《TheHerd》圖表36RunwayGen-4自制短片故事內(nèi)容及技術(shù)短片名稱主要故事內(nèi)容及技術(shù)了更高效的推理算法或增強(qiáng)的硬件加速支持，在延續(xù)了前代世界一致性（World速迭代和創(chuàng)意探索的場(chǎng)景，例如短視頻內(nèi)容創(chuàng)作、概念驗(yàn)證或?qū)崟r(shí)視覺效果預(yù)覽。圖表37Gen-4Turbo模型應(yīng)用示例：敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明22/67圖表38RunwayGen系列模型核心技術(shù)模型名稱核心技術(shù)Act-One技術(shù)是生成式角色表演工具，能夠?qū)⒁曨l和語音輸入轉(zhuǎn)換演員的表演，生成逼真的角色動(dòng)畫，保留眼神、微表格模式為積分訂閱制，根據(jù)不同付費(fèi)計(jì)劃類型，提供相對(duì)應(yīng)的訂閱價(jià)格，年度訂閱一定的積分，消耗積分?jǐn)?shù)量與生成視頻時(shí)長(zhǎng)、使用模型類型、視頻分辨率以及高級(jí)功能（如去除水印、使用特定的運(yùn)鏡方式或運(yùn)動(dòng)速度控制等）有關(guān)。圖表39RunwayC端用戶月度訂閱價(jià)格付費(fèi)計(jì)劃月度訂閱價(jià)格及積分說明將輸出升級(jí)到4k；敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明23/67可靈是快手自主研發(fā)的視頻生成大模型，主要為用戶提供高質(zhì)量的視頻內(nèi)容生成服務(wù)?？伸`AI可以支持用戶通過多種形式進(jìn)行輸入生成，包括但不限于文字、圖片、動(dòng)作視頻等。目前可靈產(chǎn)品在移動(dòng)端、Web端和海外均上線，實(shí)現(xiàn)完善的產(chǎn)品矩陣。資料來源：可靈AIweb端，華安證券研究所在版本迭代更新上，可靈AI經(jīng)歷了初始版本，1.0版本，1.5版本，1.6版本和最新的2.0版本。可靈AI以自研的可靈和可圖大模型為基礎(chǔ)，提供視頻和圖像的生成與編輯能力，并在版本迭代過程中不斷在視頻時(shí)長(zhǎng)，視頻質(zhì)量，物理規(guī)律真實(shí)性上進(jìn)行優(yōu)化。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明24/67模型名稱推出時(shí)間簡(jiǎn)介及重點(diǎn)更新基于快手自研大模型可靈和可圖，提供視頻及圖像生成與編輯能以及語義理解等方面均有顯著提升。引入了全新的“運(yùn)動(dòng)筆刷能，為企業(yè)級(jí)用戶提供了更加強(qiáng)大的視頻及圖像生成與編理模擬、語義理解和美學(xué)表現(xiàn)上進(jìn)行升級(jí)。正式提出AI理念推出多模態(tài)編輯功能?？蓤D2.0在生成質(zhì)量上，可靈2.1全面提升。主要在度等方面進(jìn)行優(yōu)化。另外，物理模擬和人物動(dòng)作幅度等更真實(shí)，更符合可靈AI在B端與C端同步發(fā)展。C端方面，可靈AI為自媒體用戶和部分廣告主提供創(chuàng)作生產(chǎn)力，公司測(cè)算可靈AI可以為客戶的短視頻營(yíng)銷素材制作成本降低60-70%，這帶動(dòng)了C端用戶的付費(fèi)增長(zhǎng)。從用戶結(jié)構(gòu)上看，在可靈2.0發(fā)布會(huì)上，公司披露可靈AI全球用戶規(guī)模超2200萬。截止至2024年末，我國(guó)短視頻創(chuàng)作者賬號(hào)規(guī)模達(dá)16.2億，日短視頻數(shù)量超1.3億條，快手創(chuàng)作者數(shù)量達(dá)1900萬。藍(lán)色光標(biāo)等數(shù)千家客戶合作，滿足在線教育，電子商務(wù)，智慧城市等領(lǐng)域的需求。可靈AI通過其API服務(wù)的靈活性和個(gè)性化適配客戶應(yīng)用場(chǎng)景，在行業(yè)內(nèi)領(lǐng)先?？伸`的全球開發(fā)者數(shù)量超1.5萬，已累計(jì)生成1200萬圖像和4000萬個(gè)視頻素材。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明25/67 在DBC、CIW和CIS聯(lián)合發(fā)布的“2025年AI視頻生成企業(yè)TOP20”榜單中，可靈AI成為榜首?？伸`AI基于快手自研的可靈大模型和可圖大模型，模型上采用了類Sora的DiT結(jié)構(gòu)，并用Transformer取代傳統(tǒng)的卷積網(wǎng)絡(luò)結(jié)構(gòu)，擴(kuò)散模型基座為flow模型。以上的架構(gòu)設(shè)計(jì)為可靈AI在視頻生成上處于領(lǐng)先地位打下技術(shù)基礎(chǔ)。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明26/67 DiT架構(gòu)集成了近年Diffusion生成模型的多種優(yōu)秀技術(shù)，基于LatentDiffusionModel（LDM）框架，采用VisionTransformer（ViT）作為主干網(wǎng)絡(luò)。創(chuàng)新點(diǎn)在于用Transformer學(xué)習(xí)和預(yù)測(cè)noise以及方差，具體為使用Transformer架構(gòu)替換了傳統(tǒng)的Diffusion模型中的卷積U-Net主干網(wǎng)絡(luò)。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明27/67 目前可靈APP會(huì)員分為三類，分別為：黃金會(huì)員（66元包月，可生成66個(gè)標(biāo)準(zhǔn)視頻），鉑金會(huì)員（268元包月，可生成300個(gè)標(biāo)準(zhǔn)視頻），鉆石會(huì)員（666元包月，可生成800個(gè)標(biāo)準(zhǔn)視頻）。用戶也可以購買資源包用來訪問視頻和圖片生成相關(guān)API能力，包括文生視頻、圖生視頻、視頻延長(zhǎng)、對(duì)口型、視頻特效、文生圖和圖生圖。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明28/67 參考非凡產(chǎn)研數(shù)據(jù)，2025年5月份，可靈AIWeb端全球訪問量達(dá)1626萬，MAU為460萬，4月份訪問量為1909萬。2025年5月，可靈AIAPP端下載量達(dá)79萬，4月份為108萬。全球訪問量（萬）mom50%40%30%200030%20%0%0%-10%-20%-30%-40%80608060402005000下載量（萬）環(huán)比變化2025.32025.42025.55%0%-5%-10%-15%-20%-25%-30%-35%-40%資料來源：非凡產(chǎn)研，華安證券研究所資料來源：非凡產(chǎn)研，華安證券研究所ConceptMaster是快手可靈發(fā)布的多主體視頻生成技術(shù)方案，用于多概念視頻定制的創(chuàng)新框架，可以在未測(cè)試調(diào)優(yōu)的情況下，在擴(kuò)散模型上生成高質(zhì)量個(gè)性化視頻。什么是多主體視頻生成？可以理解為在文生視頻模型基礎(chǔ)上支持輸入多個(gè)主體圖像，從而在生成視頻的過程中把多個(gè)主體組合在同一視頻中。圖生視頻有一定區(qū)別，圖生視頻是以輸入的圖像作為生成視頻的首幀然后進(jìn)行生成，一定程度上沒有多主體視頻生成靈活。除可靈外，Vidu和Pika等也上線多主體視頻生成功能。ConceptMaster的功能有哪些？1）多概念定制視頻：可以通過輸入多個(gè)圖像生成多個(gè)概念的定制視頻，例如根據(jù)一張“一個(gè)小男孩在路上騎自行車”的圖像生成視頻。2）身份解耦：學(xué)習(xí)多概念嵌入解耦，保證每個(gè)主體以獨(dú)立的方式輸入到擴(kuò)散模型中，保證了多主體視頻質(zhì)量。3）數(shù)據(jù)收集：建立了數(shù)據(jù)管道，可以系統(tǒng)收集不同概念的視頻數(shù)據(jù)，為解耦提供4）基準(zhǔn)測(cè)試：在概念保真、身份解耦和視頻生成質(zhì)量三個(gè)維度對(duì)模型進(jìn)行有效性測(cè)試，為評(píng)估多概念視頻定制模型性能提供參考。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明29/67 4月15日，快手推出發(fā)布可圖2.0（圖像生成模型）和可靈2.0（視頻生成模型）?？伸`2.0在語義響應(yīng)、動(dòng)態(tài)質(zhì)量、畫面美學(xué)三個(gè)維度進(jìn)行升級(jí)。首先在語義響應(yīng)上，可靈2.0版本具有更強(qiáng)的動(dòng)作響應(yīng)、運(yùn)鏡響應(yīng)和時(shí)序響應(yīng)；在動(dòng)態(tài)質(zhì)量上，可以實(shí)現(xiàn)復(fù)雜動(dòng)作的質(zhì)量提升，運(yùn)動(dòng)幅度與速度更合理；在電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面也有顯著可靈2.0的技術(shù)亮點(diǎn)：1.全新設(shè)計(jì)的視頻生成基礎(chǔ)模型，打開建模和仿真能力空間；2.全面升級(jí)訓(xùn)推策略，解鎖更強(qiáng)的指令響應(yīng)和運(yùn)動(dòng)表現(xiàn)?？蓤D2.0在指令遵循能力、電影美學(xué)和藝術(shù)風(fēng)格的多樣性進(jìn)行全方位升級(jí)，內(nèi)置超過60種內(nèi)容風(fēng)格。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明30/67 400%350%300%250%200%150%100%50%0%勝負(fù)比=（Good+Same)/(Same+Bad)367%205%可靈2.0VSVeo2可靈2.0VSSora183%182%181%180%179%178%177%176%勝負(fù)比=（Good+Same)/(Same+Bad)182%178%可靈2.0VSVeo2可靈2.0VSGen-4由于影像信息很難用文字完全描述，因此需要定義新語言，引用多模態(tài)信息描述——MVL?？梢岳斫鉃橛脩艨梢酝ㄟ^文字+圖片等多個(gè)模態(tài)進(jìn)行輸入。基于MVL可靈推出多模態(tài)編輯功能，支持在現(xiàn)有的視頻基礎(chǔ)上，通過圖片或文字的輸入，實(shí)現(xiàn)生成視頻內(nèi)容元素的增刪、替換，實(shí)現(xiàn)更加靈活的二次編輯和處理功能。5月29日，快手推出可靈2.1系列模型，包含標(biāo)準(zhǔn)（720p）、高品質(zhì)（1080p）兩種模式，在性價(jià)比和高效賽道同步布局。高端版本可靈2.1大師版升級(jí)后提供更強(qiáng)的語義響應(yīng)。該次更新主要在性價(jià)比方面進(jìn)行了較大的提升。在標(biāo)準(zhǔn)模式（720p）下，生成5秒視頻需要消耗20“靈感值”，高品質(zhì)模式（1080p）下需要消耗35“靈感值”。成本上與可靈1.6系列版本相持平。生成效率上，高品質(zhì)模式（1080p）在1分鐘內(nèi)就可生成5秒鐘的視頻，同檔次其他模型基本耗時(shí)2-3分鐘。在生成質(zhì)量上，可靈2.1全面提升。主要在模型動(dòng)態(tài)細(xì)節(jié)、動(dòng)態(tài)響應(yīng)、動(dòng)態(tài)幅度等方面進(jìn)行優(yōu)化。另外，物理模擬和人物動(dòng)作幅度等更真實(shí)，更符合物理規(guī)律。提示來生成目標(biāo)風(fēng)格作品。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明31/67圖表55即夢(mèng)AI模型迭代及核心功能突破情況發(fā)布日期模型名稱核心功能突破AI文生圖、視頻生成等技術(shù)實(shí)現(xiàn)商業(yè)化運(yùn)作，長(zhǎng)視頻和高動(dòng)態(tài)方向圖表56即夢(mèng)AI核心技術(shù)核心技術(shù)技術(shù)介紹具體案例深入學(xué)習(xí)和理解各種視覺元素、場(chǎng)景以及語言描述字描述，準(zhǔn)確構(gòu)建出相應(yīng)的視頻場(chǎng)景包括物體、動(dòng)入的提示詞轉(zhuǎn)化為對(duì)應(yīng)圖像元素，根據(jù)學(xué)習(xí)到的藝如湖泊的形態(tài)、森林的顏色和紋理等，并將這品，判別器不斷提高自己的鑒別能力，兩者相互促實(shí)現(xiàn)創(chuàng)意的靈活拓展：在學(xué)習(xí)到的數(shù)據(jù)分布基礎(chǔ)上對(duì)用戶輸入進(jìn)行靈活的拓展和變化，當(dāng)用戶輸入的提示詞比較模糊或者具有多種可能的解讀時(shí)，VAE敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明32/67 模型領(lǐng)先的應(yīng)用場(chǎng)景主要包括文本生成圖片視頻、文對(duì)齊，模型可以更準(zhǔn)確地學(xué)習(xí)序列之間的關(guān)系，從而提高模型的泛化能力和性能。因此在進(jìn)行文本輸入時(shí)，大模型會(huì)根據(jù)輸入文本內(nèi)容的元素進(jìn)行匹配，不同模型生圖表57即夢(mèng)3.0對(duì)齊比較（AlignmentComparison）敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明33/67 圖表58即夢(mèng)3.0結(jié)構(gòu)比較（StructureComparison）圖表59即夢(mèng)3.0美學(xué)比較（AestheticComparison）圖表60即夢(mèng)3.0設(shè)計(jì)比較（DesignComparison）提示：上方提示：貼紙1一只猴子咧嘴笑著配有文字“Happy”；貼紙2猴子戴著太陽鏡配有文字“Cool”；貼紙3猴子害羞地拿著一朵花配有文字“Shy”；猴子看起來很驚訝配有文字“Surprise”下方提示：Q版角色，女孩，全身像，街舞，三視圖敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明34/67 以下文本渲染效果圖輸入指令為：一幅引人入勝且定位為時(shí)尚、插畫、排版、三維渲染、繪畫。展示七個(gè)色彩繽紛的醒目文字：些充滿生氣的杯子里冒出奇異的毛氈煙霧，它們優(yōu)雅地漂浮在夢(mèng)幻迷人的氛圍中，各式各樣漂浮著的花朵為場(chǎng)景增添了深度和層次感，而柔和的淡藍(lán)色背景則與整體設(shè)計(jì)和諧相襯。圖表61即夢(mèng)3.0文本渲染比較（TextRendering）3）超現(xiàn)實(shí)主義肖像應(yīng)用場(chǎng)景及效果圖對(duì)比圖表62即夢(mèng)3.0超現(xiàn)實(shí)主義肖像比較（PhotorealisticPortrait）效果圖顯示，生成的人像質(zhì)量向?qū)I(yè)攝影標(biāo)準(zhǔn)邁進(jìn)方面取得了令人期待的進(jìn)展，也敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明35/67圖表63即夢(mèng)3.0超現(xiàn)實(shí)主義肖像效果圖“連續(xù)包月”和“連續(xù)包年”兩個(gè)計(jì)劃，分別在單月購買價(jià)格的基礎(chǔ)上享有12%的折扣。分。非會(huì)員用戶每天可以領(lǐng)取60積分，即夢(mèng)AI在生成圖片和視頻時(shí)會(huì)消耗定量積圖表64即夢(mèng)AI用戶月度訂閱價(jià)格及積分情況付費(fèi)計(jì)劃訂閱價(jià)格及積分說明敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明36/67并顯著提高了對(duì)提示的理解；2025年4月MidjourneyV7模型在細(xì)節(jié)處理、交互效圖表65Midjourney模型版本迭代、優(yōu)化情況及效果圖比較發(fā)布日期模型名稱優(yōu)化情況效果圖擁有新代碼庫和人工智能架構(gòu)，并且是第一個(gè)在“MidjourneyAI好，對(duì)“—stylize”參數(shù)的全范圍響更精準(zhǔn)遵循提示詞且支持更長(zhǎng)的提示詞；連貫性和模型知識(shí)提敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明37/67Midjourney使用的核心技術(shù)與之前介紹的AI大模型類似，為生成對(duì)抗網(wǎng)絡(luò)判別器評(píng)估生成器的性能，兩個(gè)網(wǎng)絡(luò)通過反復(fù)對(duì)抗的方式進(jìn)行訓(xùn)練，最終生成一副的循環(huán)或卷積結(jié)構(gòu)，而是使用注意力機(jī)制來處理輸入序列中的依賴關(guān)系，核心組件捕捉不同層次和角度的語義關(guān)系，前饋神經(jīng)網(wǎng)絡(luò)則負(fù)責(zé)對(duì)每個(gè)位置的表示進(jìn)行非線質(zhì)量與細(xì)節(jié)飛躍、場(chǎng)景理解與空間構(gòu)建、精準(zhǔn)視角與風(fēng)格呈現(xiàn)、模型個(gè)性化圖表66MidjourneyV7模型核心技術(shù)亮點(diǎn)核心技術(shù)亮點(diǎn)亮點(diǎn)介紹模型個(gè)性化（Personalization）敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明38/67 圖表67Midjourney應(yīng)用場(chǎng)景：繪畫創(chuàng)作圖表68Midjourney應(yīng)用場(chǎng)景：家居設(shè)計(jì)和裝修圖表69Midjourney應(yīng)用場(chǎng)景：電商海報(bào)宣傳敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明39/67 圖表70Midjourney應(yīng)用場(chǎng)景：Logo和徽章設(shè)計(jì)圖表71Midjourney應(yīng)用場(chǎng)景：插畫、漫畫和油畫月都可以創(chuàng)建任意數(shù)量的圖像且無需使用快速時(shí)間，但生成時(shí)間更長(zhǎng)且需要進(jìn)行排隊(duì)等待，通常需要0-10分鐘的等待時(shí)間；隱身模式（StealthMode）可以管理在敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明40/67圖表72Midjourney產(chǎn)品訂閱價(jià)格及說明付費(fèi)計(jì)劃訂閱價(jià)格說明jobs；4jobs。40jobs。40jobs。Model）和擴(kuò)散模型（DM/DiffusionModel，DM是基圖表73StableDiffusion版本迭代與變體情況及性能介紹發(fā)布日期及主體模型名稱使用512x512分辨率的515000敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明41/67生成效果和訓(xùn)練效率，同時(shí)可以與SDXL模型結(jié)合使用實(shí)現(xiàn)3D模型擴(kuò)展。注：1）訓(xùn)練步數(shù)的底層邏輯：讓模型通過大量的數(shù)據(jù)學(xué)習(xí)來調(diào)整自型時(shí)，輸入圖像或生成圖像的尺寸設(shè)定為寬高均為512像素，生成相對(duì)清晰且具備一定細(xì)節(jié)的圖像；3）laion-aestheticsv25+數(shù)據(jù)集：用于訓(xùn)練模型的大規(guī)模圖像數(shù)據(jù)集；4）finetune版本：表示模型“微調(diào)”版本，是指在深度學(xué)習(xí)中對(duì)預(yù)訓(xùn)練模型進(jìn)一步調(diào)整以適應(yīng)新任務(wù)的過程；5）ADD（AdversarialDiffusion電商運(yùn)營(yíng)、設(shè)計(jì)師/插畫師、游戲開發(fā)者、AI研究者等不同圖表74StableDiffusion核心功能及技術(shù)實(shí)現(xiàn)核心功能技術(shù)實(shí)現(xiàn)通過潛在空間壓縮（LatentSpaceCompression將圖像編碼敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明42/67圖表75StableDiffusion用戶類型及核心需求用戶類型核心需求場(chǎng)景技術(shù)門檻圖表76StableDiffusion工作流程及U-Net網(wǎng)絡(luò)+Schedule算法迭代去噪過程敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明43/67一些新的特征信息，并對(duì)U-Net進(jìn)行調(diào)整輸出；ControlNe圖表77StableDiffusion包含模型及核心技術(shù)模型名稱核心技術(shù)圖表78StableDiffusion應(yīng)用場(chǎng)景：電商運(yùn)營(yíng)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明44/67 圖表79StableDiffusion應(yīng)用場(chǎng)景：設(shè)計(jì)師/插畫師圖表80StableDiffusion應(yīng)用場(chǎng)景：游戲開發(fā)提示：設(shè)計(jì)一款中國(guó)古風(fēng)游戲場(chǎng)景，以大唐為背景圖表81StableDiffusion應(yīng)用場(chǎng)景：AI研究敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明45/67C端客戶采用積分訂閱制：每月支付訂閱費(fèi)并獲得相應(yīng)積分（credits使用圖表82StableDiffusionB端及C端產(chǎn)品訂閱價(jià)格及說明客戶付費(fèi)計(jì)劃訂閱價(jià)格說明/年API；視頻生成API；所有LLMAPI敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明46/67圖表83豆包大模型更新迭代情況關(guān)鍵更新說明理、細(xì)膩的視覺描述能力；在教育、旅游、電理解能力豆包1.5·深度思考大語言模型總參數(shù)為200B，成本、效率和延遲均豆包1.5·視覺深度思考模型、升級(jí)豆能力，學(xué)習(xí)數(shù)萬億多模態(tài)標(biāo)記數(shù)據(jù)，使視覺推理能力大幅端等不同環(huán)境中完成復(fù)雜交互任務(wù)；豆包·音樂模型升級(jí)，不僅支持能體生態(tài)的搭建：豆包官方打磨智能體外，同時(shí)引入并運(yùn)營(yíng)第三方智能體，官方持敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明47/67圖表84豆包產(chǎn)品功能更新情況關(guān)鍵功能說明強(qiáng)化智能體的露出；開始對(duì)智能體做進(jìn)一虛擬聊天智能體增加聊天背景封面；與扣體開發(fā)平臺(tái)“扣子”上線，和豆包打通，支持智能體開始灰度支持定制個(gè)人的音色功解不同數(shù)據(jù)類型背后的語義、邏輯與模式。在訓(xùn)練過程中，運(yùn)用大規(guī)模分布式訓(xùn)練義表達(dá)和知識(shí)體系；在圖像模型訓(xùn)練中，通過對(duì)海量圖像數(shù)據(jù)的特征提取與學(xué)習(xí)，使得模型能夠理解圖像內(nèi)容并根據(jù)文本描述生成對(duì)應(yīng)圖像。同時(shí)，模型運(yùn)用多種優(yōu)化算法，如自適應(yīng)學(xué)習(xí)率調(diào)整等，以提升模型敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明48/67圖表85豆包大模型家族九款模型圖表86豆包九款模型主要功能及應(yīng)用場(chǎng)景簡(jiǎn)介模型名稱主要功能及應(yīng)用場(chǎng)景專注于處理復(fù)雜文本分析、問答、文本生成等任務(wù)：在搜索引擎優(yōu)化理解客戶咨詢問題，提供詳細(xì)準(zhǔn)確的解答，極手應(yīng)用中，能夠快速響應(yīng)用戶指令，提供簡(jiǎn)潔有效的服務(wù)，且不會(huì)過玩家的游戲體驗(yàn)更加真實(shí)有趣；在在線教育互動(dòng)課程里，能模擬教師或?qū)W習(xí)伙伴，與學(xué)生進(jìn)行互動(dòng)交支持多語言及方言識(shí)別，廣泛適用于會(huì)議記錄、語音助手、智能家居控制等場(chǎng)景：在跨國(guó)公司的會(huì)議用于個(gè)性化語音導(dǎo)航、智能音箱語音設(shè)置等，也可為提供靈感；電商商家能根據(jù)商品特點(diǎn)描述生成精美的商品展示圖片，提升商品吸引力與銷程序調(diào)用和自動(dòng)化任務(wù)設(shè)計(jì)，可實(shí)現(xiàn)不同軟件系統(tǒng)之間的高效協(xié)同與自動(dòng)化流程執(zhí)行：在企業(yè)業(yè)務(wù)流型，按輸入及輸出每百萬token收費(fèi)，批量推理針對(duì)douba敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明49/67 圖表87豆包視覺理解模型收費(fèi)價(jià)格圖表88視覺理解token用量說明資料來源：火山引擎官網(wǎng)，華安證券研究所資料來源：火山引擎官網(wǎng)，華安證券研究所圖表89豆包視頻生成模型收費(fèi)價(jià)格圖表90豆包圖片生成模型收費(fèi)價(jià)格資料來源：火山引擎官網(wǎng)，華安證券研究所資料來源：火山引擎官網(wǎng)，華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明50/67平臺(tái)，借助AI技術(shù)賦予用戶創(chuàng)作、分享及生成獨(dú)特藝術(shù)管理系，將SD各種復(fù)雜功能封裝起來形成一個(gè)易用的網(wǎng)站用戶可以通過可視化界面精確控制生產(chǎn)過程的每一步，實(shí)現(xiàn)更復(fù)雜、個(gè)性化的創(chuàng)作圖表91SeaArtAI核心技術(shù)優(yōu)勢(shì)海量豐富模型庫以及豐富的AI創(chuàng)作能夠大幅提升出圖質(zhì)量，讓細(xì)節(jié)更豐富，色彩層次更合理，立體感更強(qiáng)，文本理解能力對(duì)于進(jìn)階用戶，SeaArt提供了基于節(jié)點(diǎn)的AI工AI積極與亞馬遜云科技、阿里云、華為方舟實(shí)驗(yàn)室進(jìn)行技術(shù)合作。為實(shí)現(xiàn)海外市場(chǎng)快速構(gòu)建可以服務(wù)于全球海外用戶的SeaArtAI藝術(shù)創(chuàng)作平有利于提升SeaArtAI出圖效率和推理耗時(shí)等性能；與華為文生圖模型，例如PixArtSigma等，形敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明51/67圖表92SeaArtAI與亞馬遜云科技、阿里云、華為云技術(shù)合作情況化，可將超過30種語言的輸入提示詞翻譯為英語，降低生成式AI繪圖無需用戶具備較高參數(shù)調(diào)整能力，輸入自然語言文本，平臺(tái)自動(dòng)化分析關(guān)鍵風(fēng)分布式緩存及OSS資料來源：亞馬遜云科技官網(wǎng)，阿里云官網(wǎng)，華為云官圖表93海藝互娛基于亞馬遜云科技服務(wù)于海外用戶的技術(shù)架構(gòu)示意圖低上手門檻，利于客戶群體推廣。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明52/67圖表94SeaArtAI落地頁功能界面：免費(fèi)AI藝術(shù)生成器與創(chuàng)意社區(qū)、廣場(chǎng)是一個(gè)基于節(jié)點(diǎn)式工作流的StableDiffusionUI，由GitHub上的匿名開發(fā)者且支持隨時(shí)調(diào)整；2）復(fù)用性強(qiáng)：其他用戶可以直接復(fù)工作流、模塊化設(shè)計(jì)、實(shí)時(shí)可視化、易于擴(kuò)展、支持圖表95ComfyUI核心功能介紹核心功能核心功能介紹節(jié)點(diǎn)化工作流模塊化設(shè)計(jì)實(shí)時(shí)可視化易于擴(kuò)展支持多種模型和算法敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明53/67圖表96SeaArtAI游戲內(nèi)容生成效果圖：像素游戲場(chǎng)景生成器、貓狗斗爭(zhēng)游戲場(chǎng)景算力無期限，可用于AI圖像生成、AI視頻生成、圖表97SeaArtAI產(chǎn)品訂閱價(jià)格及說明付費(fèi)計(jì)劃訂閱價(jià)格說明免費(fèi)版初級(jí)版標(biāo)準(zhǔn)版專業(yè)版）；大師版敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明54/67投資方，募集資金達(dá)數(shù)億元人民幣，將重點(diǎn)投入創(chuàng)作者生態(tài)建設(shè)與技術(shù)研發(fā)，加速圖表98LiblibAI2023年至今融資情況日期輪次融資金額投資方輪A輪A+輪戶可訓(xùn)練專屬模型，參與社區(qū)交流并探索AI繪畫，20圖表99LiblibAI核心功能介紹核心功能核心功能介紹在線StableDiffusionWebUI圖片生成文生圖：用戶輸入文字描述，AI根據(jù)描述生成圖像；圖生圖：用戶上傳圖片，AI在此基礎(chǔ)上生成新圖像，保持原有圖片風(fēng)格或元素；圖像后期處理：提供對(duì)生成圖像的編輯和優(yōu)化功能，如調(diào)整風(fēng)格、尺寸、分辨率等。豐富作品靈感和模型社區(qū)匯集10萬+AI模型和創(chuàng)作作品，涵蓋多種風(fēng)格和領(lǐng)域，。個(gè)人專屬自定義LoRA模型訓(xùn)練可上傳圖片來訓(xùn)練專屬LoRA模型，提供多種預(yù)設(shè)模式，滿足個(gè)性化需敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明55/67社區(qū)互動(dòng)與分享在平臺(tái)社區(qū)上分享自己的作品和模型，與其他創(chuàng)作者交流心得。版權(quán)和售賣生態(tài)鏈構(gòu)建版權(quán)保護(hù)和作品售賣的完整生態(tài)鏈，支持創(chuàng)作者權(quán)益。較，在風(fēng)格多樣性、Prompt理解能力、美學(xué)質(zhì)量等基礎(chǔ)能力方面表現(xiàn)優(yōu)異修復(fù)與重繪、高適應(yīng)性與靈活性、細(xì)節(jié)表現(xiàn)力、內(nèi)容多樣性及多場(chǎng)景應(yīng)用支持等方面具備顯著優(yōu)勢(shì)；推薦應(yīng)用場(chǎng)景包括電商與產(chǎn)品展示、廣告與市場(chǎng)推廣、插畫與藝術(shù)創(chuàng)作、室內(nèi)設(shè)計(jì)與建筑可視化、社交媒體內(nèi)容創(chuàng)作示，珠寶的高分辨率照片，光影”。圖表100Star-3Alpha大模型與MidjourneyV6.1、Dalle-3、Flux.1Dev評(píng)測(cè)比較圖表101Star-3Alpha大模型功能特性功能特性功能特性介紹高精度圖像生成精準(zhǔn)響應(yīng)復(fù)雜提示詞藝術(shù)風(fēng)格與色彩控制高效生成與制作智能自動(dòng)修復(fù)與重繪高適應(yīng)性與靈活性敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明56/67增強(qiáng)的細(xì)節(jié)表現(xiàn)能力增強(qiáng)的內(nèi)容多樣性多場(chǎng)景應(yīng)用支持圖表102Star-3Alpha應(yīng)用場(chǎng)景：電商與產(chǎn)品展示資料來源：Star-3Alpha官網(wǎng)，華安證券研究所圖表103Star-3Alpha應(yīng)用場(chǎng)景：廣告與市場(chǎng)推廣資料來源：Star-3Alpha官網(wǎng)，華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明57/67 圖表104Star-3Alpha應(yīng)用場(chǎng)景：插畫與藝術(shù)創(chuàng)作資料來源：Star-3Alpha官網(wǎng)，華安證券研究所圖表105Star-3Alpha應(yīng)用場(chǎng)景：室內(nèi)設(shè)計(jì)與建筑可視化提示：現(xiàn)代簡(jiǎn)約家裝效果圖，木地板元素提示：鴿子圍繞著北京的天壇飛翔資料來源：Star-3Alpha官網(wǎng)，華安證券研究所圖表106Star-3Alpha應(yīng)用場(chǎng)景：社交媒體內(nèi)容創(chuàng)作資料來源：Star-3Alpha官網(wǎng)，華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明58/67 能任務(wù)分解設(shè)計(jì)流程，能夠?qū)⒂脩舻母邔釉O(shè)計(jì)需求自動(dòng)拆解為結(jié)構(gòu)化的任務(wù)序更加具備專業(yè)設(shè)計(jì)師的思考和工作能力，如下圖所示，L3）應(yīng)用層面：Lovart應(yīng)用場(chǎng)景包括品牌全方設(shè)計(jì)風(fēng)格，最終生成時(shí)尚感、古怪感且風(fēng)格物狗品種、毛發(fā)、體型為基準(zhǔn)，生成一幅具備涂鴉風(fēng)格的寵物零食廣告。圖表107Lovart一站式調(diào)用GPTimage-1等模型圖表108Lovart智能任務(wù)分解流程資料來源：Lovart官網(wǎng)，華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明59/67 圖表109Lovart設(shè)計(jì)Pupu品牌包并生成海報(bào)圖表110Lovart生成寵物零食廣告圖敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明60/67圖表111LiblibAIB端及C端產(chǎn)品訂閱價(jià)格及說明客戶付費(fèi)計(jì)劃訂閱價(jià)格說明會(huì)員基礎(chǔ)版VIP會(huì)員專業(yè)版VIP2）云端存儲(chǔ)空間80GB，訓(xùn)練加速特權(quán)20次/月，素，造型是AI機(jī)器人與牛的結(jié)合體，包含了“AI大?！钡脑⒁狻D表112RoboNeo網(wǎng)頁版首頁敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明61/67 用戶能夠輕松

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

AI 系列專題跟蹤：視頻及圖像生成模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

AI 系列專題跟蹤：視頻及圖像生成模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔