版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明證券研究報(bào)告?zhèn)髅絣生成式AI模型開源閉源并行發(fā)展,模型版本持續(xù)迭代l生成式AI模型開源閉源并行發(fā)展,模型版本持續(xù)迭代66%49%32%16%-1%-18%執(zhí)業(yè)證書號(hào):S0010521080002郵箱:jinrong@限,穩(wěn)定幣概念或持續(xù)發(fā)酵2025-念行情2025-06-22l生成式AI在影視行業(yè)內(nèi)全鏈路布局,多維度提升影成式AI在劇本生成,角色/場(chǎng)景建模,動(dòng)畫生成,后期配音,剪輯調(diào)色壓縮的情況,這也就對(duì)視頻生成的前后一致性有了更高的要求。l助力游戲內(nèi)容生成,游戲內(nèi)賦能交互場(chǎng)景l(fā)生成式AI未來趨勢(shì)“局部合理,整體荒謬”情況,穩(wěn)定性有待提高。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明2/67l投資建議快手可靈大模型從23年推出開始,先后經(jīng)歷了6個(gè)版本迭代至可靈端包括:分眾傳媒,藍(lán)色光標(biāo)、省廣集團(tuán)、l風(fēng)險(xiǎn)提示敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明3/67正文目錄1AI視頻及圖像生成模型未來展望 81.1AI視頻圖像模型技術(shù)發(fā)展趨勢(shì) 81.2AI視頻圖像模型未來應(yīng)用場(chǎng)景展望 2RUNWAY 152.1GEN系列模型迭代更新,內(nèi)容生成技術(shù)不斷精進(jìn) 152.2GEN系列模型應(yīng)用場(chǎng)景案例及核心技術(shù) 162.3RUNWAY產(chǎn)品價(jià)格模式 223可靈AI 233.1可靈AIB端C端同步發(fā)展 233.2可靈AI商業(yè)化模式及運(yùn)營(yíng)數(shù)據(jù) 273.3近期更新 294即夢(mèng)AI 304.1即夢(mèng)AI模型版本迭代、核心功能及技術(shù) 304.2即夢(mèng)AI模型應(yīng)用場(chǎng)景、生成效果及同行業(yè)產(chǎn)品對(duì)比 324.3即夢(mèng)AI產(chǎn)品價(jià)格模式 355MIDJOURNEY 365.1MIDJOURNEY版本迭代、優(yōu)化情況及效果圖比較 365.2MIDJOURNEY核心技術(shù)及應(yīng)用場(chǎng)景 375.3MIDJOURNEY產(chǎn)品價(jià)格模式 396STABLEDIFFUSION 406.1STABLEDIFFUSION版本迭代與變體及核心功能 406.2STABLEDIFFUSION核心技術(shù)及應(yīng)用場(chǎng)景 426.3STABLEDIFFUSION產(chǎn)品價(jià)格模式 457豆包 457.1豆包大模型關(guān)鍵更新迭代、主要功能變化 457.2豆包大模型核心技術(shù)及應(yīng)用場(chǎng)景 477.3豆包視覺理解模型、圖片及視頻生成模型產(chǎn)品價(jià)格模式 488海藝AI-SEAARTAI 508.1SEAARTAI版本迭代、核心技術(shù)及合作情況 508.2SEAARTAI用戶分層及應(yīng)用場(chǎng)景 518.3SEAARTAI產(chǎn)品價(jià)格模式 539LIBLIBAI 54敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明4/67 9.1LIBLIBAI概況、融資情況及核心功能 549.2LIBLIBAIX星流STAR-3ALPHA大模型功能及應(yīng)用場(chǎng)景 559.3全球第一款專業(yè)設(shè)計(jì)AIAGENT:LOVART 589.4LIBLIBAI產(chǎn)品價(jià)格模式 5910美圖AIAGENTROBONEO 6011投資建議 6211.1影視行業(yè)應(yīng)用 6211.2游戲行業(yè)應(yīng)用 6411.3相關(guān)公司 65風(fēng)險(xiǎn)提示: 66敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明5/67 圖表12024年11月至2025年4月AI視頻圖像模型發(fā)展圖 8圖表2近期3D生成模型及核心技術(shù)介紹 9圖表3CUBE3D生成3D模型效果圖 10圖表4UNI-3DAR生成3D模型效果圖 10圖表5KISS3DGEN生成3D模型效果圖 10圖表6TRIPOSG和TRIPOSF生成3D模型效果圖 圖表7《WHISPERSFROMTHESTAR》游戲 圖表8自然選擇《EVE》游戲場(chǎng)景 圖表9AI陪伴產(chǎn)品《EVE》主要功能 12圖表10上海電影X即夢(mèng)AI“未來影像計(jì)劃·AL動(dòng)畫創(chuàng)作周”-1 12圖表11上海電影X即夢(mèng)AI“未來影像計(jì)劃·AL動(dòng)畫創(chuàng)作周”-2 13圖表12天貓AI聯(lián)動(dòng)明星、企業(yè)共創(chuàng)年畫 13圖表13康師傅A(chǔ)I寫春聯(lián) 13圖表14可口可春節(jié)數(shù)字人新年祝福 14圖表15伊利《千年江南》短片 14圖表16二手玫瑰、京東家電《我要開花AIGC版》 14圖表17《我要開花AIGC版》工作流節(jié)選 14圖表18武漢警官職業(yè)學(xué)院新校區(qū)(AI輔助生成圖) 15圖表19鄂州花湖機(jī)場(chǎng)BIM設(shè)計(jì)圖 15圖表20LOVART設(shè)計(jì)一款包 15圖表21LOVART設(shè)計(jì)一款寵物食品品牌 15圖表22RUNWAYGEN系列模型迭代情況、主要特點(diǎn)及應(yīng)用場(chǎng)景 16圖表23GEN-1模型應(yīng)用示例:使用幾個(gè)包裝盒視頻,生成工廠視頻 17圖表24GEN-2模型應(yīng)用示例:文本生成視頻(TEXTTOVIDEO) 17圖表25GEN-2模型應(yīng)用示例:圖片生成視頻(IMAGETOVIDEO) 17圖表26GEN-2模型應(yīng)用示例:文本+圖片生成視頻(TEXT+IMAGETOVIDEO) 18圖表27GEN-2模型應(yīng)用示例:故事板(STORYBOARD) 18圖表28GEN-2模型應(yīng)用示例:渲染(RENDER) 18圖表29GEN-3ALPHA模型應(yīng)用示例:精細(xì)的時(shí)間控制 19圖表30GEN-3ALPHA模型應(yīng)用示例:逼真的人類角色 19圖表31GEN-3ALPHA模型應(yīng)用示例:藝術(shù)家創(chuàng)作 19圖表32GEN-3ALPHA模型應(yīng)用示例:行業(yè)定制 20圖表33GEN-4模型應(yīng)用示例:《THELONELYLITTLEFLAME》 20圖表34GEN-4模型應(yīng)用示例:《NEWYORKISAZOO》 20圖表35GEN-4模型應(yīng)用示例:《THEHERD》 21圖表36RUNWAYGEN-4自制短片故事內(nèi)容及技術(shù) 21圖表37GEN-4TURBO模型應(yīng)用示例: 21圖表38RUNWAYGEN系列模型核心技術(shù) 22圖表39RUNWAYC端用戶月度訂閱價(jià)格 22圖表40可靈AIWEB端界面 23圖表41可靈AIAPP端界面 23敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明6/67 圖表42可靈AI版本迭代情況 24圖表43可靈AI運(yùn)營(yíng)數(shù)據(jù) 25圖表44“2025年AI視頻生成企業(yè)TOP20”榜單 25圖表45VIT架構(gòu) 26圖表46256X256圖像下架構(gòu)評(píng)測(cè) 26圖表47可靈會(huì)員價(jià)格 27圖表48可靈視頻生成資源包 27圖表49可靈圖片生成資源包 27圖表50可靈AIWEB端全球訪問量 28圖表51可靈AIAPP端國(guó)內(nèi)下載量 28圖表52CONCEPTMASTER多主體生成示例 29圖表53文生視頻模型勝負(fù)比 30圖表54圖生視頻模型勝負(fù)比 30圖表55即夢(mèng)AI模型迭代及核心功能突破情況 31圖表56即夢(mèng)AI核心技術(shù) 31圖表57即夢(mèng)3.0對(duì)齊比較(ALIGNMENTCOMPARISON) 32圖表58即夢(mèng)3.0結(jié)構(gòu)比較(STRUCTURECOMPARISON) 33圖表59即夢(mèng)3.0美學(xué)比較(AESTHETICCOMPARISON) 33圖表60即夢(mèng)3.0設(shè)計(jì)比較(DESIGNCOMPARISON) 33圖表61即夢(mèng)3.0文本渲染比較(TEXTRENDERING) 34圖表62即夢(mèng)3.0超現(xiàn)實(shí)主義肖像比較(PHOTOREALISTICPORTRAIT) 34圖表63即夢(mèng)3.0超現(xiàn)實(shí)主義肖像效果圖 35圖表64即夢(mèng)AI用戶月度訂閱價(jià)格及積分情況 35圖表65MIDJOURNEY模型版本迭代、優(yōu)化情況及效果圖比較 36圖表66MIDJOURNEYV7模型核心技術(shù)亮點(diǎn) 37圖表67MIDJOURNEY應(yīng)用場(chǎng)景:繪畫創(chuàng)作 38圖表68MIDJOURNEY應(yīng)用場(chǎng)景:家居設(shè)計(jì)和裝修 38圖表69MIDJOURNEY應(yīng)用場(chǎng)景:電商海報(bào)宣傳 38圖表70MIDJOURNEY應(yīng)用場(chǎng)景:LOGO和徽章設(shè)計(jì) 39圖表71MIDJOURNEY應(yīng)用場(chǎng)景:插畫、漫畫和油畫 39圖表72MIDJOURNEY產(chǎn)品訂閱價(jià)格及說明 40圖表73STABLEDIFFUSION版本迭代與變體情況及性能介紹 40圖表74STABLEDIFFUSION核心功能及技術(shù)實(shí)現(xiàn) 41圖表75STABLEDIFFUSION用戶類型及核心需求 42圖表76STABLEDIFFUSION工作流程及U-NET網(wǎng)絡(luò)+SCHEDULE算法迭代去噪過程 42圖表77STABLEDIFFUSION包含模型及核心技術(shù) 43圖表78STABLEDIFFUSION應(yīng)用場(chǎng)景: 43圖表79STABLEDIFFUSION應(yīng)用場(chǎng)景:設(shè)計(jì)師/插畫師 44圖表80STABLEDIFFUSION應(yīng)用場(chǎng)景:游戲開發(fā) 44圖表81STABLEDIFFUSION應(yīng)用場(chǎng)景:AI研究 44圖表82STABLEDIFFUSIONB端及C端產(chǎn)品訂閱價(jià)格及說明 45圖表83豆包大模型更新迭代情況 46圖表84豆包產(chǎn)品功能更新情況 47圖表85豆包大模型家族九款模型 48敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明7/67 圖表86豆包九款模型主要功能及應(yīng)用場(chǎng)景簡(jiǎn)介 48圖表87豆包視覺理解模型收費(fèi)價(jià)格 49圖表88視覺理解TOKEN用量說明 49圖表89豆包視頻生成模型收費(fèi)價(jià)格 49圖表90豆包圖片生成模型收費(fèi)價(jià)格 49圖表91SEAARTAI核心技術(shù)優(yōu)勢(shì) 50圖表92SEAARTAI與亞馬遜云科技、阿里云、華為云技術(shù)合作情況 51圖表93海藝互娛基于亞馬遜云科技服務(wù)于海外用戶的技術(shù)架構(gòu)示意圖 51圖表94SEAARTAI落地頁功能界面:免費(fèi)AI藝術(shù)生成器與創(chuàng)意社區(qū)、廣場(chǎng) 52圖表95COMFYUI核心功能介紹 52圖表96SEAARTAI游戲內(nèi)容生成效果圖:像素游戲場(chǎng)景生成器、貓狗斗爭(zhēng)游戲場(chǎng)景 53圖表97SEAARTAI產(chǎn)品訂閱價(jià)格及說明 53圖表98LIBLIBAI2023年至今融資情況 54圖表99LIBLIBAI核心功能介紹 54圖表100STAR-3ALPHA大模型與MIDJOURNEYV6.1、DALLE-3、FLUX.1DEV評(píng)測(cè)比較 55圖表101STAR-3ALPHA大模型功能特性 55圖表102STAR-3ALPHA應(yīng)用場(chǎng)景:電商與產(chǎn)品展示 56圖表103STAR-3ALPHA應(yīng)用場(chǎng)景:廣告與市場(chǎng)推廣 56圖表104STAR-3ALPHA應(yīng)用場(chǎng)景:插畫與藝術(shù)創(chuàng)作 57圖表105STAR-3ALPHA應(yīng)用場(chǎng)景:室內(nèi)設(shè)計(jì)與建筑可視化 57圖表106STAR-3ALPHA應(yīng)用場(chǎng)景:社交媒體內(nèi)容創(chuàng)作 57圖表107LOVART一站式調(diào)用GPTIMAGE-1等模型 58圖表108LOVART智能任務(wù)分解流程 58圖表109LOVART設(shè)計(jì)PUPU品牌包并生成海報(bào) 59圖表110LOVART生成寵物零食廣告圖 59圖表111LIBLIBAIB端及C端產(chǎn)品訂閱價(jià)格及說明 60 60圖表113ROBONEO產(chǎn)品交互品牌設(shè)計(jì)——“設(shè)計(jì)一個(gè)科技感LOGO,主色為藍(lán)色,搭配簡(jiǎn)約線條”分析過程 61圖表114ROBONEO產(chǎn)品交互品牌設(shè)計(jì)——輸出成果圖 62圖表115SORA生成視頻出現(xiàn)椅子漂浮情況 63圖表116《海上女王鄭一嫂》劇照 63圖表117不同AI技術(shù)適用場(chǎng)景 64圖表118生成式AI在游戲開發(fā)過程中應(yīng)用架構(gòu)圖 65敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明8/67 款新版本視頻及圖像生成模型,包括OpenAIGPT-image-1、RunwayGen-4、義QVQ-72B-Preview模型參數(shù)規(guī)模迅速擴(kuò)大,計(jì)算能力及復(fù)雜場(chǎng)景處理性能不斷源模型降低中小開發(fā)者門檻,在游戲、短視頻等圖表12024年11月至2025年4月AI視頻圖像模型發(fā)展圖PixelDance,SeaweedS2.0Pro,P2.0Pro生數(shù)科技ViduAI2024.11CogVideo-Xv1.55B,I2VHunyuan-LargeAmazonNova系列(Micro,Lite,Pro,Canvas,Reel,Sonic)TeleAI-VASTSORASee3DCCDoubao-vision-pro-32kVideoOceanV2.0MiniMax-VL-01ViduAI2.0Ray22025.013D港科大3D生成模型:Kiss3DGenGen-4MidjourneyV7halSeaweed-7B,Seedream3.0,Doubao-1.5-thinking-pro-vision路快手可靈2.0,可圖2.0ViduQ1FireflyImageModel4,F(xiàn)ireflyImageModel4UltraGPT-image-12025.02阿里通義萬相2025.02阿里通義萬相:Wan2.1Apache2.協(xié)議騰訊混元:HunyuanVideoFastHunyuanCosmos阿里通義:QVQ-72B-Preview2025.03Google:GeminiFlash2.0Roblox:CubeNVIDIA:更新Cosmos系列Cosmos-Reason1-8B,Cosmos-Reason1-56B深勢(shì)科技、北京科學(xué)智能研究3DAR阿里通義:Qwen2.5-VL-32B-Instruct,Qwen2.5-Omni-7B,QVQ-Max清華大學(xué)、騰訊:Video-T1VAST3D生成模型:TripoSG、TripoSF2025.04SandAI(三呆科技):MAGI-1敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明9/67Uni-3DAR,未來可應(yīng)用于構(gòu)建通用科學(xué)智能體構(gòu)、統(tǒng)一生成和理解的自回歸框架,后期可以引入多模態(tài)信息并結(jié)合大語言模型與圖表2近期3D生成模型及核心技術(shù)介紹深勢(shì)科技、北京科學(xué)智能研究和理解任務(wù)能夠在單一模型內(nèi)同時(shí)進(jìn)行,使不同任務(wù)對(duì)應(yīng)token在模香港科技大學(xué)技),);訓(xùn)練策略:借鑒實(shí)時(shí)渲染中的視錐體剔除技術(shù),在訓(xùn)練時(shí)僅激活相機(jī)視角內(nèi)的體構(gòu)更加精細(xì),紋理色彩更加豐富,目前3D生成大模型已幅提高生成效率并降低人工建模成本,通過AI重構(gòu)3D創(chuàng)作流程用領(lǐng)域覆蓋消費(fèi)級(jí)市場(chǎng)和工業(yè)制造,在手辦潮玩、課程教育、定制化設(shè)計(jì)等細(xì)分領(lǐng)域應(yīng)用雛形初現(xiàn)。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明10/67 圖表3Cube3D生成3D模型效果圖圖表4Uni-3DAR生成3D模型效果圖圖表5Kiss3DGen生成3D模型效果圖敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明11/67 圖表6TripoSG和TripoSF生成3D模型效果圖發(fā)展,玩家任務(wù)是幫助主角Stella在外星星球生存并找到回家的路,在此過程中可以通過視頻、語音和文字多模態(tài)輸入與Stell面通過自研AI對(duì)話模型Vibe深度理解用圖表7《WhispersfromtheStar》游戲圖表8自然選擇《EVE》游戲場(chǎng)景資料來源:WhispersfromtheStar官網(wǎng),華安證券研究所資料來源:AIHub,華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明12/67圖表9AI陪伴產(chǎn)品《EVE》主要功能能夠深度理解用戶的輸入,提供如真人般的自然交流體驗(yàn),專為情感陪伴設(shè)計(jì),旨在滿足結(jié)合了實(shí)時(shí)內(nèi)容推薦系統(tǒng)和游戲級(jí)別的劇情設(shè)計(jì),提供豐富的交互體驗(yàn),用戶可以參與到精心設(shè)“AI+影視動(dòng)畫”合作成果初現(xiàn),AI技術(shù)賦能展廳三個(gè)維度逐步落地雙方的戰(zhàn)略合作。上海電影與即夢(mèng)AI將視動(dòng)畫”,推進(jìn)AI技術(shù)在影視內(nèi)容生成、IP運(yùn)營(yíng)、宣發(fā)模式等全鏈條的創(chuàng)新應(yīng)用。圖表10上海電影X即夢(mèng)AI“未來影像計(jì)劃·Al動(dòng)畫創(chuàng)作周”-1敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明13/67 圖表11上海電影X即夢(mèng)AI“未來影像計(jì)劃·Al動(dòng)畫創(chuàng)作周”-2多位明星與多個(gè)熱門IP,發(fā)起AI共創(chuàng)年畫活動(dòng),用戶通過AI互動(dòng)在明星或IP制作模式吸引大量粉絲參與,持續(xù)助力品牌營(yíng)銷;2)康師頻生成技術(shù)制作明星數(shù)字形象,配合獨(dú)特的主題視覺以及辨識(shí)度極高的音樂。圖表12天貓AI聯(lián)動(dòng)明星、企業(yè)共創(chuàng)年畫圖表13康師傅A(chǔ)I寫春聯(lián)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明14/67 圖表14可口可春節(jié)數(shù)字人新年祝福圖表圖表14可口可春節(jié)數(shù)字人新年祝福圖表16二手玫瑰、京東家電《我要開花AIGC版》圖表17《我要開花AIGC版》工作流節(jié)選資料來源:數(shù)英DIGITALING,華安證券研究所資料來源:數(shù)英DIGITALING,Agent)Lovart,創(chuàng)始人陳冕曾任字節(jié)跳動(dòng)剪映全球商業(yè)化負(fù)責(zé)人:聚焦品牌設(shè)計(jì),師通過“GiantAI”軟件(建筑創(chuàng)意具現(xiàn)軟件)勾畫,使得需要設(shè)計(jì)師數(shù)日渲染修改的助設(shè)計(jì)已應(yīng)用于武漢警官職業(yè)學(xué)院新校區(qū)、天門石家河遺址博物館、陜西省政務(wù)和拆解到專業(yè)交付的全鏈路設(shè)計(jì),給出具體英文提示即可設(shè)計(jì)出一款前衛(wèi)、時(shí)尚的包毛貴賓犬、充滿趣味的線描插畫、手繪涂鴉風(fēng)格并保留筆觸感。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明15/67 圖表19鄂州花湖機(jī)場(chǎng)BIM設(shè)計(jì)圖圖表圖表19鄂州花湖機(jī)場(chǎng)BIM設(shè)計(jì)圖資料來源:極目新聞,華安證券研究所資料來源:極目新聞,華安證券研究所圖表20Lovart設(shè)計(jì)一款包圖表21Lovart設(shè)計(jì)一款寵物食品品牌資料來源:Lovart官網(wǎng),華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明16/67圖表22RunwayGen系列模型迭代情況、主要特點(diǎn)及應(yīng)用場(chǎng)景發(fā)布時(shí)間模型名稱主要特點(diǎn)應(yīng)用場(chǎng)景應(yīng)用文本prompt或參考圖像指定的任何風(fēng)控和內(nèi)容感知引導(dǎo)的視頻擴(kuò)散模型,能夠?qū)σ咽褂脦讉€(gè)包裝盒視頻,根據(jù)視頻形狀從頭開始直接生成視頻的技術(shù)突破,在原有技派拉蒙和迪士尼等頂級(jí)電影制片公司,可用于改進(jìn)特效制作和多語言配音等方面,如為靜態(tài)圖像添加動(dòng)態(tài)元列信息的描述性字幕,使得其能夠精確控制視助導(dǎo)演和制片人預(yù)覽場(chǎng)景和故事情企業(yè)宣傳:企業(yè)可以制作高質(zhì)量宣傳視頻,展示產(chǎn)品特點(diǎn)、企業(yè)文化或服新的藝術(shù)表現(xiàn)形式,創(chuàng)作出獨(dú)特的視真、充滿動(dòng)態(tài)感的視頻內(nèi)容,為影視短片《TheLonelyLittleFlame》、游戲開發(fā):高度一致性和動(dòng)態(tài)運(yùn)動(dòng)捕捉能力,能夠快速生成高質(zhì)量的和視后將現(xiàn)有視頻轉(zhuǎn)化為新視頻。技術(shù)端Gen-1提出了可控的結(jié)構(gòu)和內(nèi)容感知的視頻擴(kuò)散模型,通過大規(guī)模無字幕視頻和配對(duì)文本-圖像數(shù)轉(zhuǎn)換為與用戶提供的圖像或文本提示相匹配的效果,同時(shí)靈活控制模型對(duì)視頻結(jié)構(gòu)的控制力度,通過自定義的指導(dǎo)方法來調(diào)整推理過程,以控制生成視頻與原視頻的敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明17/67 圖表23Gen-1模型應(yīng)用示例:使用幾個(gè)包裝盒視頻,生成工廠視頻圖表24Gen-2模型應(yīng)用示例:文本生成視頻(TexttoVideo)圖表25Gen-2模型應(yīng)用示例:圖片生成視頻(ImagetoVideo)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明18/67 圖表26Gen-2模型應(yīng)用示例:文本+圖片生成視頻(Text+ImagetoVideo)圖表27Gen-2模型應(yīng)用示例:故事板(Storyboard)輸入視頻:轉(zhuǎn)換為完全風(fēng)格化和動(dòng)畫化的渲染輸出視頻圖表28Gen-2模型應(yīng)用示例:渲染(Render)RunwayGen-3Alpha模型技術(shù)端在全新基礎(chǔ)設(shè)施上進(jìn)行大規(guī)模多模態(tài)訓(xùn)練,保真度、一致性和運(yùn)動(dòng)表現(xiàn)上有重大提升,同時(shí)推出多種高級(jí)控制工具并帶有保護(hù)措施,包敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明19/67 括內(nèi)部視覺審核系統(tǒng)和C2PA溯源標(biāo)準(zhǔn)。以下應(yīng)用場(chǎng)景包括精細(xì)的時(shí)間控制、逼真的人類角色、藝術(shù)家創(chuàng)作、行業(yè)定制等。通過高描述性、時(shí)間密集型的訓(xùn)練,可實(shí)現(xiàn)富有想象力的過渡和場(chǎng)景中元素的精確關(guān)鍵幀。圖表29Gen-3Alpha模型應(yīng)用示例:精細(xì)的時(shí)間控制生成具有各種動(dòng)作、手勢(shì)和情感的富有表現(xiàn)力的人類角色,解鎖新故事講述。圖表30Gen-3Alpha模型應(yīng)用示例:逼真的人類角色科學(xué)家、工程師和藝術(shù)家組成的跨學(xué)科團(tuán)隊(duì)的協(xié)作努力,解釋各種風(fēng)格和電影術(shù)語。圖表31Gen-3Alpha模型應(yīng)用示例:藝術(shù)家創(chuàng)作敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明20/67 領(lǐng)先的娛樂和媒體組織合作創(chuàng)建定制版本,對(duì)角色進(jìn)行更風(fēng)格控制和更一致的角色。圖表32Gen-3Alpha模型應(yīng)用示例:行業(yè)定制RunwayGen-4模型技術(shù)核心在于世界一致性(Wor生成式視覺特效(GVFX)技術(shù),能夠通過AI驅(qū)動(dòng)的生成能力,大幅縮短視覺特效制作中的建模、渲染和后期調(diào)整過程。以下應(yīng)用場(chǎng)景包括Runway使用Gen-4圖表33Gen-4模型應(yīng)用示例:《TheLonelyLittleFlame》圖表34Gen-4模型應(yīng)用示例:《NewYorkisaZoo》敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明21/67圖表35Gen-4模型應(yīng)用示例:《TheHerd》圖表36RunwayGen-4自制短片故事內(nèi)容及技術(shù)短片名稱主要故事內(nèi)容及技術(shù)了更高效的推理算法或增強(qiáng)的硬件加速支持,在延續(xù)了前代世界一致性(World速迭代和創(chuàng)意探索的場(chǎng)景,例如短視頻內(nèi)容創(chuàng)作、概念驗(yàn)證或?qū)崟r(shí)視覺效果預(yù)覽。圖表37Gen-4Turbo模型應(yīng)用示例:敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明22/67圖表38RunwayGen系列模型核心技術(shù)模型名稱核心技術(shù)Act-One技術(shù)是生成式角色表演工具,能夠?qū)⒁曨l和語音輸入轉(zhuǎn)換演員的表演,生成逼真的角色動(dòng)畫,保留眼神、微表格模式為積分訂閱制,根據(jù)不同付費(fèi)計(jì)劃類型,提供相對(duì)應(yīng)的訂閱價(jià)格,年度訂閱一定的積分,消耗積分?jǐn)?shù)量與生成視頻時(shí)長(zhǎng)、使用模型類型、視頻分辨率以及高級(jí)功能(如去除水印、使用特定的運(yùn)鏡方式或運(yùn)動(dòng)速度控制等)有關(guān)。圖表39RunwayC端用戶月度訂閱價(jià)格付費(fèi)計(jì)劃月度訂閱價(jià)格及積分說明將輸出升級(jí)到4k;敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明23/67可靈是快手自主研發(fā)的視頻生成大模型,主要為用戶提供高質(zhì)量的視頻內(nèi)容生成服務(wù)??伸`AI可以支持用戶通過多種形式進(jìn)行輸入生成,包括但不限于文字、圖片、動(dòng)作視頻等。目前可靈產(chǎn)品在移動(dòng)端、Web端和海外均上線,實(shí)現(xiàn)完善的產(chǎn)品矩陣。資料來源:可靈AIweb端,華安證券研究所在版本迭代更新上,可靈AI經(jīng)歷了初始版本,1.0版本,1.5版本,1.6版本和最新的2.0版本。可靈AI以自研的可靈和可圖大模型為基礎(chǔ),提供視頻和圖像的生成與編輯能力,并在版本迭代過程中不斷在視頻時(shí)長(zhǎng),視頻質(zhì)量,物理規(guī)律真實(shí)性上進(jìn)行優(yōu)化。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明24/67模型名稱推出時(shí)間簡(jiǎn)介及重點(diǎn)更新基于快手自研大模型可靈和可圖,提供視頻及圖像生成與編輯能以及語義理解等方面均有顯著提升。引入了全新的“運(yùn)動(dòng)筆刷能,為企業(yè)級(jí)用戶提供了更加強(qiáng)大的視頻及圖像生成與編理模擬、語義理解和美學(xué)表現(xiàn)上進(jìn)行升級(jí)。正式提出AI理念推出多模態(tài)編輯功能??蓤D2.0在生成質(zhì)量上,可靈2.1全面提升。主要在度等方面進(jìn)行優(yōu)化。另外,物理模擬和人物動(dòng)作幅度等更真實(shí),更符合可靈AI在B端與C端同步發(fā)展。C端方面,可靈AI為自媒體用戶和部分廣告主提供創(chuàng)作生產(chǎn)力,公司測(cè)算可靈AI可以為客戶的短視頻營(yíng)銷素材制作成本降低60-70%,這帶動(dòng)了C端用戶的付費(fèi)增長(zhǎng)。從用戶結(jié)構(gòu)上看,在可靈2.0發(fā)布會(huì)上,公司披露可靈AI全球用戶規(guī)模超2200萬。截止至2024年末,我國(guó)短視頻創(chuàng)作者賬號(hào)規(guī)模達(dá)16.2億,日短視頻數(shù)量超1.3億條,快手創(chuàng)作者數(shù)量達(dá)1900萬。藍(lán)色光標(biāo)等數(shù)千家客戶合作,滿足在線教育,電子商務(wù),智慧城市等領(lǐng)域的需求。可靈AI通過其API服務(wù)的靈活性和個(gè)性化適配客戶應(yīng)用場(chǎng)景,在行業(yè)內(nèi)領(lǐng)先??伸`的全球開發(fā)者數(shù)量超1.5萬,已累計(jì)生成1200萬圖像和4000萬個(gè)視頻素材。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明25/67 在DBC、CIW和CIS聯(lián)合發(fā)布的“2025年AI視頻生成企業(yè)TOP20”榜單中,可靈AI成為榜首??伸`AI基于快手自研的可靈大模型和可圖大模型,模型上采用了類Sora的DiT結(jié)構(gòu),并用Transformer取代傳統(tǒng)的卷積網(wǎng)絡(luò)結(jié)構(gòu),擴(kuò)散模型基座為flow模型。以上的架構(gòu)設(shè)計(jì)為可靈AI在視頻生成上處于領(lǐng)先地位打下技術(shù)基礎(chǔ)。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明26/67 DiT架構(gòu)集成了近年Diffusion生成模型的多種優(yōu)秀技術(shù),基于LatentDiffusionModel(LDM)框架,采用VisionTransformer(ViT)作為主干網(wǎng)絡(luò)。創(chuàng)新點(diǎn)在于用Transformer學(xué)習(xí)和預(yù)測(cè)noise以及方差,具體為使用Transformer架構(gòu)替換了傳統(tǒng)的Diffusion模型中的卷積U-Net主干網(wǎng)絡(luò)。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明27/67 目前可靈APP會(huì)員分為三類,分別為:黃金會(huì)員(66元包月,可生成66個(gè)標(biāo)準(zhǔn)視頻),鉑金會(huì)員(268元包月,可生成300個(gè)標(biāo)準(zhǔn)視頻),鉆石會(huì)員(666元包月,可生成800個(gè)標(biāo)準(zhǔn)視頻)。用戶也可以購買資源包用來訪問視頻和圖片生成相關(guān)API能力,包括文生視頻、圖生視頻、視頻延長(zhǎng)、對(duì)口型、視頻特效、文生圖和圖生圖。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明28/67 參考非凡產(chǎn)研數(shù)據(jù),2025年5月份,可靈AIWeb端全球訪問量達(dá)1626萬,MAU為460萬,4月份訪問量為1909萬。2025年5月,可靈AIAPP端下載量達(dá)79萬,4月份為108萬。全球訪問量(萬)mom50%40%30%200030%20%0%0%-10%-20%-30%-40%80608060402005000下載量(萬)環(huán)比變化2025.32025.42025.55%0%-5%-10%-15%-20%-25%-30%-35%-40%資料來源:非凡產(chǎn)研,華安證券研究所資料來源:非凡產(chǎn)研,華安證券研究所ConceptMaster是快手可靈發(fā)布的多主體視頻生成技術(shù)方案,用于多概念視頻定制的創(chuàng)新框架,可以在未測(cè)試調(diào)優(yōu)的情況下,在擴(kuò)散模型上生成高質(zhì)量個(gè)性化視頻。什么是多主體視頻生成?可以理解為在文生視頻模型基礎(chǔ)上支持輸入多個(gè)主體圖像,從而在生成視頻的過程中把多個(gè)主體組合在同一視頻中。圖生視頻有一定區(qū)別,圖生視頻是以輸入的圖像作為生成視頻的首幀然后進(jìn)行生成,一定程度上沒有多主體視頻生成靈活。除可靈外,Vidu和Pika等也上線多主體視頻生成功能。ConceptMaster的功能有哪些?1)多概念定制視頻:可以通過輸入多個(gè)圖像生成多個(gè)概念的定制視頻,例如根據(jù)一張“一個(gè)小男孩在路上騎自行車”的圖像生成視頻。2)身份解耦:學(xué)習(xí)多概念嵌入解耦,保證每個(gè)主體以獨(dú)立的方式輸入到擴(kuò)散模型中,保證了多主體視頻質(zhì)量。3)數(shù)據(jù)收集:建立了數(shù)據(jù)管道,可以系統(tǒng)收集不同概念的視頻數(shù)據(jù),為解耦提供4)基準(zhǔn)測(cè)試:在概念保真、身份解耦和視頻生成質(zhì)量三個(gè)維度對(duì)模型進(jìn)行有效性測(cè)試,為評(píng)估多概念視頻定制模型性能提供參考。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明29/67 4月15日,快手推出發(fā)布可圖2.0(圖像生成模型)和可靈2.0(視頻生成模型)??伸`2.0在語義響應(yīng)、動(dòng)態(tài)質(zhì)量、畫面美學(xué)三個(gè)維度進(jìn)行升級(jí)。首先在語義響應(yīng)上,可靈2.0版本具有更強(qiáng)的動(dòng)作響應(yīng)、運(yùn)鏡響應(yīng)和時(shí)序響應(yīng);在動(dòng)態(tài)質(zhì)量上,可以實(shí)現(xiàn)復(fù)雜動(dòng)作的質(zhì)量提升,運(yùn)動(dòng)幅度與速度更合理;在電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面也有顯著可靈2.0的技術(shù)亮點(diǎn):1.全新設(shè)計(jì)的視頻生成基礎(chǔ)模型,打開建模和仿真能力空間;2.全面升級(jí)訓(xùn)推策略,解鎖更強(qiáng)的指令響應(yīng)和運(yùn)動(dòng)表現(xiàn)??蓤D2.0在指令遵循能力、電影美學(xué)和藝術(shù)風(fēng)格的多樣性進(jìn)行全方位升級(jí),內(nèi)置超過60種內(nèi)容風(fēng)格。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明30/67 400%350%300%250%200%150%100%50%0%勝負(fù)比=(Good+Same)/(Same+Bad)367%205%可靈2.0VSVeo2可靈2.0VSSora183%182%181%180%179%178%177%176%勝負(fù)比=(Good+Same)/(Same+Bad)182%178%可靈2.0VSVeo2可靈2.0VSGen-4由于影像信息很難用文字完全描述,因此需要定義新語言,引用多模態(tài)信息描述——MVL??梢岳斫鉃橛脩艨梢酝ㄟ^文字+圖片等多個(gè)模態(tài)進(jìn)行輸入。基于MVL可靈推出多模態(tài)編輯功能,支持在現(xiàn)有的視頻基礎(chǔ)上,通過圖片或文字的輸入,實(shí)現(xiàn)生成視頻內(nèi)容元素的增刪、替換,實(shí)現(xiàn)更加靈活的二次編輯和處理功能。5月29日,快手推出可靈2.1系列模型,包含標(biāo)準(zhǔn)(720p)、高品質(zhì)(1080p)兩種模式,在性價(jià)比和高效賽道同步布局。高端版本可靈2.1大師版升級(jí)后提供更強(qiáng)的語義響應(yīng)。該次更新主要在性價(jià)比方面進(jìn)行了較大的提升。在標(biāo)準(zhǔn)模式(720p)下,生成5秒視頻需要消耗20“靈感值”,高品質(zhì)模式(1080p)下需要消耗35“靈感值”。成本上與可靈1.6系列版本相持平。生成效率上,高品質(zhì)模式(1080p)在1分鐘內(nèi)就可生成5秒鐘的視頻,同檔次其他模型基本耗時(shí)2-3分鐘。在生成質(zhì)量上,可靈2.1全面提升。主要在模型動(dòng)態(tài)細(xì)節(jié)、動(dòng)態(tài)響應(yīng)、動(dòng)態(tài)幅度等方面進(jìn)行優(yōu)化。另外,物理模擬和人物動(dòng)作幅度等更真實(shí),更符合物理規(guī)律。提示來生成目標(biāo)風(fēng)格作品。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明31/67圖表55即夢(mèng)AI模型迭代及核心功能突破情況發(fā)布日期模型名稱核心功能突破AI文生圖、視頻生成等技術(shù)實(shí)現(xiàn)商業(yè)化運(yùn)作,長(zhǎng)視頻和高動(dòng)態(tài)方向圖表56即夢(mèng)AI核心技術(shù)核心技術(shù)技術(shù)介紹具體案例深入學(xué)習(xí)和理解各種視覺元素、場(chǎng)景以及語言描述字描述,準(zhǔn)確構(gòu)建出相應(yīng)的視頻場(chǎng)景包括物體、動(dòng)入的提示詞轉(zhuǎn)化為對(duì)應(yīng)圖像元素,根據(jù)學(xué)習(xí)到的藝如湖泊的形態(tài)、森林的顏色和紋理等,并將這品,判別器不斷提高自己的鑒別能力,兩者相互促實(shí)現(xiàn)創(chuàng)意的靈活拓展:在學(xué)習(xí)到的數(shù)據(jù)分布基礎(chǔ)上對(duì)用戶輸入進(jìn)行靈活的拓展和變化,當(dāng)用戶輸入的提示詞比較模糊或者具有多種可能的解讀時(shí),VAE敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明32/67 模型領(lǐng)先的應(yīng)用場(chǎng)景主要包括文本生成圖片視頻、文對(duì)齊,模型可以更準(zhǔn)確地學(xué)習(xí)序列之間的關(guān)系,從而提高模型的泛化能力和性能。因此在進(jìn)行文本輸入時(shí),大模型會(huì)根據(jù)輸入文本內(nèi)容的元素進(jìn)行匹配,不同模型生圖表57即夢(mèng)3.0對(duì)齊比較(AlignmentComparison)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明33/67 圖表58即夢(mèng)3.0結(jié)構(gòu)比較(StructureComparison)圖表59即夢(mèng)3.0美學(xué)比較(AestheticComparison)圖表60即夢(mèng)3.0設(shè)計(jì)比較(DesignComparison)提示:上方提示:貼紙1一只猴子咧嘴笑著配有文字“Happy”;貼紙2猴子戴著太陽鏡配有文字“Cool”;貼紙3猴子害羞地拿 著一朵花配有文字“Shy”;猴子看起來很驚訝配有文字“Surprise”下方提示:Q版角色,女孩,全身像,街舞,三視圖敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明34/67 以下文本渲染效果圖輸入指令為:一幅引人入勝且定位為時(shí)尚、插畫、排版、三維渲染、繪畫。展示七個(gè)色彩繽紛的醒目文字:些充滿生氣的杯子里冒出奇異的毛氈煙霧,它們優(yōu)雅地漂浮在夢(mèng)幻迷人的氛圍中,各式各樣漂浮著的花朵為場(chǎng)景增添了深度和層次感,而柔和的淡藍(lán)色背景則與整體設(shè)計(jì)和諧相襯。圖表61即夢(mèng)3.0文本渲染比較(TextRendering)3)超現(xiàn)實(shí)主義肖像應(yīng)用場(chǎng)景及效果圖對(duì)比圖表62即夢(mèng)3.0超現(xiàn)實(shí)主義肖像比較(PhotorealisticPortrait)效果圖顯示,生成的人像質(zhì)量向?qū)I(yè)攝影標(biāo)準(zhǔn)邁進(jìn)方面取得了令人期待的進(jìn)展,也敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明35/67圖表63即夢(mèng)3.0超現(xiàn)實(shí)主義肖像效果圖“連續(xù)包月”和“連續(xù)包年”兩個(gè)計(jì)劃,分別在單月購買價(jià)格的基礎(chǔ)上享有12%的折扣。分。非會(huì)員用戶每天可以領(lǐng)取60積分,即夢(mèng)AI在生成圖片和視頻時(shí)會(huì)消耗定量積圖表64即夢(mèng)AI用戶月度訂閱價(jià)格及積分情況付費(fèi)計(jì)劃訂閱價(jià)格及積分說明敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明36/67并顯著提高了對(duì)提示的理解;2025年4月MidjourneyV7模型在細(xì)節(jié)處理、交互效圖表65Midjourney模型版本迭代、優(yōu)化情況及效果圖比較發(fā)布日期模型名稱優(yōu)化情況效果圖擁有新代碼庫和人工智能架構(gòu),并且是第一個(gè)在“MidjourneyAI好,對(duì)“—stylize”參數(shù)的全范圍響更精準(zhǔn)遵循提示詞且支持更長(zhǎng)的提示詞;連貫性和模型知識(shí)提敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明37/67Midjourney使用的核心技術(shù)與之前介紹的AI大模型類似,為生成對(duì)抗網(wǎng)絡(luò)判別器評(píng)估生成器的性能,兩個(gè)網(wǎng)絡(luò)通過反復(fù)對(duì)抗的方式進(jìn)行訓(xùn)練,最終生成一副的循環(huán)或卷積結(jié)構(gòu),而是使用注意力機(jī)制來處理輸入序列中的依賴關(guān)系,核心組件捕捉不同層次和角度的語義關(guān)系,前饋神經(jīng)網(wǎng)絡(luò)則負(fù)責(zé)對(duì)每個(gè)位置的表示進(jìn)行非線質(zhì)量與細(xì)節(jié)飛躍、場(chǎng)景理解與空間構(gòu)建、精準(zhǔn)視角與風(fēng)格呈現(xiàn)、模型個(gè)性化圖表66MidjourneyV7模型核心技術(shù)亮點(diǎn)核心技術(shù)亮點(diǎn)亮點(diǎn)介紹模型個(gè)性化(Personalization)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明38/67 圖表67Midjourney應(yīng)用場(chǎng)景:繪畫創(chuàng)作圖表68Midjourney應(yīng)用場(chǎng)景:家居設(shè)計(jì)和裝修圖表69Midjourney應(yīng)用場(chǎng)景:電商海報(bào)宣傳敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明39/67 圖表70Midjourney應(yīng)用場(chǎng)景:Logo和徽章設(shè)計(jì)圖表71Midjourney應(yīng)用場(chǎng)景:插畫、漫畫和油畫月都可以創(chuàng)建任意數(shù)量的圖像且無需使用快速時(shí)間,但生成時(shí)間更長(zhǎng)且需要進(jìn)行排隊(duì)等待,通常需要0-10分鐘的等待時(shí)間;隱身模式(StealthMode)可以管理在敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明40/67圖表72Midjourney產(chǎn)品訂閱價(jià)格及說明付費(fèi)計(jì)劃訂閱價(jià)格說明jobs;4jobs。40jobs。40jobs。Model)和擴(kuò)散模型(DM/DiffusionModel,DM是基圖表73StableDiffusion版本迭代與變體情況及性能介紹發(fā)布日期及主體模型名稱使用512x512分辨率的515000敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明41/67生成效果和訓(xùn)練效率,同時(shí)可以與SDXL模型結(jié)合使用實(shí)現(xiàn)3D模型擴(kuò)展。注:1)訓(xùn)練步數(shù)的底層邏輯:讓模型通過大量的數(shù)據(jù)學(xué)習(xí)來調(diào)整自型時(shí),輸入圖像或生成圖像的尺寸設(shè)定為寬高均為512像素,生成相對(duì)清晰且具備一定細(xì)節(jié)的圖像;3)laion-aestheticsv25+數(shù)據(jù)集:用于訓(xùn)練模型的大規(guī)模圖像數(shù)據(jù)集;4)finetune版本:表示模型“微調(diào)”版本,是指在深度學(xué)習(xí)中對(duì)預(yù)訓(xùn)練模型進(jìn)一步調(diào)整以適應(yīng)新任務(wù)的過程;5)ADD(AdversarialDiffusion電商運(yùn)營(yíng)、設(shè)計(jì)師/插畫師、游戲開發(fā)者、AI研究者等不同圖表74StableDiffusion核心功能及技術(shù)實(shí)現(xiàn)核心功能技術(shù)實(shí)現(xiàn)通過潛在空間壓縮(LatentSpaceCompression將圖像編碼敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明42/67圖表75StableDiffusion用戶類型及核心需求用戶類型核心需求場(chǎng)景技術(shù)門檻圖表76StableDiffusion工作流程及U-Net網(wǎng)絡(luò)+Schedule算法迭代去噪過程敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明43/67一些新的特征信息,并對(duì)U-Net進(jìn)行調(diào)整輸出;ControlNe圖表77StableDiffusion包含模型及核心技術(shù)模型名稱核心技術(shù)圖表78StableDiffusion應(yīng)用場(chǎng)景:電商運(yùn)營(yíng)敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明44/67 圖表79StableDiffusion應(yīng)用場(chǎng)景:設(shè)計(jì)師/插畫師圖表80StableDiffusion應(yīng)用場(chǎng)景:游戲開發(fā)提示:設(shè)計(jì)一款中國(guó)古風(fēng)游戲場(chǎng)景,以大唐為背景圖表81StableDiffusion應(yīng)用場(chǎng)景:AI研究敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明45/67C端客戶采用積分訂閱制:每月支付訂閱費(fèi)并獲得相應(yīng)積分(credits使用圖表82StableDiffusionB端及C端產(chǎn)品訂閱價(jià)格及說明客戶付費(fèi)計(jì)劃訂閱價(jià)格說明/年API;視頻生成API;所有LLMAPI敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明46/67圖表83豆包大模型更新迭代情況關(guān)鍵更新說明理、細(xì)膩的視覺描述能力;在教育、旅游、電理解能力豆包1.5·深度思考大語言模型總參數(shù)為200B,成本、效率和延遲均豆包1.5·視覺深度思考模型、升級(jí)豆能力,學(xué)習(xí)數(shù)萬億多模態(tài)標(biāo)記數(shù)據(jù),使視覺推理能力大幅端等不同環(huán)境中完成復(fù)雜交互任務(wù);豆包·音樂模型升級(jí),不僅支持能體生態(tài)的搭建:豆包官方打磨智能體外,同時(shí)引入并運(yùn)營(yíng)第三方智能體,官方持敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明47/67圖表84豆包產(chǎn)品功能更新情況關(guān)鍵功能說明強(qiáng)化智能體的露出;開始對(duì)智能體做進(jìn)一虛擬聊天智能體增加聊天背景封面;與扣體開發(fā)平臺(tái)“扣子”上線,和豆包打通,支持智能體開始灰度支持定制個(gè)人的音色功解不同數(shù)據(jù)類型背后的語義、邏輯與模式。在訓(xùn)練過程中,運(yùn)用大規(guī)模分布式訓(xùn)練義表達(dá)和知識(shí)體系;在圖像模型訓(xùn)練中,通過對(duì)海量圖像數(shù)據(jù)的特征提取與學(xué)習(xí),使得模型能夠理解圖像內(nèi)容并根據(jù)文本描述生成對(duì)應(yīng)圖像。同時(shí),模型運(yùn)用多種優(yōu)化算法,如自適應(yīng)學(xué)習(xí)率調(diào)整等,以提升模型敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明48/67圖表85豆包大模型家族九款模型圖表86豆包九款模型主要功能及應(yīng)用場(chǎng)景簡(jiǎn)介模型名稱主要功能及應(yīng)用場(chǎng)景專注于處理復(fù)雜文本分析、問答、文本生成等任務(wù):在搜索引擎優(yōu)化理解客戶咨詢問題,提供詳細(xì)準(zhǔn)確的解答,極手應(yīng)用中,能夠快速響應(yīng)用戶指令,提供簡(jiǎn)潔有效的服務(wù),且不會(huì)過玩家的游戲體驗(yàn)更加真實(shí)有趣;在在線教育互動(dòng)課程里,能模擬教師或?qū)W習(xí)伙伴,與學(xué)生進(jìn)行互動(dòng)交支持多語言及方言識(shí)別,廣泛適用于會(huì)議記錄、語音助手、智能家居控制等場(chǎng)景:在跨國(guó)公司的會(huì)議用于個(gè)性化語音導(dǎo)航、智能音箱語音設(shè)置等,也可為提供靈感;電商商家能根據(jù)商品特點(diǎn)描述生成精美的商品展示圖片,提升商品吸引力與銷程序調(diào)用和自動(dòng)化任務(wù)設(shè)計(jì),可實(shí)現(xiàn)不同軟件系統(tǒng)之間的高效協(xié)同與自動(dòng)化流程執(zhí)行:在企業(yè)業(yè)務(wù)流型,按輸入及輸出每百萬token收費(fèi),批量推理針對(duì)douba敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明49/67 圖表87豆包視覺理解模型收費(fèi)價(jià)格圖表88視覺理解token用量說明資料來源:火山引擎官網(wǎng),華安證券研究所資料來源:火山引擎官網(wǎng),華安證券研究所圖表89豆包視頻生成模型收費(fèi)價(jià)格圖表90豆包圖片生成模型收費(fèi)價(jià)格資料來源:火山引擎官網(wǎng),華安證券研究所資料來源:火山引擎官網(wǎng),華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明50/67平臺(tái),借助AI技術(shù)賦予用戶創(chuàng)作、分享及生成獨(dú)特藝術(shù)管理系,將SD各種復(fù)雜功能封裝起來形成一個(gè)易用的網(wǎng)站用戶可以通過可視化界面精確控制生產(chǎn)過程的每一步,實(shí)現(xiàn)更復(fù)雜、個(gè)性化的創(chuàng)作圖表91SeaArtAI核心技術(shù)優(yōu)勢(shì)海量豐富模型庫以及豐富的AI創(chuàng)作能夠大幅提升出圖質(zhì)量,讓細(xì)節(jié)更豐富,色彩層次更合理,立體感更強(qiáng),文本理解能力對(duì)于進(jìn)階用戶,SeaArt提供了基于節(jié)點(diǎn)的AI工AI積極與亞馬遜云科技、阿里云、華為方舟實(shí)驗(yàn)室進(jìn)行技術(shù)合作。為實(shí)現(xiàn)海外市場(chǎng)快速構(gòu)建可以服務(wù)于全球海外用戶的SeaArtAI藝術(shù)創(chuàng)作平有利于提升SeaArtAI出圖效率和推理耗時(shí)等性能;與華為文生圖模型,例如PixArtSigma等,形敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明51/67圖表92SeaArtAI與亞馬遜云科技、阿里云、華為云技術(shù)合作情況化,可將超過30種語言的輸入提示詞翻譯為英語,降低生成式AI繪圖無需用戶具備較高參數(shù)調(diào)整能力,輸入自然語言文本,平臺(tái)自動(dòng)化分析關(guān)鍵風(fēng)分布式緩存及OSS資料來源:亞馬遜云科技官網(wǎng),阿里云官網(wǎng),華為云官圖表93海藝互娛基于亞馬遜云科技服務(wù)于海外用戶的技術(shù)架構(gòu)示意圖低上手門檻,利于客戶群體推廣。敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明52/67圖表94SeaArtAI落地頁功能界面:免費(fèi)AI藝術(shù)生成器與創(chuàng)意社區(qū)、廣場(chǎng)是一個(gè)基于節(jié)點(diǎn)式工作流的StableDiffusionUI,由GitHub上的匿名開發(fā)者且支持隨時(shí)調(diào)整;2)復(fù)用性強(qiáng):其他用戶可以直接復(fù)工作流、模塊化設(shè)計(jì)、實(shí)時(shí)可視化、易于擴(kuò)展、支持圖表95ComfyUI核心功能介紹核心功能核心功能介紹節(jié)點(diǎn)化工作流模塊化設(shè)計(jì)實(shí)時(shí)可視化易于擴(kuò)展支持多種模型和算法敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明53/67圖表96SeaArtAI游戲內(nèi)容生成效果圖:像素游戲場(chǎng)景生成器、貓狗斗爭(zhēng)游戲場(chǎng)景算力無期限,可用于AI圖像生成、AI視頻生成、圖表97SeaArtAI產(chǎn)品訂閱價(jià)格及說明付費(fèi)計(jì)劃訂閱價(jià)格說明免費(fèi)版初級(jí)版標(biāo)準(zhǔn)版專業(yè)版);大師版敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明54/67投資方,募集資金達(dá)數(shù)億元人民幣,將重點(diǎn)投入創(chuàng)作者生態(tài)建設(shè)與技術(shù)研發(fā),加速圖表98LiblibAI2023年至今融資情況日期輪次融資金額投資方輪A輪A+輪戶可訓(xùn)練專屬模型,參與社區(qū)交流并探索AI繪畫,20圖表99LiblibAI核心功能介紹核心功能核心功能介紹在線StableDiffusionWebUI圖片生成文生圖:用戶輸入文字描述,AI根據(jù)描述生成圖像;圖生圖:用戶上傳圖片,AI在此基礎(chǔ)上生成新圖像,保持原有圖片風(fēng)格或元素;圖像后期處理:提供對(duì)生成圖像的編輯和優(yōu)化功能,如調(diào)整風(fēng)格、尺寸、分辨率等。豐富作品靈感和模型社區(qū)匯集10萬+AI模型和創(chuàng)作作品,涵蓋多種風(fēng)格和領(lǐng)域,。個(gè)人專屬自定義LoRA模型訓(xùn)練可上傳圖片來訓(xùn)練專屬LoRA模型,提供多種預(yù)設(shè)模式,滿足個(gè)性化需敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明55/67社區(qū)互動(dòng)與分享在平臺(tái)社區(qū)上分享自己的作品和模型,與其他創(chuàng)作者交流心得。版權(quán)和售賣生態(tài)鏈構(gòu)建版權(quán)保護(hù)和作品售賣的完整生態(tài)鏈,支持創(chuàng)作者權(quán)益。較,在風(fēng)格多樣性、Prompt理解能力、美學(xué)質(zhì)量等基礎(chǔ)能力方面表現(xiàn)優(yōu)異修復(fù)與重繪、高適應(yīng)性與靈活性、細(xì)節(jié)表現(xiàn)力、內(nèi)容多樣性及多場(chǎng)景應(yīng)用支持等方面具備顯著優(yōu)勢(shì);推薦應(yīng)用場(chǎng)景包括電商與產(chǎn)品展示、廣告與市場(chǎng)推廣、插畫與藝術(shù)創(chuàng)作、室內(nèi)設(shè)計(jì)與建筑可視化、社交媒體內(nèi)容創(chuàng)作示,珠寶的高分辨率照片,光影”。圖表100Star-3Alpha大模型與MidjourneyV6.1、Dalle-3、Flux.1Dev評(píng)測(cè)比較圖表101Star-3Alpha大模型功能特性功能特性功能特性介紹高精度圖像生成精準(zhǔn)響應(yīng)復(fù)雜提示詞藝術(shù)風(fēng)格與色彩控制高效生成與制作智能自動(dòng)修復(fù)與重繪高適應(yīng)性與靈活性敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明56/67增強(qiáng)的細(xì)節(jié)表現(xiàn)能力增強(qiáng)的內(nèi)容多樣性多場(chǎng)景應(yīng)用支持圖表102Star-3Alpha應(yīng)用場(chǎng)景:電商與產(chǎn)品展示資料來源:Star-3Alpha官網(wǎng),華安證券研究所圖表103Star-3Alpha應(yīng)用場(chǎng)景:廣告與市場(chǎng)推廣資料來源:Star-3Alpha官網(wǎng),華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明57/67 圖表104Star-3Alpha應(yīng)用場(chǎng)景:插畫與藝術(shù)創(chuàng)作資料來源:Star-3Alpha官網(wǎng),華安證券研究所圖表105Star-3Alpha應(yīng)用場(chǎng)景:室內(nèi)設(shè)計(jì)與建筑可視化提示:現(xiàn)代簡(jiǎn)約家裝效果圖,木地板元素提示:鴿子圍繞著北京的天壇飛翔資料來源:Star-3Alpha官網(wǎng),華安證券研究所圖表106Star-3Alpha應(yīng)用場(chǎng)景:社交媒體內(nèi)容創(chuàng)作資料來源:Star-3Alpha官網(wǎng),華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明58/67 能任務(wù)分解設(shè)計(jì)流程,能夠?qū)⒂脩舻母邔釉O(shè)計(jì)需求自動(dòng)拆解為結(jié)構(gòu)化的任務(wù)序更加具備專業(yè)設(shè)計(jì)師的思考和工作能力,如下圖所示,L3)應(yīng)用層面:Lovart應(yīng)用場(chǎng)景包括品牌全方設(shè)計(jì)風(fēng)格,最終生成時(shí)尚感、古怪感且風(fēng)格物狗品種、毛發(fā)、體型為基準(zhǔn),生成一幅具備涂鴉風(fēng)格的寵物零食廣告。圖表107Lovart一站式調(diào)用GPTimage-1等模型圖表108Lovart智能任務(wù)分解流程資料來源:Lovart官網(wǎng),華安證券研究所敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明59/67 圖表109Lovart設(shè)計(jì)Pupu品牌包并生成海報(bào)圖表110Lovart生成寵物零食廣告圖敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明60/67圖表111LiblibAIB端及C端產(chǎn)品訂閱價(jià)格及說明客戶付費(fèi)計(jì)劃訂閱價(jià)格說明會(huì)員基礎(chǔ)版VIP會(huì)員專業(yè)版VIP2)云端存儲(chǔ)空間80GB,訓(xùn)練加速特權(quán)20次/月,素,造型是AI機(jī)器人與牛的結(jié)合體,包含了“AI大?!钡脑⒁狻D表112RoboNeo網(wǎng)頁版首頁敬請(qǐng)參閱末頁重要聲明及評(píng)級(jí)說明61/67 用戶能夠輕松
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026西藏那曲索縣人民醫(yī)院合同制工作人員招聘18人備考題庫(第一批次)及答案詳解(新)
- 2026湖北漢口學(xué)院航空與智能制造學(xué)院院長(zhǎng)招聘1人備考題庫完整答案詳解
- 2026貴州省實(shí)驗(yàn)中學(xué)招聘3人備考題庫及參考答案詳解1套
- 2026湖南邵陽市邵東市市直事業(yè)單位引進(jìn)博士研究生15人備考題庫及答案詳解(新)
- 華鎣市就業(yè)創(chuàng)業(yè)促進(jìn)中心2026年第一批城鎮(zhèn)公益性崗位人員招聘?jìng)淇碱}庫及答案詳解(易錯(cuò)題)
- 2026湖北恩施州恩施職業(yè)技術(shù)學(xué)院選聘3人備考題庫及一套完整答案詳解
- 醫(yī)院儀器設(shè)備、耗材采購制度
- 人力資源管理人力公司HR助理實(shí)習(xí)報(bào)告
- 我國(guó)工業(yè)企業(yè)ERP應(yīng)用績(jī)效評(píng)價(jià):體系構(gòu)建與實(shí)例解析
- 我國(guó)小額保險(xiǎn)經(jīng)營(yíng)管理的多維審視與優(yōu)化路徑探究
- 疾病動(dòng)態(tài)監(jiān)測(cè)的多組學(xué)整合分析策略
- 中國(guó)臨床腫瘤學(xué)會(huì)(CSCO)結(jié)直腸癌診療指南2024
- 北京市豐臺(tái)二中2026屆數(shù)學(xué)高一上期末考試試題含解析
- 狂犬病指南2025版本更新
- 核酸口鼻采樣培訓(xùn)
- (新教材)2026年部編人教版一年級(jí)下冊(cè)語文 語文園地一 課件
- 安徽紅陽化工有限公司年產(chǎn)1萬噸有機(jī)酯(三醋酸甘油酯)、5500噸醋酸鹽系列產(chǎn)品擴(kuò)建項(xiàng)目環(huán)境影響報(bào)告書
- 汽車各工況下輪轂軸承壽命計(jì)算公式EXCEL表
- 教務(wù)工作的培訓(xùn)內(nèi)容
- 呂洞賓祖師道德經(jīng)解
- 2023-2024學(xué)年江蘇省宜興市小學(xué)數(shù)學(xué)四年級(jí)上冊(cè)期末自我評(píng)估題
評(píng)論
0/150
提交評(píng)論