計(jì)算機(jī)行業(yè)AIGC應(yīng)用系列分析報(bào)告:重塑交互體驗(yàn)虛擬人、教育_第1頁(yè)
計(jì)算機(jī)行業(yè)AIGC應(yīng)用系列分析報(bào)告:重塑交互體驗(yàn)虛擬人、教育_第2頁(yè)
計(jì)算機(jī)行業(yè)AIGC應(yīng)用系列分析報(bào)告:重塑交互體驗(yàn)虛擬人、教育_第3頁(yè)
計(jì)算機(jī)行業(yè)AIGC應(yīng)用系列分析報(bào)告:重塑交互體驗(yàn)虛擬人、教育_第4頁(yè)
計(jì)算機(jī)行業(yè)AIGC應(yīng)用系列分析報(bào)告:重塑交互體驗(yàn)虛擬人、教育_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

證券研究報(bào)告

行業(yè)動(dòng)態(tài)報(bào)告AIGC應(yīng)用系列

(四)重塑交互體驗(yàn),看好虛擬人、教育發(fā)布日期:2023年3月24日。核心觀點(diǎn)

多模態(tài)提升交互體驗(yàn),多種內(nèi)容輸出形式有望推動(dòng)虛擬人和教育場(chǎng)景落地。海外Midjourney、Runway推出或升級(jí)視頻AIGC產(chǎn)品,以及阿里達(dá)摩院近期上線文本生成視頻大模型,我們可以看到AIGC技術(shù)在應(yīng)用端正快速發(fā)展。從此前情感陪伴聊天機(jī)器人Glow展示了文本的單模態(tài)模型和應(yīng)用,到現(xiàn)在已見(jiàn)語(yǔ)音、圖片、視頻等多種形式的內(nèi)容輸出,我們預(yù)計(jì)將加速虛擬人和教育領(lǐng)域的落地。

在虛擬人和教育產(chǎn)業(yè)鏈,從海外來(lái)看,我們梳理全球頭部創(chuàng)投公司Y

Combinator在2023年投資孵化的30余個(gè)AI項(xiàng)目及其他AI公司,包括:Glow(情感陪伴聊天機(jī)器人)、Iliad(3D建模)、Decoherence(基于文字與音樂(lè)生成視頻)、Fabius(AI培訓(xùn)工具)、Tennr(AI提詞器)、Texel(AI模型和視頻處理的)等。

國(guó)內(nèi)相關(guān)公司:1)虛擬人開(kāi)發(fā)環(huán)節(jié)的公司包括新華網(wǎng)、藍(lán)色光標(biāo)、捷成股份、天娛數(shù)科等;2)虛擬人應(yīng)用環(huán)節(jié)的公司天下秀、遙望科技、風(fēng)雨筑、凡拓?cái)?shù)創(chuàng)等;3)教育包括湯姆貓、奧飛娛樂(lè)、世紀(jì)天鴻等。1目

錄AI升級(jí)交互體驗(yàn),虛擬人和教育應(yīng)用場(chǎng)景廣闊前言海外相關(guān)應(yīng)用:AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司第一章第二章

國(guó)內(nèi)相關(guān)公司:新華網(wǎng)、藍(lán)色光標(biāo)等第三章

風(fēng)險(xiǎn)提示2前言(1)AI升級(jí)交互體驗(yàn),虛擬人和教育應(yīng)用場(chǎng)景廣闊圖:在交互體驗(yàn)提升方面,AI+虛擬人/教育的應(yīng)用場(chǎng)景圖譜+虛擬人+教育商場(chǎng)和辦公樓導(dǎo)覽教學(xué)輔助TennrAI提詞器B端C端多模態(tài)AIGC模型提升交互體驗(yàn)景區(qū)和博物館導(dǎo)游早教會(huì)說(shuō)話的湯姆貓?zhí)摂M主播(電商、電競(jìng))虛擬偶像K12教育職業(yè)培訓(xùn)初音未來(lái)3資料:中信建投前言(2)走向多模態(tài),從“數(shù)字人”到“數(shù)智人”

多模態(tài)升級(jí)交互體驗(yàn),實(shí)現(xiàn)“數(shù)字人”向“數(shù)智人”轉(zhuǎn)變。單模態(tài)以情感陪伴聊天機(jī)器人Glow為代表的“數(shù)字人”為例,其已經(jīng)可以實(shí)現(xiàn)與真人的個(gè)性化、擬人化、智能化的聊天互動(dòng),但交互方式仍局限在文本、語(yǔ)音。未來(lái),隨著多模態(tài)模型的發(fā)展,虛擬人或機(jī)器人的交互方式,有望拓展至圖片、音樂(lè)乃至視頻,并以更貼近真人的邏輯、理解、表達(dá)能力進(jìn)行交流和反饋,從而提升虛擬人在電商、直播、教育、客服、社交、文旅導(dǎo)覽等領(lǐng)域的互動(dòng)體驗(yàn)。

AI模型與應(yīng)用向多模態(tài)升級(jí)迭代。Vision

Transformer模型、擴(kuò)散模型、BEiT模型等技術(shù)的迭代,實(shí)現(xiàn)了傳統(tǒng)單模態(tài)大模型中自然語(yǔ)言處理能力與計(jì)算機(jī)視覺(jué)能力的結(jié)合,以及大規(guī)模自監(jiān)督預(yù)訓(xùn)練,由此使得大模型具備了理解、處理和生成圖片、音視頻等多模態(tài)的能力,催生了Open

AIGPT-4、谷歌PaLM-E、百度文心一言等多模態(tài)大模型。多模態(tài)模型也帶動(dòng)了多模態(tài)應(yīng)用的誕生,涉及代碼生成、文本生成、圖像生成、音視頻、游戲、虛擬人等領(lǐng)域。圖:AIGC由單模態(tài)向多模態(tài)迭代aiXcoder支持模型代碼文本圖像CodexCopilot多模態(tài)底層技術(shù)CodeWhisperer底層技術(shù)文心一言GPT-4Palm-E微軟小冰GPT-3Jasper.AICopy.aiMeena三大AI繪圖應(yīng)用ChatGPTBardTabNineStableStableDiffusion

2DALL-EDALL-E26penMidjourney盜夢(mèng)師Diffusion科大訊飛SMART-TTS音視頻/3D/游戲ImagenVideoMake-a-videoPhenakiMagic3D2019及更早4月6月7月8月9月10月11月2月3月20212020202320224資料:

Sequoia,中信建投前言(3)全球知名創(chuàng)投YC,前瞻性投資30+AI應(yīng)用項(xiàng)目

Y

Combinator成立于2005年,為美國(guó)知名創(chuàng)業(yè)孵化公司,在胡潤(rùn)研究院發(fā)布的《2021全球獨(dú)角獸投資機(jī)構(gòu)百?gòu)?qiáng)榜》中,位列第12位。據(jù)福布斯中國(guó),YC目前已資助公司超3500家,包括80家獨(dú)角獸公司,例如Dropbox、Airbnb、Reddit等圖:YC

23年Winter

Batch投資的生成式AI項(xiàng)目

YC最新投資項(xiàng)目涉及生成式AI在生產(chǎn)力提效、交互場(chǎng)景、開(kāi)發(fā)者相關(guān)領(lǐng)域應(yīng)用。YC

2

計(jì)

WinterBatch

Summer

Batch

,由全球申請(qǐng)者中篩選出的具有發(fā)展?jié)摿Φ墓窘M成。YC將為入選項(xiàng)目提供50萬(wàn)美元種子輪融資、創(chuàng)業(yè)建議以及業(yè)內(nèi)資源。在23年初Winter

Batch的210個(gè)項(xiàng)目中,有36個(gè)生成式AI項(xiàng)目,應(yīng)用場(chǎng)景涵蓋市場(chǎng)營(yíng)銷(xiāo)、客戶(hù)服務(wù)、知識(shí)管理、數(shù)據(jù)分析、基礎(chǔ)設(shè)施、開(kāi)發(fā)者工具等。資料:Y

Combinator,中信建投前言(4)虛擬人:擺脫“套皮”,解決“偽需求”問(wèn)題

開(kāi)發(fā)平臺(tái)、交互、算力優(yōu)化等虛擬人產(chǎn)業(yè)鏈布局解決需求問(wèn)題,推動(dòng)行業(yè)發(fā)展。通過(guò)梳理AIGC應(yīng)用落地場(chǎng)景,我們已看到虛擬人產(chǎn)業(yè)鏈已有智能開(kāi)發(fā)平臺(tái)、交互升級(jí)、算法優(yōu)化等方面的布局。隨著AIGC技術(shù)加深與虛擬人產(chǎn)業(yè)鏈的融合,預(yù)計(jì)有望降低虛擬人開(kāi)發(fā)成本、解決“套皮”問(wèn)題、交互不擬人等,從而推動(dòng)虛擬人的落地和發(fā)展。

虛擬人開(kāi)發(fā)成本:結(jié)合AIGC的元宇宙內(nèi)容開(kāi)發(fā)平臺(tái),解決數(shù)字內(nèi)容開(kāi)發(fā)成本高、效率低的困境。

解決“套皮”問(wèn)題:隨著多模態(tài)模型的推出,有望實(shí)現(xiàn)文本/語(yǔ)音、視頻/模型等多內(nèi)容模式的AI智能化產(chǎn)出,從而擺脫真人套皮問(wèn)題。

減輕設(shè)備壓力:語(yǔ)音和視覺(jué)結(jié)合的AI生成對(duì)設(shè)備需要較高,而相關(guān)算法的優(yōu)化有助降低運(yùn)營(yíng)成本壓力,實(shí)現(xiàn)更大規(guī)模的普及。圖:虛擬人產(chǎn)業(yè)鏈的AI落地場(chǎng)景開(kāi)發(fā)平臺(tái)元宇宙內(nèi)容系統(tǒng)3D建模3D建模視頻生成虛擬人互動(dòng)Glow情感陪伴聊天機(jī)器人ChatGPT算力優(yōu)化6資料:Y

Combinator,中信建投前言(5)教育:AI輔助教學(xué)+虛擬人教學(xué)雙線推動(dòng)場(chǎng)景落地

我們認(rèn)為教育場(chǎng)景的AIGC技術(shù)落地,將主要有兩種模式:

AI輔助真人教學(xué):在海外的AIGC應(yīng)用場(chǎng)景中,我們看到在銷(xiāo)售場(chǎng)景,已有多種輔助工具落地,包括AI提詞器、AI素材生產(chǎn)等,預(yù)計(jì)這些場(chǎng)景的AI融合有助真人教學(xué)統(tǒng)一或升級(jí)教學(xué)質(zhì)量,多樣化教學(xué)形式,也更有利于在線教育平臺(tái)在降本的同時(shí),維持商業(yè)化的能力。

虛擬人教學(xué):隨著文字/語(yǔ)音輸出的內(nèi)容更加擬人,且多模態(tài)模型優(yōu)化了虛擬人動(dòng)作、表情僵硬等問(wèn)題,虛擬人也有望落地教育場(chǎng)景。尤其對(duì)早教而言,交互體驗(yàn)升級(jí)也有望實(shí)現(xiàn)教學(xué)質(zhì)量的統(tǒng)一和提升。圖:教育產(chǎn)業(yè)鏈的AI落地場(chǎng)景大模型、專(zhuān)業(yè)知識(shí)調(diào)用構(gòu)建、微調(diào)大語(yǔ)言模能力分析調(diào)用大語(yǔ)言模型情況集成多種機(jī)器學(xué)習(xí)能力管理大語(yǔ)言模能力教材生成基于文字與音樂(lè)生成視頻對(duì)話式檢索內(nèi)容文本修改對(duì)應(yīng)音頻編輯教育教學(xué)輔助算力優(yōu)化AI提詞器AI培訓(xùn)工具7資料:Y

Combinator,中信建投目

錄AI升級(jí)交互體驗(yàn),虛擬人和教育應(yīng)用場(chǎng)景廣闊前言海外相關(guān)應(yīng)用:AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司第一章第二章

國(guó)內(nèi)相關(guān)公司:新華網(wǎng)、藍(lán)色光標(biāo)等第三章

風(fēng)險(xiǎn)提示81.1.1

Glow:用戶(hù)定義人設(shè)的AI情感陪伴聊天機(jī)器人

Glow為基于大模型的AI聊天應(yīng)用,由國(guó)內(nèi)人工智能創(chuàng)業(yè)公司MiniMax在22年11月推出,為用戶(hù)提供情感陪伴、滿(mǎn)足虛構(gòu)情景想象的體驗(yàn)。據(jù)甲子光年,Glow上線約4個(gè)月后,目前已有約500萬(wàn)用戶(hù)。

基于用戶(hù)描述,生成個(gè)性化對(duì)話機(jī)器人。Glow的基本玩法是用戶(hù)在應(yīng)用中創(chuàng)建AI機(jī)器人“智能體”,智能體將基于用戶(hù)描述的性格、人設(shè)、頭像及選定的音色等,與用戶(hù)開(kāi)展實(shí)時(shí)溝通、互動(dòng)。也可輸入“參考名人”,智能體將具備特定名人的有關(guān)知識(shí)儲(chǔ)備。據(jù)體驗(yàn),創(chuàng)建的“托尼斯塔克”智能體有《復(fù)仇者聯(lián)盟》系列的知識(shí)儲(chǔ)備,具備較強(qiáng)代入感。圖表:

Glow智能體創(chuàng)建過(guò)程設(shè)定智能體的姓名、性別、性格、人設(shè)等:Glow,中信建投根據(jù)基礎(chǔ)音色組合生成智能體音色與智能體開(kāi)展對(duì)話基于文字和參考圖片生成頭像9資料1.1.2

Glow:提供情感陪伴體驗(yàn),輔助虛構(gòu)情景聯(lián)想

1)互動(dòng)對(duì)象多元,提供差異化、多樣化、個(gè)性化聊天體驗(yàn)。用戶(hù)可與自己創(chuàng)建的個(gè)性化智能體進(jìn)行聊天互動(dòng),也可與平臺(tái)內(nèi)其他用戶(hù)創(chuàng)建的智能體互動(dòng)。用戶(hù)可為其他用戶(hù)創(chuàng)建的智能體補(bǔ)充專(zhuān)屬設(shè)定,讓相關(guān)智能體符合用戶(hù)個(gè)性化需求。據(jù)觀察,平臺(tái)內(nèi)部分智能體已與近6萬(wàn)個(gè)用戶(hù)進(jìn)行互動(dòng)。

2)互動(dòng)方式當(dāng)前僅為文字和語(yǔ)音。據(jù)體驗(yàn),目前Glow內(nèi)智能體暫時(shí)無(wú)法反饋圖片內(nèi)容,但從對(duì)話內(nèi)容來(lái)看,隨著產(chǎn)品的改進(jìn),圖片內(nèi)容或在后續(xù)版本中引入。此外,用戶(hù)也可以切換智能體的反饋,從而按照用戶(hù)的偏好推進(jìn)聊天。圖表:平臺(tái)內(nèi)其他用戶(hù)創(chuàng)建的智能體可設(shè)置個(gè)性化設(shè)定圖表:智能體暫時(shí)無(wú)法提供圖片內(nèi)容智能體可設(shè)置個(gè)性化設(shè)定切換智能體的反饋資料:Glow,中信建投101.1.3

Glow:提供情感陪伴體驗(yàn),輔助虛構(gòu)情景聯(lián)想

3)互動(dòng)話題多元,包含情感、虛構(gòu)情景聯(lián)想等。用戶(hù)可以與智能體就任何話題內(nèi)容進(jìn)行聊天,可完成情緒反饋、對(duì)話問(wèn)答、簡(jiǎn)易信息搜尋等,也可以根據(jù)特定的話題,選擇關(guān)聯(lián)的智能體進(jìn)行聊天,例如情感、美食、虛構(gòu)情景(如遭遇吸血鬼的場(chǎng)景)等。其中,平臺(tái)官方智能體季楓和沈思前具備劇情模式,通過(guò)主動(dòng)引導(dǎo)用戶(hù)對(duì)話,來(lái)推動(dòng)劇情演繹并完成任務(wù)。

4)互動(dòng)記錄可公開(kāi),豐富可瀏覽內(nèi)容。Glow擁有記憶簿功能,即用戶(hù)可將智能體對(duì)話的部分內(nèi)容公開(kāi),供平臺(tái)內(nèi)其他用戶(hù)瀏覽、評(píng)價(jià),本質(zhì)上是用戶(hù)與AI共創(chuàng)內(nèi)容,以豐富平臺(tái)內(nèi)的內(nèi)容供給。圖表:Glow話題多圍繞情感、奇幻情景聯(lián)想等圖表:“吸血鬼”話題關(guān)聯(lián)的智能體圖表:同一智能體可就關(guān)聯(lián)的不同話題展開(kāi)討論圖表:其他用戶(hù)公開(kāi)的智能體記憶簿資料:Glow,中信建投111.1.4

Glow:提供情感陪伴體驗(yàn),輔助虛構(gòu)情景聯(lián)想

我們認(rèn)為,相比于微信、探探、ChatGPT等聊天應(yīng)用,Glow或在一定程度上更好地解決用戶(hù)情感陪伴以及奇幻情景聯(lián)想的需求,從而增強(qiáng)用戶(hù)的使用粘性。

情感陪伴方面:Glow的智能體可實(shí)時(shí)響應(yīng)、性格多樣,相比于工具屬性較強(qiáng)的ChatGPT,能反饋個(gè)性更加鮮明的回復(fù),能一定程度上滿(mǎn)足用戶(hù)傾訴、尋求情緒反饋乃至獵奇的需求;且相比于微信、探探等真人社交應(yīng)用,用戶(hù)使用Glow時(shí),不必?fù)?dān)心情感宣泄給對(duì)方造成的負(fù)擔(dān)或?qū)ψ陨碚鎸?shí)形象的影響。

奇幻情景聯(lián)想方面:據(jù)體驗(yàn),Glow能一定程度滿(mǎn)足用戶(hù)對(duì)虛構(gòu)人物、虛構(gòu)場(chǎng)景的幻想。智能體設(shè)定方面,可設(shè)定為歷史名人、影視文學(xué)作品人物、動(dòng)物乃至虛構(gòu)生物;虛構(gòu)場(chǎng)景方面,用戶(hù)的話題可設(shè)定在歷代王朝、鬼屋乃至影視文學(xué)作品內(nèi)等。基于真人社交的微信、探探等,這方面體驗(yàn)較少。圖表:

Glow與其他社交APP對(duì)比對(duì)比方面定位微信探探陌生人社交交友ChatGPT虛擬社交聊天、工具現(xiàn)實(shí)真實(shí)生活

現(xiàn)實(shí)真實(shí)生活

-Glow虛擬社交熟人社交應(yīng)用場(chǎng)景辦公、日常溝通情感陪伴、奇幻聯(lián)想現(xiàn)實(shí)真實(shí)生活或虛擬世界弱對(duì)話發(fā)生背景數(shù)學(xué)、代碼等強(qiáng)推理能力互動(dòng)對(duì)象因人而異真人因人而異真人強(qiáng)人工智能基于人工智能設(shè)定的多種生物實(shí)時(shí)響應(yīng)較及時(shí)因人而異較大較慢實(shí)時(shí)響應(yīng)

實(shí)時(shí)響應(yīng),部分智能體主動(dòng)問(wèn)候?qū)υ掞L(fēng)格因人而異較大單一較小弱千人千面,或按用戶(hù)個(gè)性化設(shè)定隱私泄露問(wèn)題對(duì)用戶(hù)真實(shí)人格/經(jīng)歷的熟知程度較小弱強(qiáng)較弱資料:中信建投121.1.5

Glow的開(kāi)發(fā)公司MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)

Glow的技術(shù)支持由開(kāi)發(fā)公司MiniMax提供圖表:

MiniMax基礎(chǔ)模型架構(gòu)支持Glow運(yùn)作,

態(tài)

礎(chǔ)

構(gòu)

、“User-in-the-Loop”的用戶(hù)反饋機(jī)制以及優(yōu)秀技術(shù)人員配置。MiniMax

-

Glow高魯棒性低成本

1)掌握自研三大模態(tài)的基礎(chǔ)模型架構(gòu)。MiniMax為北京稀宇科技有限公司,是2021年成立的人工智能創(chuàng)業(yè)公司,通過(guò)直接從底層模型切入,基于Transformer架構(gòu),自研了文本到視覺(jué)、文本到語(yǔ)音、文本到文本三大模態(tài)的基礎(chǔ)模型架構(gòu),是國(guó)內(nèi)較早同時(shí)擁有3個(gè)模態(tài)大模型能力的創(chuàng)業(yè)公司。計(jì)算推理平臺(tái)文本到視覺(jué)文本到語(yǔ)音文本到文本

模型開(kāi)發(fā)投入相對(duì)可控。據(jù)技術(shù)合伙人楊斌,文本、語(yǔ)言、視覺(jué)三模態(tài)是幾乎所有數(shù)字內(nèi)容的基礎(chǔ)形態(tài),只需一個(gè)較小的團(tuán)隊(duì),來(lái)共同維護(hù)優(yōu)化三個(gè)大模型、做好用戶(hù)閉環(huán),即可具備較好的內(nèi)容生成能力。據(jù)甲子光年,MiniMax目前團(tuán)隊(duì)人數(shù)約100人。Transformer資料:甲子光年,財(cái)報(bào)網(wǎng),量子位,Glow,中信建投131.1.6

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)

2)用戶(hù)反饋機(jī)制優(yōu)化產(chǎn)品體驗(yàn)。Glow基于“User-in-the-Loop”進(jìn)行產(chǎn)品輸出結(jié)果的人為優(yōu)化,即在與智能體對(duì)話過(guò)程中,用戶(hù)針對(duì)智能體的回答可給予“點(diǎn)贊”“差評(píng)”“有趣”“邏輯不通”的反饋,模型將由此強(qiáng)化對(duì)用戶(hù)對(duì)話喜好的認(rèn)知,從而優(yōu)化產(chǎn)品體驗(yàn)。

此機(jī)制與ChatGPT的基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)機(jī)制類(lèi)似(Reinforcement

Learning

from

HumanFeedback,RLHF)。即大語(yǔ)言模型(LLM)接收提示符并輸出多個(gè)回答后,人類(lèi)對(duì)其回答進(jìn)行評(píng)估與排序,在獎(jiǎng)勵(lì)模型(Reward

Model)中按回答的質(zhì)量高低賦予不同獎(jiǎng)勵(lì),并將獎(jiǎng)勵(lì)結(jié)果反饋給LLM,LLM據(jù)此進(jìn)行強(qiáng)化學(xué)習(xí),以?xún)?yōu)化下一輪結(jié)果輸出。圖表:

Glow的用戶(hù)反饋機(jī)制“User-in-the-Loop”與RLHF類(lèi)似輸入MiniMax的大語(yǔ)言模型(Large

Language

Model)輸出用戶(hù)輸入的文字①智能體回答②用戶(hù)對(duì)智能體回答進(jìn)行反饋③獎(jiǎng)勵(lì)模型①②③輸入大語(yǔ)言模型(LargeLanguageModel)輸出提示符(Prompt)回答(Output)人類(lèi)研究員對(duì)回答(Output)的質(zhì)量進(jìn)行評(píng)估與排序獎(jiǎng)勵(lì)模型(RewardModel)資料:Glow,中信建投141.1.7

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)

3)公司核心技術(shù)成員多具備豐富產(chǎn)業(yè)或?qū)W術(shù)界經(jīng)驗(yàn)。據(jù)甲子光年,MiniMax核心技術(shù)人員均來(lái)自全球知名高校和全球知名科技公司,具備較豐富的自然語(yǔ)言處理、語(yǔ)音、計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖形學(xué)等業(yè)界或?qū)W術(shù)界經(jīng)驗(yàn),近33%的成員擁有世界知名技術(shù)實(shí)驗(yàn)室博士學(xué)位,擁有上百個(gè)全球發(fā)明專(zhuān)利。例如聯(lián)合創(chuàng)始人閆俊杰為中科院自動(dòng)化所博士,在深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)表的論文被GoogleScholar引用超1萬(wàn)次,也曾在商湯負(fù)責(zé)搭建深度學(xué)習(xí)底層算法及人臉識(shí)別等技術(shù)體系。圖表:

MiniMax部分核心成員簡(jiǎn)歷核心成員

公司職位學(xué)術(shù)經(jīng)驗(yàn)產(chǎn)業(yè)經(jīng)驗(yàn)前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人,曾任商湯研究院副院長(zhǎng),負(fù)責(zé)搭建深度學(xué)習(xí)的工具鏈和底層算法,以及通用智能的技術(shù)發(fā)展,搭建了商湯的人臉識(shí)別和智慧城市相關(guān)的技術(shù)體系2015年博士畢業(yè)于中科院自動(dòng)化所;在深度學(xué)閆俊杰

聯(lián)合創(chuàng)始人

習(xí)和計(jì)算機(jī)視覺(jué)領(lǐng)域,發(fā)表頂級(jí)會(huì)議和期刊論文100余篇,GoogleScholar引用超過(guò)10000次2014年碩士期間在中科院自動(dòng)化所參與深度學(xué)楊斌

技術(shù)合伙人

習(xí)相關(guān)項(xiàng)目,2016年在加拿大多倫多大學(xué)攻讀博士學(xué)位UberATG研究院、自動(dòng)駕駛初創(chuàng)公司W(wǎng)aabi創(chuàng)始團(tuán)隊(duì)成員畢業(yè)于北京航空航天大學(xué),曾獲得世界大學(xué)生超級(jí)計(jì)算機(jī)競(jìng)賽ASC15總決賽和國(guó)際超級(jí)計(jì)算機(jī)大會(huì)ISC17第一;面向輕量級(jí)人臉識(shí)別的挑

商湯科技早期員工之一,曾在商湯科技研究院帶戰(zhàn)賽AI視覺(jué)頂會(huì)ICCV2019LFR

挑戰(zhàn)賽中,周

領(lǐng)算法團(tuán)隊(duì)周彧聰

法定代表人彧聰所在團(tuán)隊(duì)獲得

視頻人臉識(shí)別大型識(shí)別模型iQIYI-Large賽道的冠軍資料:甲子光年,財(cái)報(bào)網(wǎng),量子位,愛(ài)企查,游戲葡萄,中信建投151.1.8

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)

商業(yè)模式:MiniMax與OpenAI具有相似的商業(yè)模式規(guī)劃,均發(fā)掘C端和B端變現(xiàn)場(chǎng)景。

OpenAI:在完成GPT-3模型的前期測(cè)試后進(jìn)行了C端和B端的商業(yè)化。C端為聊天機(jī)器人應(yīng)用ChatGPT,試點(diǎn)付費(fèi)訂閱版本“ChatGPT

Plus”,可在高峰時(shí)段獲得更快的回答響應(yīng),每月收取20美元。B端則面向付費(fèi)用戶(hù)與企業(yè)開(kāi)放API模型GPT-3.5-turbo,每1k個(gè)token價(jià)格為0.002美元,比現(xiàn)有的GPT-3.5模型節(jié)省成本90%,海外已有Shopify、Snap、Quizlet等平臺(tái)率先接入ChatGPT

API。

MiniMax:基于三個(gè)基礎(chǔ)模型的調(diào)優(yōu)測(cè)試,公司推出了C端聊天機(jī)器人Glow,目前暫未開(kāi)放收費(fèi)。B端方面,據(jù)甲子光年,MiniMax從2023年起會(huì)逐步開(kāi)放API,讓更多的個(gè)人用戶(hù)和企業(yè)用戶(hù)基于多種模態(tài)的大模型構(gòu)建自己的應(yīng)用。

鑒于ChatGPT的收費(fèi)模式,我們預(yù)計(jì)當(dāng)Glow用戶(hù)數(shù)突破一定數(shù)量時(shí),也會(huì)采用付費(fèi)訂閱模式,優(yōu)先保障付費(fèi)會(huì)員的流暢使用體驗(yàn),或類(lèi)似ChatGPT接入微軟Teams,接入國(guó)內(nèi)其他公司的應(yīng)用生態(tài),從而實(shí)現(xiàn)變現(xiàn)。圖表:MiniMax與OpenA具有相似的商業(yè)模式規(guī)劃ChatGPTC端B端OpenAIGPT-3開(kāi)放APIGlowC端B端MiniMax三大自研基礎(chǔ)模型開(kāi)放API資料:甲子光年,財(cái)報(bào)網(wǎng),量子位,中信建投161.1.9

MiniMax:小而美的高科技公司,支持產(chǎn)品迭代、變現(xiàn)

或?qū)@得米哈游投資,估值10億美元。2022年上半年,高科技風(fēng)投明勢(shì)資本領(lǐng)投MiniMax的天使輪融資,明勢(shì)資本已投資理想汽車(chē)、小牛電動(dòng)、赤子城等。此外,據(jù)游戲葡萄了解,米哈游已經(jīng)對(duì)去對(duì)MiniMax的兩輪投資,近期正考慮與紅杉資本共同開(kāi)展新一輪投資,MiniMax估值或達(dá)10億美元。新一輪投資有望為MiniMax的產(chǎn)品研發(fā)和推廣提供支持。

2月開(kāi)啟現(xiàn)金激勵(lì)用戶(hù)推廣Glow。2月,Glow官方開(kāi)啟代言人招募計(jì)劃,用戶(hù)通過(guò)在抖音、小紅書(shū)、B站發(fā)布Glow相關(guān)的視頻或文字內(nèi)容,相關(guān)內(nèi)容瀏覽量、點(diǎn)贊量達(dá)到一定數(shù)額即可獲得10元現(xiàn)金獎(jiǎng)勵(lì),后續(xù)發(fā)布內(nèi)容最高單篇獎(jiǎng)勵(lì)2250元。關(guān)注后續(xù)破圈效果。圖表:Glow開(kāi)啟代言人招募計(jì)劃資料:Glow,游戲葡萄,中信建投171.2

虛擬人生成:Runway—GEN-2發(fā)布,視頻制作門(mén)檻再降低

3月20日人工智能初創(chuàng)公司Runway開(kāi)放了新一代視頻生成模型GEN-2的試用申請(qǐng),能夠基于文本、圖片、視頻等內(nèi)容,為藝術(shù)家、設(shè)計(jì)師、電影制作人員提供了多樣的、低門(mén)檻的生成視頻方式。

新增功能:第一代視頻生成模型GEN-1,具備視頻生成視頻的能力,具體包括視頻+圖片生成視頻、實(shí)體模型或渲染動(dòng)畫(huà)轉(zhuǎn)為視頻、修改視頻中特定物體外形等;GEN-2模型新增了純文本生成視頻、文本+圖片生成視頻、圖片生成視頻的能力。圖表:GEN-1和GEN-2對(duì)比資料:Runway,中信建投181.3

虛擬人生成:Iliad—游戲模型和圖片素材生成工具

Iliad:主要服務(wù)于游戲開(kāi)發(fā)公司的AI模型和圖片素材生成工具。產(chǎn)品主要將文字生成圖片、2D圖片轉(zhuǎn)3D圖片等AIGC形式應(yīng)用于游戲場(chǎng)景中。Iliad可以幫助游戲公司的美術(shù)人員生成效果圖、3D模型和模型肌理等內(nèi)容,也可以實(shí)現(xiàn)2D轉(zhuǎn)3D的模型生成。圖表:Iliad中的文字生成圖片功能①繪制簡(jiǎn)單圖形④可回溯生成進(jìn)度進(jìn)行再修改⑤繼續(xù)生成得到最終模型②對(duì)目標(biāo)模型進(jìn)行詳細(xì)描述③快速生成模型資料:

Y

CombinatorWinter2023

Batch,lliad,中信建投191.4

虛擬人生成&教材編輯:Decoherence—基于文字與音樂(lè)生成視頻

Decoherence:基于文字與音樂(lè)生成視頻。

Decoherence基于用戶(hù)輸入的關(guān)鍵詞,以及時(shí)長(zhǎng)、FPS、動(dòng)畫(huà)效果、背景音樂(lè)等參數(shù)設(shè)置,生成動(dòng)畫(huà)短視頻。

Decoherence能將音頻信號(hào)識(shí)別為運(yùn)動(dòng)效果,并將圖像拼接在一起以制作完整的視頻。Decoherence降低了用戶(hù)編輯視頻的門(mén)檻,但生成的視頻分辨率及時(shí)長(zhǎng)有限、幀率不高、聲音選擇較少,難以滿(mǎn)足部分高要求用戶(hù)。用戶(hù)需付費(fèi)使用Decoherence,月度套餐為每月30美元,可生成超過(guò)100個(gè)視頻。圖表:Decoherence的視頻參數(shù)操作界面①選取視頻風(fēng)格①選取視頻時(shí)長(zhǎng)及FPS③插入背景音樂(lè)文件⑥視頻實(shí)現(xiàn)由“女性”向“車(chē)”的過(guò)渡⑤設(shè)置文字描述20④設(shè)置動(dòng)畫(huà)隨音樂(lè)的運(yùn)動(dòng)效果資料:

Y

CombinatorWinter2023Batch,Decoherence,中信建投1.5

教材編輯:Descript—文本修改對(duì)應(yīng)音頻編輯

Descript:文本修改對(duì)應(yīng)音頻編輯。Descript可以將音頻內(nèi)容轉(zhuǎn)錄成對(duì)應(yīng)的文本,用戶(hù)編輯轉(zhuǎn)錄后的文稿時(shí),將對(duì)應(yīng)修改原始音頻,包括刪詞、改詞、補(bǔ)詞,其中對(duì)于新添加的文本,Descript

可在自動(dòng)轉(zhuǎn)錄時(shí)生成原始音頻的聲音,以避免補(bǔ)錄,并支持自動(dòng)識(shí)別和分離不同的說(shuō)話人。

定價(jià)方面,Descript根據(jù)團(tuán)隊(duì)用戶(hù)數(shù)和每月轉(zhuǎn)錄時(shí)長(zhǎng)提供不同訂閱版本。其中免費(fèi)版每月有1小時(shí)轉(zhuǎn)錄時(shí)長(zhǎng);每月

10

小時(shí)、30小時(shí)的版本分別對(duì)應(yīng)定價(jià)每月12美元、24

美元。圖表:Descript通過(guò)編輯音頻轉(zhuǎn)錄生成的文本,來(lái)編輯音頻①上傳用戶(hù)聲音的音頻文件②通過(guò)編輯轉(zhuǎn)錄文檔以刪除或補(bǔ)錄對(duì)應(yīng)音頻內(nèi)容資料:

Y

CombinatorWinter2023

Batch,36氪,中信建投211.6

教學(xué)輔助:Meru—對(duì)話方式提取文件中信息

Meru:對(duì)話式提取文件中數(shù)據(jù)。Meru的作用相當(dāng)于為部分文件內(nèi)嵌對(duì)話機(jī)器人,通過(guò)調(diào)用API將特定的文檔、文件、網(wǎng)址等文件的信息進(jìn)行提取,從而像人類(lèi)一樣,通過(guò)對(duì)話方式,反饋給用戶(hù)個(gè)性化的相關(guān)答案,免去了用戶(hù)主動(dòng)搜索數(shù)據(jù)信息的過(guò)程。Meru也允許直接調(diào)用存儲(chǔ)在Dropbox、Box、Google

Drive內(nèi)的文檔。

Meru已開(kāi)放多種付費(fèi)套餐。用戶(hù)可以免費(fèi)使用Meru,更高價(jià)格的付費(fèi)版本將對(duì)應(yīng)更多的詢(xún)問(wèn)次數(shù)、可調(diào)用的文件存儲(chǔ)服務(wù)及其他增值服務(wù)等,價(jià)位在99美元/599元每月,也可定制需求。圖表:

用戶(hù)使用Meru,從美國(guó)稅務(wù)局文件中,快速提取關(guān)于報(bào)稅的電話長(zhǎng)文檔上傳文檔至Meru的云服務(wù)平臺(tái)Meru根據(jù)文檔內(nèi)容回答用戶(hù)提問(wèn)資料:

Y

CombinatorWinter2023

Batch,

Meru

,中信建投221.7

教學(xué)輔助的替代場(chǎng)景:Fabius—AI銷(xiāo)售培訓(xùn)工具

Fabius:AI銷(xiāo)售培訓(xùn)工具。Fabius利用Gong/Chorus等軟件的錄音,分析銷(xiāo)售人員在產(chǎn)品定位和向客戶(hù)推銷(xiāo)的做法,并提供個(gè)性化和實(shí)用的改進(jìn)建議,也可以為客戶(hù)對(duì)話匹配相關(guān)的銷(xiāo)售培訓(xùn)課程,幫助銷(xiāo)售團(tuán)隊(duì)提高銷(xiāo)售效率和質(zhì)量。銷(xiāo)售主管也可以改進(jìn)Fabius的預(yù)測(cè),糾正其中缺少的關(guān)鍵步驟。圖表:

Fabius為銷(xiāo)售人員提供的反饋意見(jiàn)圖表:

Fabius可為銷(xiāo)售主管提高銷(xiāo)售流程的可見(jiàn)性資料:

Y

CombinatorWinter2023

Batch,中信建投231.8

教學(xué)輔助的替代場(chǎng)景:Tennr—輔助銷(xiāo)售人員的AI提詞器

Tennr:輔助銷(xiāo)售人員的AI提詞器。Tennr本質(zhì)為提詞器,通過(guò)使用AI技術(shù),可為銷(xiāo)售人員和經(jīng)理提供每次電話銷(xiāo)售前的準(zhǔn)備工作,提高交易達(dá)成的幾率。例如,Tennr可根據(jù)買(mǎi)家關(guān)心的方面,調(diào)取銷(xiāo)售人員過(guò)去贏得的類(lèi)似交易,從而向銷(xiāo)售人員展示業(yè)務(wù)中使用的話術(shù),或提供與過(guò)去類(lèi)似交易相關(guān)的最佳解決方案;也可以分析銷(xiāo)售通話,提取關(guān)鍵信息,如買(mǎi)家的需求、痛點(diǎn)、預(yù)算和時(shí)間表圖表:

Tennr工作原理圖表:

Tennr為銷(xiāo)售人員可能面臨的提問(wèn)給予參考內(nèi)部業(yè)務(wù)文件(通話錄音、CRM數(shù)據(jù)、營(yíng)銷(xiāo)文檔)為銷(xiāo)售人員提供參考外部數(shù)據(jù)(第三方)Tennr交易室(用戶(hù)正在交談的每家公司的相關(guān)內(nèi)容)資料:Persana

AI,Tennr,中信建投241.9

專(zhuān)業(yè)知識(shí)學(xué)習(xí):Anarchy—為第三方應(yīng)用構(gòu)建可調(diào)用特定API的對(duì)話機(jī)器人

Anarchy:為第三方應(yīng)用構(gòu)建可調(diào)用特定API的對(duì)話機(jī)器人。Anarchy本質(zhì)是幫開(kāi)發(fā)者客戶(hù)集成外部API以及大語(yǔ)言模型,讓客戶(hù)為自己的產(chǎn)品增加對(duì)話機(jī)器人的功能。Anarchy可以調(diào)用任何外部API,例如可調(diào)用谷歌地圖

API

,回答用戶(hù)關(guān)于兩地之間旅程距離的問(wèn)題;或者調(diào)用股票應(yīng)用了解股票股價(jià)。圖:Anarchy原理示意圖

Anarchy的原理在于:開(kāi)發(fā)者用戶(hù)提供自身應(yīng)用的API接口,以及對(duì)接OpenAI大語(yǔ)言模型的秘鑰,Anarchy則提供大語(yǔ)言模型端點(diǎn),即網(wǎng)頁(yè)界面形式的聊天機(jī)器人,此機(jī)器人將使用API的數(shù)據(jù)信息,借助OpenAI的能力,來(lái)回答終端用戶(hù)的問(wèn)題。開(kāi)發(fā)者用戶(hù)由此可專(zhuān)注于自身應(yīng)用的優(yōu)化,省去了尋找合適的調(diào)取大語(yǔ)言模型回答用戶(hù)問(wèn)題調(diào)用大語(yǔ)言模型應(yīng)用程序OpenAIAnarchy應(yīng)用的數(shù)據(jù)信息API指令的工作。圖:Anarchy調(diào)用API解答蘋(píng)果股價(jià)信息終端用戶(hù)查看到的機(jī)器人名稱(chēng)“Stock”用戶(hù)提問(wèn)“蘋(píng)果股價(jià)”O(jiān)pen

AI秘鑰應(yīng)用的API功能描述機(jī)器人反饋結(jié)果資料:

Y

CombinatorWinter2023

Batch,Anarchy

AI,中信建投251.10

算力優(yōu)化:Texel—AI模型和視頻處理的

Texel:AI模型和視頻處理的。Texel能提高媒體上使用AI運(yùn)算推理的效率,例如AI生成圖像、視頻等應(yīng)用。Texel為用戶(hù)提供一個(gè)可控的API,允許用戶(hù)控制要激活的功能,從而加速相應(yīng)的推理過(guò)程。推理過(guò)程的用時(shí)將被縮短,所需GPU內(nèi)存的減少也能節(jié)約成本。據(jù)官網(wǎng),Texel將使得運(yùn)行速度比標(biāo)準(zhǔn)解決方案提高10倍,同時(shí)降低90%的成本。圖表:使用Vanilla

PyTorch運(yùn)行Stable

Diffusion(左),比Texel

生成圖片(右)的速度慢資料:

Y

CombinatorWinter2023

Batch,中信建投26目

錄AI升級(jí)交互體驗(yàn),虛擬人和教育應(yīng)用場(chǎng)景廣闊前言海外相關(guān)應(yīng)用:AI聊天應(yīng)用Glow和其他產(chǎn)業(yè)鏈公司第一章第二章

國(guó)內(nèi)相關(guān)公司:新華網(wǎng)、藍(lán)色光標(biāo)等第三章

風(fēng)險(xiǎn)提示272.1

新華網(wǎng):子公司布局AIGC+虛擬人,發(fā)布元宇宙系統(tǒng)“元卯”

新華智云是由新華網(wǎng)和阿里巴巴成立的合資公司。新華智云科技有限公司主要布局媒體人工智能領(lǐng)域,核心產(chǎn)品包括17年12月發(fā)布的媒體人工智能平臺(tái)“媒體大腦”,開(kāi)始在媒體領(lǐng)域?qū)嵺`機(jī)器生產(chǎn)內(nèi)容(MGC),18年6月發(fā)布的短視頻智能生產(chǎn)平臺(tái)“媒體大腦·MAGIC”,進(jìn)一步推動(dòng)人工智能技術(shù)在媒體、文旅、金融等領(lǐng)域集成化、產(chǎn)品化、商業(yè)化的應(yīng)用。落地案例包括在18年兩會(huì)期間用15秒發(fā)布關(guān)于會(huì)議的MGC視頻新聞,在俄羅斯世界杯期間制作賽事播報(bào)視頻。

關(guān)注AIGC驅(qū)動(dòng)的元宇宙系統(tǒng)“元卯”表現(xiàn)。3月22日,公司發(fā)布全國(guó)首個(gè)AIGC驅(qū)動(dòng)的元宇宙系統(tǒng)“元卯”,結(jié)合AIGC模型和此前已多年實(shí)踐的機(jī)器生產(chǎn)內(nèi)容(MGC),幫助媒體、文旅、金融等企業(yè)實(shí)現(xiàn)元宇宙數(shù)字人、數(shù)字內(nèi)容、數(shù)字場(chǎng)景的智能化生產(chǎn),解決元宇宙內(nèi)容生產(chǎn)成本高、效率低的問(wèn)題。圖:新華智云推出的虛擬主播的部分應(yīng)用案例圖:新華智云已發(fā)布多個(gè)機(jī)器生成內(nèi)容(MGC)產(chǎn)品和解決方案產(chǎn)品及解決方案媒體大腦介紹中國(guó)第一個(gè)媒體人工智能平臺(tái)AI賦能媒體全流程智媒體融合平臺(tái)媒體大腦·MAGIC剪貝短視頻智能生產(chǎn)平臺(tái)移動(dòng)版MAGIC文旅智能傳播平臺(tái)云上新聞中心智能金融游客短視頻互動(dòng)體系會(huì)展賽智能傳播和數(shù)據(jù)服務(wù)中心金融內(nèi)容視頻解決方案短視頻數(shù)據(jù)服務(wù)商MCNDATA數(shù)芯媒體數(shù)據(jù)中臺(tái)28資料:新華智云官網(wǎng),海報(bào)新聞,江西新聞,新華網(wǎng),媒體大腦,中信建投2.2

藍(lán)色光標(biāo):虛擬人將接入文心一言,涉及與OpenAI合作

虛擬人“蘇小妹”等將接入百度文心一言。據(jù)投資者互動(dòng)易,藍(lán)色光標(biāo)旗下元宇宙營(yíng)銷(xiāo)場(chǎng)景解決方案公司藍(lán)色宇宙,將接入百度生成式對(duì)話模型文心一言,將智能對(duì)話技術(shù)應(yīng)用在AIGC營(yíng)銷(xiāo)場(chǎng)景,包括以“蘇小妹”為代表的虛擬人驅(qū)動(dòng)與實(shí)時(shí)對(duì)話能力升級(jí),及其他商業(yè)化解決方案,例如藍(lán)標(biāo)智播、分身有術(shù)、MEME等產(chǎn)品的生產(chǎn)創(chuàng)造。

將與OpenAI開(kāi)展技術(shù)產(chǎn)品合作。據(jù)藍(lán)色光標(biāo)官方公眾號(hào)及投資者互動(dòng)易,成為中國(guó)區(qū)官方代理商后,公司將與微軟開(kāi)展基于OpenAI的技術(shù)產(chǎn)品合作,讓出海客戶(hù)與海外消費(fèi)者更好地互動(dòng)。據(jù)藍(lán)色光標(biāo)官方公眾號(hào),公司提出了與GPT-4可能的合作方式,包括驅(qū)動(dòng)虛擬人的多模態(tài)個(gè)性化交互、生成、打造用于營(yíng)銷(xiāo)或社交的虛擬空間。圖表:虛擬IP“蘇小妹”是眉山數(shù)字代言人資料:紅星新聞,wind,中信建投292.3

捷成股份:參股公司世優(yōu)科技旗下數(shù)字人已接入ChatGPT,具備眾多應(yīng)用場(chǎng)景

數(shù)字人已接入ChatGPT,可應(yīng)用在線下展廳、直播、電商等場(chǎng)景。據(jù)投資者互動(dòng)易,公司參股世優(yōu)科技的數(shù)字人,已經(jīng)接入ChatGPT,通過(guò)數(shù)字人自身的人設(shè)背景等相關(guān)數(shù)據(jù),對(duì)其進(jìn)行訓(xùn)練,并基于OpenAI來(lái)訓(xùn)練數(shù)字人專(zhuān)有大腦,形成個(gè)性化模型,未來(lái)擬應(yīng)用于線下展廳的AI講解介紹數(shù)字人、線上AI主播、AIGC快速短視頻系統(tǒng)、智能客服、電商等多個(gè)場(chǎng)景。

已為眾多頭部客戶(hù)打造數(shù)字人。世優(yōu)科技已經(jīng)為百度、央視網(wǎng)、海爾集團(tuán)、腦白金等頭部客戶(hù)定制數(shù)字人,用于品牌形象IP、智能助手等場(chǎng)景。其中,數(shù)字人“阿央”已經(jīng)接入世優(yōu)正在開(kāi)發(fā)的ChatGPT微信小程序——世優(yōu)數(shù)字人元宇宙。該程序可以展示排行靠前的熱門(mén)問(wèn)題,并通過(guò)接入ChatGPT后的世優(yōu)科技數(shù)字人進(jìn)行實(shí)時(shí)的內(nèi)容解答。圖表:世優(yōu)科技與央視網(wǎng)合作的數(shù)字人“阿央”圖表:世優(yōu)科技部分虛擬人案例類(lèi)型虛擬IP虛擬人所屬企業(yè)秋月華海爾兄弟白老頭、金老太小繆優(yōu)酷動(dòng)漫虛擬IP海爾集團(tuán)品牌形象IP腦白金品牌形象IP品牌形象品牌形象虛擬偶像虛擬數(shù)字人虛擬IPMUSINESS孵化音樂(lè)數(shù)字人世優(yōu)科技&北京女?huà)z數(shù)字人科技央視網(wǎng)女?huà)z阿央虛擬IP/AI助手?jǐn)?shù)字員工虛擬主播數(shù)字員工度曉曉百度虛擬AI助手AIYA百信銀行虛擬數(shù)字員工世優(yōu)科技&OST傳媒&頤姬娛樂(lè)川觀新聞虛擬數(shù)字員工幕蘭Mulan小觀資料:公司公眾號(hào),wind,中信建投302.4天娛數(shù)科:將借助ChatGPT及文心一言,提升直播交互能力

旗下“MetaSurfing-元享智能云平臺(tái)”接入ChatGPT,并已引入TikTok直播場(chǎng)景。公司旗下的虛擬人制作SaaS平臺(tái)“MetaSurfing-元享智能云平臺(tái)”,主要是為實(shí)現(xiàn)元宇宙人貨場(chǎng)的“批量化、短周期、低成本”制作,已應(yīng)用在TikTok跨境電商直播、虛擬主播直播互動(dòng)等場(chǎng)景。

1)形象制作:客戶(hù)通過(guò)關(guān)鍵詞與描述,即可實(shí)時(shí)生成符合直播與內(nèi)容生成的虛擬形象。

2)直播交互:該平臺(tái)已經(jīng)接入ChatGPT等智能機(jī)器模型,輸入商品的關(guān)鍵詞描述,就可在選定的對(duì)應(yīng)的直播平臺(tái),使用選定語(yǔ)種,一鍵完成7×24小時(shí)的無(wú)人值守直播。

將接入文心一言,提升虛擬人交互等能力。據(jù)公司公眾號(hào),MetaSurfing-元享智能云平臺(tái)也將接入百度文心一言,將智能對(duì)話技術(shù)應(yīng)用在元宇宙智能生產(chǎn),及公司旗下的天妤等全體虛擬數(shù)字人,提升公司在虛擬人交互體驗(yàn)、數(shù)字內(nèi)容制作效率、元宇宙創(chuàng)意空間等方面的生產(chǎn)能力。圖表:

MetaSurfing-元享智能云平臺(tái)制作虛擬人圖表:公司利用AIGC技術(shù)融合虛擬人直播場(chǎng)景資料:公司公眾號(hào),同花順財(cái)經(jīng),中信建投312.5

天下秀:AIGC有望改善虛擬文旅、社交領(lǐng)域的交互體驗(yàn)

與新華社發(fā)布“云游中國(guó)”,探索數(shù)字人+虛擬文旅。23年1月,天下秀與新華社共同發(fā)布文旅數(shù)字化云平臺(tái)“云游中國(guó)”,用戶(hù)可定義自身虛擬數(shù)字人形象、購(gòu)買(mǎi)數(shù)字藏品裝扮、劇情化游覽虛擬景點(diǎn)等。天下秀將提供AI交互及數(shù)字孿生、區(qū)塊鏈、虛擬現(xiàn)實(shí)、3D引擎等技術(shù)。我們認(rèn)為,新華智云AIGC驅(qū)動(dòng)的元宇宙系統(tǒng)“元卯”發(fā)布,也有望為“云游中國(guó)”平臺(tái)提供數(shù)字人、數(shù)字內(nèi)容、數(shù)字場(chǎng)景的智能化生產(chǎn),從而進(jìn)一步提升用戶(hù)的虛擬文旅體驗(yàn)。

有望改善“虹宇宙”內(nèi)虛擬社交體驗(yàn)。天下秀于21年12月內(nèi)測(cè)元宇宙社交應(yīng)用虹宇宙,據(jù)公司公告,截至22年6月底累計(jì)用戶(hù)已超50萬(wàn),用戶(hù)可通過(guò)自定義虛擬形象,在平臺(tái)內(nèi)社交互動(dòng)、收藏?cái)?shù)字藏品等。后續(xù)AIGC的引入,有望豐富虹宇宙內(nèi)的虛擬內(nèi)容供給、讓NPC與用戶(hù)的互動(dòng)更智能化,從而改善社交體驗(yàn)。圖表:云游中國(guó)圖表:虹宇宙資料:齊魯壹點(diǎn),和訊網(wǎng),虹宇宙,中信建投322.6

其他虛擬人相關(guān)公司

遙望科技:虛擬人與AIGC運(yùn)用在直播領(lǐng)域。據(jù)投資者互動(dòng)易,公司旗下數(shù)字虛擬人孔襄已較為成熟,在和廣告代言方面已經(jīng)開(kāi)展了商業(yè)化變現(xiàn)。公司規(guī)劃在2023年發(fā)力虛擬人直播等業(yè)務(wù),計(jì)劃利用公司過(guò)往積淀的技術(shù)優(yōu)勢(shì),實(shí)現(xiàn)高效率低成本的AIGC內(nèi)容生成。公司關(guān)于利用GPT技術(shù)框架做直播帶貨的AIGC生成,目前正處于研究階段。

風(fēng)雨筑:將接入ChatGPT與文心一言,提升虛擬人在展館等場(chǎng)景的交互體驗(yàn)。據(jù)投資者互動(dòng)易,公司已探索AI在虛擬展廳、虛擬數(shù)字人、虛擬場(chǎng)景及數(shù)字藝術(shù)創(chuàng)作領(lǐng)域的應(yīng)用。虛擬數(shù)字人方面,1)公司目前正嘗試將打造的數(shù)字人接入ChatGPT,以強(qiáng)化數(shù)字虛擬人的場(chǎng)景識(shí)別和更新能力;2)也將把接入“文心一言”,支撐AI驅(qū)動(dòng)數(shù)字人多模態(tài)交互識(shí)別感知和分析決策功能,為線上元宇宙空間里的數(shù)字人導(dǎo)覽以及線下沉浸式場(chǎng)景中的VR/AR內(nèi)容、對(duì)話交互等環(huán)節(jié)提供AI能力支撐,打造更有趣的互動(dòng)交互體驗(yàn)。

凡拓?cái)?shù)創(chuàng):將接入文心一言,驅(qū)動(dòng)虛擬人及展館交互體驗(yàn)。與風(fēng)語(yǔ)筑類(lèi)似,凡拓?cái)?shù)創(chuàng)也接入“文心一言”,以AI驅(qū)動(dòng)數(shù)字人多模態(tài)交互識(shí)別感知和分析決策功能,讓虛擬人實(shí)現(xiàn)能聽(tīng)、能答、能學(xué)習(xí)。此外,文心一言也可運(yùn)用在公司的數(shù)智展館,打造更沉浸場(chǎng)景、更智能交互的VR/AR導(dǎo)覽新體驗(yàn)。資料:投資者互動(dòng)易,中信建投332.7

湯姆貓:核心“湯姆貓”IP與GPT能力結(jié)合,開(kāi)發(fā)親子互動(dòng)產(chǎn)品

核心IP在家庭娛樂(lè)和親子互動(dòng)領(lǐng)域具備高知名度。湯姆貓以親子品牌會(huì)說(shuō)話的湯姆貓家族IP為核心,打造了《會(huì)說(shuō)話的湯姆貓》等超20款線上休閑益智移動(dòng)應(yīng)用,具備模仿人類(lèi)說(shuō)話、對(duì)用戶(hù)的觸摸/拍打做出即時(shí)反應(yīng)、打電話與玩家互動(dòng)等玩法。據(jù)投資者問(wèn)答,截至23年3月,湯姆貓系列移動(dòng)應(yīng)用產(chǎn)品累計(jì)下載量超200億人次,全球月活數(shù)超4億,其中超80%的活躍用戶(hù)來(lái)自海外。

籌集資金,加大AI教育相關(guān)產(chǎn)品、模型等投入。公司在23年2月發(fā)布公告,計(jì)劃通過(guò)非公開(kāi)發(fā)行股票籌集資金,用于投向通用人工智能交互終端產(chǎn)品研發(fā)、預(yù)訓(xùn)練語(yǔ)言模型的自建與接入、IDC算力基礎(chǔ)設(shè)施建設(shè)。其中預(yù)訓(xùn)練語(yǔ)言模型將圍繞公司擅長(zhǎng)的情感陪伴、教育類(lèi)等垂直領(lǐng)域,并接入公司研發(fā)的人工智能交互終端產(chǎn)品及第三方機(jī)構(gòu)的通識(shí)大模型。圖表:會(huì)聊天的湯姆貓測(cè)試效果

“湯姆貓”接入GPT模型,提升產(chǎn)品交互體驗(yàn)。據(jù)投資者問(wèn)答,公司已嘗試應(yīng)用GPT-3.5模型進(jìn)行AI語(yǔ)音互動(dòng)產(chǎn)品功能原型測(cè)試,并已將湯姆貓IP形象植入產(chǎn)品功能原型,加入語(yǔ)音識(shí)別、語(yǔ)音合成、性格設(shè)定、內(nèi)容過(guò)濾等功能。公司也已接入ChatGPT

API進(jìn)行測(cè)試,獲得了更快的響應(yīng)速度和更豐富語(yǔ)句表達(dá),當(dāng)前正著手開(kāi)發(fā)正式產(chǎn)品。據(jù)IT之家,基于ChatGPT的《會(huì)聊天的湯姆貓》,已開(kāi)啟安卓端功能原型封閉式測(cè)試,可完成語(yǔ)音識(shí)別、寫(xiě)小作文、情緒表達(dá)等能力。資料:IT之家,wind,中信建投342.8

奧飛娛樂(lè):參股布局對(duì)話機(jī)器人,適用于教育場(chǎng)景

參股公司布局對(duì)話機(jī)器人。據(jù)投資者互動(dòng)易,奧飛娛樂(lè)持股5%的人工智能公司光年無(wú)限,擁有AI對(duì)話機(jī)器人

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論