Sora模型橫空出世　AI產(chǎn)業(yè)鏈變革加速

上傳人：f*** IP屬地：山東上傳時(shí)間：2025-03-05 格式：DOCX 頁數(shù)：5 大?。?0.63KB 積分：6 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Sora模型橫空出世AI產(chǎn)業(yè)鏈變革加速人工智能在文生視頻領(lǐng)域取得新突破。北京時(shí)間2月16日，OpenAI發(fā)布文生視頻模型Sora，該模型可根據(jù)簡(jiǎn)單提示詞，生成長(zhǎng)達(dá)1分鐘的高清短視頻，雖然仍處于面向測(cè)試者開放的狀態(tài)，但較此前行業(yè)視頻長(zhǎng)度大幅提升，文生視頻進(jìn)入新階段。受此消息刺激，在2月19日開盤后，AI板塊相關(guān)股票持續(xù)大漲，中文在線、易點(diǎn)天下、果麥文化、當(dāng)虹科技、因賽集團(tuán)、博匯科技、萬興科技、海天瑞聲、絲路視覺等以20%幅度漲停，虹軟科技、昆侖萬維、拓爾思、恒新東方、東方國信、數(shù)碼視訊、讀客文化等大漲逾10%。CPO概念、算力股也隨之走強(qiáng)，中際旭創(chuàng)、天孚通信、新易盛和聯(lián)特科技均以20%幅度漲停，太辰光、德科立、羅博特科、光庫科技、博創(chuàng)科技和曙光數(shù)創(chuàng)等均漲超10%。當(dāng)然，在提供驚艷文生視頻的同時(shí)，Sora也提供了一些翻車的案例，即便是驚艷的案例，細(xì)究之下，個(gè)別產(chǎn)品與真實(shí)世界也存在邏輯難以自洽的部分，有時(shí)其不足在于難以模擬現(xiàn)實(shí)世界中的物理規(guī)律，且對(duì)于事物發(fā)生的因果、時(shí)序和空間關(guān)系也理解不足，例如模型能夠生成一個(gè)人咬一口餅干，但餅干可能沒有咬痕；模型可能在某些視頻中混淆左右，而且可能難以精確描述隨著時(shí)間推移而發(fā)生的事件，例如跟蹤特定的相機(jī)軌跡等，但不可否認(rèn)其遠(yuǎn)超同行同類產(chǎn)品。與Pika、Run、Runway等AI文生視頻工具相比，Sora不僅具有完成視頻向前擴(kuò)展、視頻拼接等更加復(fù)雜的任務(wù)的能力，還能通過多鏡頭等方式帶來更加生動(dòng)的多視角視頻，同時(shí)在生成視頻的時(shí)長(zhǎng)、流暢度和邏輯性等方面優(yōu)勢(shì)顯著。國投證券認(rèn)為，Sora生成的內(nèi)容在視頻尺寸和時(shí)長(zhǎng)、多模擬的視頻生成能力、靈活擴(kuò)展和真實(shí)模擬能力等方面均實(shí)現(xiàn)了超越。Sora能夠制作各種尺寸的視頻，從寬屏的1920×1080到豎屏的1080×1920，同時(shí)攜有更好的構(gòu)圖效果，生成時(shí)間也從其他模型的4秒提升至最高的60秒；其次，除了文生視頻外，Sora還能圖生視頻、視頻生視頻等，具備豐富的多模態(tài)視頻生成能力；再次，Sora還能將視頻沿時(shí)間線向前或向后擴(kuò)展，Demo中的視頻都是從一個(gè)視頻片段開始，向時(shí)間線的過去延伸，盡管開頭各自不同，但最終都會(huì)匯聚于同一個(gè)結(jié)尾；最后，Sora可以創(chuàng)造出帶有動(dòng)態(tài)視角變化的視頻，讓人物和場(chǎng)景元素在三維空間中的移動(dòng)看起來十分自然。Sora基于擴(kuò)散模型，并且在其中使用了Transfoumer架構(gòu)，將視頻和圖像分解為Patch小數(shù)據(jù)單元，這些Patch類似于GPT中的Token，用于在Transfoumer模型中進(jìn)行訓(xùn)練和生成，同時(shí)OpenAI將DALL.E3引入到Sora里，使得Sora能夠精準(zhǔn)地還原用戶的文本提示，生成高質(zhì)量的長(zhǎng)視頻?；趶?qiáng)大的GPT和DALL.E模型，Sora在訓(xùn)練過程中完成了文本和視頻模態(tài)的“對(duì)齊”，從而能夠理解提示中的詞匯含義，并能夠?qū)⑵鋵?duì)應(yīng)到視頻中的事物上，大大提升了生成視頻的準(zhǔn)確性。中泰證券認(rèn)為，OpenAI采用的合成數(shù)據(jù)方式在大幅提升模型效果的同時(shí)，相似風(fēng)格的文本prompt也能夠提升Sora與GPT、DALL.E的聯(lián)動(dòng)效果，使得Sora更接近一個(gè)“全能”的多模態(tài)模型。在下游應(yīng)用端，文生視頻的突破將對(duì)文字、影視及游戲等娛樂行業(yè)帶來巨大的變化。Sora模型推出帶來視頻內(nèi)容供給領(lǐng)域生產(chǎn)力的躍升，傳統(tǒng)視頻制作往往需要投入大量人力、物力和時(shí)間成本，通過利用Sora模型，創(chuàng)作者可以快速、高效的生成視頻，極大降低產(chǎn)出成本。另一方面，Sora的編輯和擴(kuò)展能力為創(chuàng)作者的靈活提供了空間，將進(jìn)一步提高內(nèi)容產(chǎn)出的創(chuàng)新性和多樣性。此外，IP版權(quán)公司積累的IP形態(tài)以文字、卡通人物形象等為主，文生視頻模型可幫助此類公司迅速產(chǎn)出終端視頻，業(yè)務(wù)范圍將得到極大擴(kuò)展，運(yùn)營(yíng)效率將發(fā)生極大躍升?？紤]到Sora模型的可得性，文生視頻的應(yīng)用會(huì)最先在海外落地，Sora強(qiáng)大的視頻生成能力將助力IP版權(quán)、出海廣告營(yíng)銷等公司快速制作符合國際時(shí)長(zhǎng)的視頻內(nèi)容，吸引海外用戶，實(shí)現(xiàn)海外業(yè)務(wù)擴(kuò)張并增厚業(yè)績(jī)表現(xiàn)。太平洋證券認(rèn)為，AI多模態(tài)技術(shù)突破將降低文字、圖片、音視頻和游戲內(nèi)容空間相互轉(zhuǎn)化的門檻，提高AI工具輔助內(nèi)容生產(chǎn)的比例，內(nèi)容資產(chǎn)價(jià)值有望得到重估。最低維的內(nèi)容形式即文字類內(nèi)容，且擁有內(nèi)容數(shù)量多及質(zhì)量高的公司彈性最大。文字作為最低維的內(nèi)容升維空間最大，有望全面受益于內(nèi)容資產(chǎn)價(jià)值重估，而網(wǎng)絡(luò)文學(xué)的娛樂性足，因此其商業(yè)化空間最大；圖片、音視頻和游戲類資產(chǎn)也需要關(guān)注，圖片類資產(chǎn)主要包含視覺內(nèi)容和形象IP，音視頻資產(chǎn)主要包含動(dòng)漫、影視作品等。華泰證券認(rèn)為，“Sora+影視”預(yù)計(jì)能明顯降低制作門檻及成本，且可以極大程度豐富影視的創(chuàng)造性及風(fēng)格，Sora的出現(xiàn)將重塑影視行業(yè)，預(yù)計(jì)擁有核心導(dǎo)演或創(chuàng)意人才及IP資源的公司更受益；“Sora+營(yíng)銷”預(yù)計(jì)將提升廣告相關(guān)視頻的創(chuàng)造效率，提供靈感、增強(qiáng)廣告吸引力，有望部分替代低創(chuàng)造性、可復(fù)制的視頻內(nèi)容，同時(shí)也能低成本、定制化、大批量快速生成視頻內(nèi)容，提升客戶轉(zhuǎn)換及留存率。在AI內(nèi)容生產(chǎn)工具上，生成高維內(nèi)容資產(chǎn)的生產(chǎn)工具價(jià)值更高，視頻工具在海外公司表現(xiàn)突出，國內(nèi)公司亦有布局；音頻工具方面?zhèn)€別大廠和中小公司也有涉足，游戲工具方面也有兩家上市公司切入。游戲是AIGC技術(shù)最復(fù)雜、應(yīng)用前景最廣闊的方向之一。據(jù)OpenAI的報(bào)告，Sora可進(jìn)行游戲場(chǎng)景的生成，同時(shí)可以高保真的方式渲染環(huán)境，甚至模擬玩家操作游戲的情景。華金證券認(rèn)為，Sora的出現(xiàn)或?qū)⒔档陀螒駽G、PV的制作成本，而低成本的視頻內(nèi)容有利于豐富游戲劇情的展現(xiàn)和表達(dá)。因此，成熟的文生視頻技術(shù)整合或?qū)樽⒅貎?nèi)容和交互的游戲作品更好地提質(zhì)增效，為受眾用戶提供更好的情緒價(jià)值，從而提升用戶體驗(yàn)，加速科技表現(xiàn)。梳理AIGC產(chǎn)業(yè)鏈，主要?jiǎng)澐譃樯嫌危〝?shù)據(jù)、算力）、中游（算法、模型）、下游（應(yīng)用）。上游主要包含數(shù)據(jù)平臺(tái)、提供數(shù)據(jù)和算力層、提供底層支持；中游為算法層，在原始數(shù)據(jù)的基礎(chǔ)上進(jìn)行模型的訓(xùn)練與再開發(fā)；下游為應(yīng)用層，包含內(nèi)容生產(chǎn)和分發(fā)量方面，應(yīng)用場(chǎng)景豐富，包含出行、社交、辦公、搜索、娛樂、居住、教育、生產(chǎn)、管理、金融和醫(yī)療等11個(gè)大場(chǎng)景、37個(gè)細(xì)分場(chǎng)景。不同的場(chǎng)景也存在不同的機(jī)會(huì)。國投證券認(rèn)為，未來可以從三個(gè)維度進(jìn)行布局：1.布局可以利用視頻等算法打造創(chuàng)作工具的產(chǎn)業(yè)；2.布局算力相關(guān)企業(yè)，文生視頻必然帶來算力需求的進(jìn)一步提升，服務(wù)器、IDC也值得關(guān)注；3.布局已經(jīng)有產(chǎn)品落地的AI核心標(biāo)的。根據(jù)華西證券推算，Sora架構(gòu)的訓(xùn)練與傳統(tǒng)大語言模型（LLM）Transfoumer架構(gòu)的訓(xùn)練算力需求存在近百倍的差距，算力需求有望持續(xù)呈現(xiàn)幾何規(guī)模的倍增，同時(shí)在信創(chuàng)和AI的大背景下，國產(chǎn)算力有望大放異彩。算力包含單體GPU的性能和群體數(shù)據(jù)中心的性能，算力的提升需要大寬帶的支撐。Sora模型的問世使得ALGC在視頻領(lǐng)域的應(yīng)用得以大大拓寬，文生視頻的突破將對(duì)文字、影視及游戲等娛樂行業(yè)帶來巨大的變化，算力需求有望進(jìn)一步爆發(fā)。面向單體GPU，通信帶寬越大，GPU之間的數(shù)據(jù)交換速度越快，模型也就更快地訓(xùn)練出來；面向數(shù)據(jù)中心，低延遲、高帶寬以及可擴(kuò)展性滿足大規(guī)模計(jì)算和數(shù)據(jù)傳輸?shù)男枨?，需要不斷的升?jí)架構(gòu)、采取先進(jìn)的協(xié)議以支持更大的接口帶寬。光模塊也將充分受益Sora的問世。華金證券認(rèn)為，模型應(yīng)用端的爆發(fā)以及新型算力的涌現(xiàn)不僅將加速硬件尤其是網(wǎng)絡(luò)端設(shè)備的升級(jí)更新，甚至?xí)?qū)動(dòng)LPO＼CPO等新型光模塊等網(wǎng)絡(luò)設(shè)備的落地。Sora采用了改良的DiT架構(gòu)，算力消耗和DiT相仿，DiTs遵循VisionTransformers的設(shè)計(jì)原則，與傳統(tǒng)的卷積網(wǎng)絡(luò)相比，它能提供更強(qiáng)的靈活性。根據(jù)DiT架構(gòu)論文原作者判斷，Sora的參數(shù)量大約在30億左右，因此更有利于Sora后續(xù)更好的靈活替代性

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

Sora模型橫空出世　AI產(chǎn)業(yè)鏈變革加速

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

Sora模型橫空出世 AI產(chǎn)業(yè)鏈變革加速

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

Sora模型橫空出世　AI產(chǎn)業(yè)鏈變革加速