版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
CS330MIP–Lecture16視頻信息處理Video
ProcessingLecture16ContentsReview
ofLecture15視頻視頻信息處理7個(gè)里程碑Lecture16ContentsReview
ofLecture15視頻視頻信息處理7個(gè)里程碑視頻視頻是泛指將動(dòng)態(tài)影像以電信號(hào)方式加以捕捉、紀(jì)錄、處理、存儲(chǔ)、發(fā)送與重現(xiàn)的各種技術(shù)。視頻最初是為機(jī)械電視系統(tǒng)開發(fā)的,該系統(tǒng)很快被陰極射線管(CRT)系統(tǒng)取代,而陰極射線管系統(tǒng)又被幾種類型的平板顯示器所取代?!耙曨l(Video)泛指將一系列靜態(tài)影像以電信號(hào)的方式加以捕捉、紀(jì)錄、處理、儲(chǔ)存、傳送與重現(xiàn)的各種技術(shù)。連續(xù)的圖像變化每秒超過24幀(frame)畫面以上時(shí),根據(jù)視覺暫留原理,人眼無法辨別單幅的靜態(tài)畫面;看上去是平滑連續(xù)的視覺效果,這樣連續(xù)的畫面叫做視頻。視頻技術(shù)最早是為了電視系統(tǒng)而發(fā)展,但現(xiàn)在已經(jīng)發(fā)展為各種不同的格式以利消費(fèi)者將視頻記錄下來。網(wǎng)絡(luò)技術(shù)的發(fā)達(dá)也促使視頻的紀(jì)錄片段以串流媒體的形式存在于因特網(wǎng)之上并可被電腦接收與播放。Question1:動(dòng)畫與視頻的區(qū)別?視頻與動(dòng)畫動(dòng)畫視頻創(chuàng)作方式手工繪制或計(jì)算機(jī)生成的方式來創(chuàng)建圖像序列,圖像可以是完全虛構(gòu)的,也可以是基于現(xiàn)實(shí)物體的夸張或變形。實(shí)際拍攝來獲取連續(xù)的圖像序列,圖像可以是真實(shí)的場(chǎng)景、人物或物體,記錄現(xiàn)實(shí)世界的動(dòng)態(tài)變化技術(shù)需求需要依賴?yán)L畫、數(shù)字技術(shù)、攝影等多種技術(shù)手段和設(shè)備進(jìn)行創(chuàng)作和制作需要依賴攝像機(jī)、錄音設(shè)備、編輯軟件等技術(shù)手段和設(shè)備進(jìn)行拍攝和制作特點(diǎn)能夠創(chuàng)造出非現(xiàn)實(shí)世界的動(dòng)態(tài)畫面,具有表現(xiàn)性和藝術(shù)性??梢杂酶鼜?qiáng)的表現(xiàn)力和想象力,通過夸張、變形等手法來表現(xiàn)事物,給觀眾帶來不同的視覺體驗(yàn)。能夠真實(shí)、全面地記錄現(xiàn)實(shí)中的相關(guān)信息,具有紀(jì)實(shí)性和真實(shí)性視頻的基本屬性分辨率視頻中圖像的清晰度和細(xì)節(jié)程度。它通常用水平像素?cái)?shù)量乘以垂直像素?cái)?shù)量表示,如1920x1080。更高的分辨率意味著更清晰的圖像,但也會(huì)占用更多的存儲(chǔ)空間和傳輸帶寬幀率視頻中每秒顯示的圖像幀數(shù),通常以幀每秒(FPS)表示。較高的幀率可以使視頻更加流暢,特別是在快速運(yùn)動(dòng)或動(dòng)作場(chǎng)景中。標(biāo)準(zhǔn)視頻幀率為24、25或30FPS,但在某些情況下,如電影制作和游戲,可能會(huì)使用更高的幀率長寬比視頻圖像的寬度與高度之比。常見的長寬比包括16:9(高清電視和大多數(shù)網(wǎng)絡(luò)視頻)、4:3(標(biāo)準(zhǔn)電視)和2.35:1(影院電影)等。選擇合適的長寬比可以更好地適應(yīng)不同的顯示設(shè)備和觀看環(huán)境Lecture16ContentsReview
ofLecture15視頻視頻信息處理7個(gè)里程碑視頻信息處理7個(gè)里程碑模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG-4)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024視頻處理發(fā)展里程碑1-模擬視頻模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024模擬視頻模擬視頻是指由連續(xù)的模擬信號(hào)組成的視頻圖像。攝像機(jī)是獲取視頻信號(hào)的來源,早期的攝像機(jī)以電子管作為光電轉(zhuǎn)換器件,把外界的光信號(hào)轉(zhuǎn)換為電信號(hào)。被拍攝物體的不同亮度對(duì)應(yīng)于不同的亮度值,攝像機(jī)電子管中的電流會(huì)發(fā)生相應(yīng)的變化。模擬信號(hào)就是利用這種電流的變化來表示或者模擬所拍攝的圖像,記錄下它們的光學(xué)特征,然后通過調(diào)制和解調(diào),將信號(hào)傳輸給接收機(jī),再通過電子槍顯示在熒光屏上,還原成原來的光學(xué)圖像。這就是電視廣播的基本原理和過程。PAL制式為了克服NTSC制對(duì)相位失真的敏感性,1962年,前聯(lián)邦德國在綜合NTSC制的技術(shù)基礎(chǔ)上研制出來一種改進(jìn)方案PAL(PhaseAlterationLine)制,意思是逐行倒相,它對(duì)同時(shí)傳送的兩個(gè)色差信號(hào)中的一個(gè)色差信號(hào)采用逐行倒相,另一個(gè)色差信號(hào)進(jìn)行正交調(diào)制方式,這樣,如果在信號(hào)傳輸過程中發(fā)生相位失真,則會(huì)由于相鄰兩行信號(hào)的相位相反起到互相補(bǔ)償作用,從而有效地克服了因相位失真而起的色彩變化。因此,PAL制對(duì)相位失真不敏感,圖像彩色誤差較小,與黑白電視的兼容也好。PAL制式視頻處理發(fā)展里程碑2-數(shù)字視頻模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024數(shù)字視頻數(shù)字視頻就是以數(shù)字形式記錄的視頻,和模擬視頻相對(duì)的。數(shù)字視頻有不同的產(chǎn)生方式,存儲(chǔ)方式和播出方式。比如通過數(shù)字?jǐn)z像機(jī)直接產(chǎn)生數(shù)字視頻信號(hào),存儲(chǔ)在數(shù)字帶,藍(lán)光盤或者磁盤上,從而得到不同格式的數(shù)字視頻。然后通過特定的播放器播放出來。CCIR60120世紀(jì)80年代初期,各數(shù)字電視制造商采用各自的專有數(shù)字標(biāo)準(zhǔn),為統(tǒng)一標(biāo)準(zhǔn),國際電信聯(lián)盟制定了CCIR601。該標(biāo)準(zhǔn)使用YCbCr色彩空間,即將顏色信息分為亮度(Y)和兩個(gè)色度分量(藍(lán)色色度Cb和紅色Cr),能夠更高效地壓縮圖像數(shù)據(jù)。CCIR601標(biāo)準(zhǔn)中,亮度信號(hào)(Y)的采樣頻率為13.5MHz,這是一個(gè)與所有主要模擬電視系統(tǒng)(如NTSC和PAL)行頻率的公倍數(shù),這種設(shè)計(jì)使得數(shù)字視頻信號(hào)在不同系統(tǒng)之間具有良好的兼容性和一致性。CCIR601確保了高質(zhì)量的視頻傳輸和存儲(chǔ),廣泛應(yīng)用于電視廣播和專業(yè)視頻制作中?。模擬視頻與數(shù)字視頻模擬視頻數(shù)字視頻數(shù)據(jù)表示以連續(xù)波形形式傳輸信號(hào),信號(hào)的幅度和頻率可以隨時(shí)間連續(xù)變化。以離散的數(shù)字信號(hào)方式表示、存儲(chǔ)、處理和傳輸?shù)囊曨l信息存儲(chǔ)需求需要依賴模擬設(shè)備和介質(zhì),如錄像帶、模擬電視信號(hào)等通過數(shù)字存儲(chǔ)媒體(如硬盤、光盤等)進(jìn)行存儲(chǔ)應(yīng)用領(lǐng)域傳統(tǒng)的電視廣播、錄像帶等領(lǐng)域廣泛應(yīng)用于數(shù)字媒體、互聯(lián)網(wǎng)、移動(dòng)設(shè)備、監(jiān)控安防等領(lǐng)域。隨著數(shù)字技術(shù)的不斷發(fā)展,數(shù)字視頻的應(yīng)用范圍也在不斷擴(kuò)展數(shù)字視頻的優(yōu)勢(shì)模擬視頻數(shù)字視頻兼容性不同系統(tǒng)之間兼容性差,如NTSC、PAL和SECAM系統(tǒng)之間互不兼容具有較好的兼容性,可以在不同設(shè)備和平臺(tái)之間輕松傳輸和播放抗干擾性圖像質(zhì)量容易受到電磁干擾和信號(hào)衰減影響,長距離傳輸信號(hào)質(zhì)量會(huì)下降具有較高的抗干擾能力,長距離傳輸時(shí)信號(hào)質(zhì)量幾乎不會(huì)下降可復(fù)制性模擬視頻信號(hào)每轉(zhuǎn)錄一次,就會(huì)有一次誤差積累,產(chǎn)生信號(hào)失真數(shù)字視頻可以進(jìn)行無數(shù)次的復(fù)制而不失真壓縮與文件大小通常不使用壓縮,傳輸和存儲(chǔ)需要較大的帶寬和空間可以使用多種壓縮算法(如MPEG、H.264)來減小文件大小,提高存儲(chǔ)效率可編輯性編輯和處理能力相對(duì)有限,通常需要使用專業(yè)的設(shè)備和軟件可以通過數(shù)字化設(shè)備進(jìn)行編輯處理,更加靈活視頻處理發(fā)展里程碑3-數(shù)字視頻壓縮模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG-4)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024MPEG視頻數(shù)據(jù)流層次結(jié)構(gòu)序列層一個(gè)視頻數(shù)據(jù)可看作一系列運(yùn)動(dòng)圖像所組成的視頻序列,包含了全局參數(shù):如寬高、幀率、碼率等圖像組層為隨機(jī)播放、視頻編輯以及分?jǐn)?shù)幀率提供支持。圖像組由多個(gè)連續(xù)的圖像幀組成,可以根據(jù)需要進(jìn)行調(diào)整。 圖片層單個(gè)圖像幀,被分為不同類型(I幀、P幀或B幀),每種幀類型都有其特定的編碼方式和作用。圖片切片層將單個(gè)圖像幀進(jìn)一步切片,用于并行處理和錯(cuò)誤恢復(fù)。宏塊層運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償?shù)幕締挝?。在這一層,編碼器會(huì)對(duì)宏塊進(jìn)行運(yùn)動(dòng)估計(jì)和補(bǔ)償,以消除視頻中的時(shí)間冗余?;緣K層視頻數(shù)據(jù)被進(jìn)一步分解為更小的塊(如8x8像素的塊),并進(jìn)行DCT(離散余弦變換)和量化等處理。視頻流圖像組視頻流的基本單位是“圖像組”(GOP),由三種幀組成:I、P和BI幀:可以在不參考其他幀的情況下進(jìn)行重建P幀:通過上一I幀和P幀的運(yùn)動(dòng)補(bǔ)償進(jìn)行前向預(yù)測(cè)B幀:通過運(yùn)動(dòng)補(bǔ)償進(jìn)行前后雙向預(yù)測(cè)IPB幀I幀:通常是每個(gè)GOP的第一幀,其壓縮基于幀內(nèi)編碼(如JPEG技術(shù)),不依賴于其他幀。壓縮率相對(duì)較低,但質(zhì)量較高。P幀:編碼依賴于前一個(gè)I幀或P幀。編碼時(shí),P幀計(jì)算當(dāng)前幀和參考幀之間的殘差與運(yùn)動(dòng)矢量,并將這兩部分進(jìn)行壓縮。P幀的壓縮率通常比I幀更高。B幀:使用前后兩個(gè)參考幀(I幀或P幀)進(jìn)行雙向預(yù)測(cè)。編碼器會(huì)同時(shí)考慮前后兩個(gè)參考幀。B幀的壓縮率通常是最高的。視頻流圖像組MPEG編碼與解碼中,圖片的編碼和解碼順序與顯示順序不同:?源順序和編碼器輸入順序:I(1)B(2)B(3)P(4)B(5)B(6)P(7)B(8)B(9)P(10)B(11)B(12)I(13)?編碼順序和編碼比特流中的順序:I(1)P(4)B(2)B(3)P(7)B(5)B(6)P(10)B(8)B(9)I(13)B(11)B(12)?解碼器輸出順序和顯示順序(與輸入相同):I(1)B(2)B(3)P(4)B(5)B(6)P(7)B(8)B(9)P(10)B(11)B(12)I(13)MPEG系列標(biāo)準(zhǔn)MPEG-1&MPEG-2?MPEG-1:最常見的實(shí)現(xiàn)方式是每秒30fps,分辨率352×240,視頻質(zhì)量略低于傳統(tǒng)VCR視頻的質(zhì)量。VCD使用MPEG-1。?MPEG-2:視頻為60fps,分辨率為720x480或1280x720,音頻為CD質(zhì)量。這足以滿足包括NTSC在內(nèi)的所有主要電視標(biāo)準(zhǔn),甚至是HDTV。DVD-ROM使用MPEG-2。MPEG-2可以將2小時(shí)的視頻壓縮到幾GB。雖然解壓縮MPEG-2數(shù)據(jù)流不需要很高的計(jì)算力,但編碼需要明顯更多的處理能力。?MPEG-3:為HDTV設(shè)計(jì),但被MPEG-2取代。MPEG-4標(biāo)準(zhǔn)1998年10月推出的運(yùn)動(dòng)圖像壓縮MPEG-4標(biāo)準(zhǔn)是一套用于視頻等信息的壓縮編碼標(biāo)準(zhǔn),也是一種壓縮格式。這一標(biāo)準(zhǔn)將視頻這一融合多種多媒體模態(tài)的表現(xiàn)形式推向了多媒體的前沿。MPEG-4格式的主要針對(duì)網(wǎng)絡(luò)流傳輸、光盤、語音發(fā)送,視頻電話,以及電視廣播應(yīng)用場(chǎng)景。相較于之前的MPEG1和MPEG2,MPEG-4有更高的交互性及靈活性。MPEG-4技術(shù)的標(biāo)準(zhǔn)是對(duì)運(yùn)動(dòng)圖像中的內(nèi)容進(jìn)行編碼,其具體的編碼對(duì)象就是圖像中的“AV對(duì)象”即音頻和視頻。當(dāng)連續(xù)的AV對(duì)象組合在一起,我們稱之為AV場(chǎng)景。MPEG-4技術(shù)MPEG-4拓展了視頻變換編碼、視頻運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償、量化技術(shù)、熵編碼技術(shù),也實(shí)現(xiàn)了基于內(nèi)容交互。MPEG-4通過引入基于對(duì)象的編碼方式,成功實(shí)現(xiàn)了視頻和視頻中音頻、圖像、文本等多種媒體類型的融合。這種基于對(duì)象的編碼方式是MPEG-4視頻編碼的關(guān)鍵技術(shù),它使得MPEG-4能夠針對(duì)特定的媒體對(duì)象采用有針對(duì)性的編碼策略,從而在保證高效壓縮空間的同時(shí),最大程度地保留了原媒體的特性。MPEG-4影響-融媒體MPEG-4標(biāo)準(zhǔn)的誕生,不僅帶來了視頻多媒體處理技術(shù)的全新時(shí)代,更在技術(shù)上實(shí)現(xiàn)了真正意義上的融媒體創(chuàng)新。它不僅能夠提供高質(zhì)量的視頻壓縮效果,確保信息的有效傳遞與存儲(chǔ),而且更為重要的是,它支持音頻、圖像、文本等多種媒體類型的集成,實(shí)現(xiàn)了多媒體元素的深度融合。這種技術(shù)上的優(yōu)化使得視頻多媒體在表達(dá)形式和內(nèi)容上變得更為豐富多樣,為用戶帶來了更為沉浸式的體驗(yàn),進(jìn)一步推動(dòng)了多媒體產(chǎn)業(yè)的創(chuàng)新與發(fā)展。MPEG-7&MPEG-21MPEG-7:正式名稱為多媒體內(nèi)容描述接口,MPEG-7提供了一套用于完整描述多媒體內(nèi)容的工具集。MPEG-7被設(shè)計(jì)為通用的,而不是針對(duì)特定的應(yīng)用。?MPEG-21:包括權(quán)利表達(dá)語言(REL)和權(quán)利數(shù)據(jù)字典。與其他描述壓縮編碼方法的MPEG標(biāo)準(zhǔn)不同,MPEG-21描述了一個(gè)定義內(nèi)容描述以及訪問、搜索、存儲(chǔ)和保護(hù)內(nèi)容版權(quán)的過程的標(biāo)準(zhǔn)。視頻處理發(fā)展里程碑4-流媒體模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG-4)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024流媒體?流媒體技術(shù)的歷史可以追溯至20世紀(jì)90年代,實(shí)現(xiàn)音視頻內(nèi)容的實(shí)時(shí)傳輸和播放需求引發(fā)了流媒體技術(shù)的誕生。?1994年,RealNetworks的C/S架構(gòu)音頻接收系統(tǒng)RealAudio標(biāo)志著流媒體技術(shù)在互聯(lián)網(wǎng)上亮相,并引領(lǐng)了后來網(wǎng)絡(luò)流式技術(shù)的發(fā)展潮流。?流媒體通過離散余弦變換DCT或者M(jìn)PEG-4等算法將一連串的媒體數(shù)據(jù)壓縮后,利用流媒體緩沖技術(shù),在網(wǎng)上分段發(fā)送數(shù)據(jù),實(shí)現(xiàn)在線即時(shí)傳輸影音以供觀賞。?流媒體技術(shù)使得用戶無需下載整個(gè)媒體文件即可開始播放,只將開始部分內(nèi)容存入內(nèi)存,數(shù)據(jù)流隨時(shí)傳送隨時(shí)播放。流媒體iPod/iTunes2001年,蘋果發(fā)布了iPod,這是一款便攜式音樂播放器,它具有大容量的存儲(chǔ)空間,高品質(zhì)的音樂播放效果,和簡(jiǎn)約的外觀設(shè)計(jì),深受廣大消費(fèi)者喜愛。一同推出的還有媒體播放器iTunes,除播放數(shù)字音樂和視頻的功能外,還支持用戶管理自己的音樂和視頻庫,創(chuàng)建個(gè)性化的播放列表,以及從iTunesStore購買和下載音樂、電影和電視節(jié)目。iPod與iTunes的結(jié)合為用戶提供了無縫的媒體體驗(yàn),改變了人們享受音樂的方式,并對(duì)整個(gè)音樂產(chǎn)業(yè)產(chǎn)生了深遠(yuǎn)的影響。流媒體的技術(shù)基礎(chǔ)壓縮編碼視頻編碼:使用如H.264、H.265(HEVC)等視頻編碼標(biāo)準(zhǔn),將原始視頻數(shù)據(jù)壓縮以減少帶寬需求音頻編碼:使用如AAC、MP3等音頻編碼標(biāo)準(zhǔn)對(duì)音頻數(shù)據(jù)進(jìn)行壓縮緩存技術(shù)客戶端緩存:在用戶設(shè)備上臨時(shí)存儲(chǔ)部分視頻數(shù)據(jù),常見的緩存策略包括預(yù)加載、緩沖區(qū)管理等內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)緩存:在多個(gè)地理位置分布服務(wù)器緩存視頻內(nèi)容傳輸協(xié)議HTTPLiveStreaming(HLS):由Apple開發(fā),通過將視頻分割成小段并通過HTTP傳輸,實(shí)現(xiàn)流媒體播放。DynamicAdaptiveStreamingoverHTTP(DASH):一種開放標(biāo)準(zhǔn),類似于HLS,通過動(dòng)態(tài)調(diào)整視頻質(zhì)量以適應(yīng)網(wǎng)絡(luò)帶寬變化,確保平滑播放。Real-TimeMessagingProtocol(RTMP):由Adobe開發(fā),適用于直播流媒體傳輸,低延遲、高實(shí)時(shí)性流媒體的應(yīng)用音樂流媒體Spotify:提供海量音樂庫,用戶可以在線聽歌、創(chuàng)建和分享播放列表,并根據(jù)喜好推薦個(gè)性化內(nèi)容。AppleMusic:類似Spotify,提供音樂流媒體服務(wù),同時(shí)還提供獨(dú)家音樂內(nèi)容和個(gè)性化推薦。在線教育慕課MOOC:提供來自全球知名大學(xué)和機(jī)構(gòu)的在線課程,用戶可以通過流媒體視頻學(xué)習(xí)各種課程內(nèi)容。遠(yuǎn)程會(huì)議Zoom:廣泛用于遠(yuǎn)程辦公、在線教育和網(wǎng)絡(luò)研討會(huì),支持高質(zhì)量的視頻和音頻流媒體。直播流媒體FacebookLive:用戶可以通過Facebook平臺(tái)進(jìn)行實(shí)時(shí)視頻直播,適用于新聞報(bào)道、活動(dòng)直播和個(gè)人分享。視頻處理發(fā)展里程碑5-互聯(lián)網(wǎng)視頻模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024Youtube互聯(lián)網(wǎng)視頻是通過網(wǎng)絡(luò)傳輸?shù)囊曨l內(nèi)容,具有隨時(shí)隨地觀看、互動(dòng)性強(qiáng)等特點(diǎn)。2005年,華裔陳士駿等人創(chuàng)立了視頻網(wǎng)站YouTube,用戶不僅可以觀看網(wǎng)絡(luò)視頻,還可以將個(gè)人創(chuàng)作上傳平臺(tái)。此外,YouTube的一大亮點(diǎn)是其互動(dòng)性。觀眾可以對(duì)視頻評(píng)論、點(diǎn)贊、點(diǎn)踩、分享和訂閱上傳者,也可以與其他用戶進(jìn)行互動(dòng)。YouTube還提供了字幕、360度視頻、直播等功能網(wǎng)絡(luò)視頻的優(yōu)勢(shì)隨時(shí)隨地觀看用戶可以隨時(shí)隨地通過互聯(lián)網(wǎng)訪問視頻內(nèi)容,無需復(fù)雜的設(shè)備,無需等待特定的播放時(shí)間個(gè)性化推薦網(wǎng)絡(luò)視頻平臺(tái)使用大數(shù)據(jù)和人工智能,根據(jù)用戶的觀看歷史、搜索記錄和偏好,推薦個(gè)性化內(nèi)容,提高用戶滿意度?互動(dòng)性與社交性觀眾可以在直播視頻中與主播和其他觀眾進(jìn)行實(shí)時(shí)聊天和互動(dòng),增加觀看的參與感和樂趣?內(nèi)容創(chuàng)作網(wǎng)絡(luò)視頻平臺(tái)為個(gè)人和小團(tuán)隊(duì)提供了低門檻的內(nèi)容創(chuàng)作和發(fā)布途徑,無需昂貴的設(shè)備和專業(yè)的制作團(tuán)隊(duì)?視頻處理發(fā)展里程碑6-短視頻模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024短視頻?隨著智能手機(jī)和移動(dòng)互聯(lián)網(wǎng)的普及,短視頻應(yīng)用應(yīng)運(yùn)而生,滿足了用戶隨時(shí)隨地通過手機(jī)觀看、分享和創(chuàng)作短視頻的需求?2012年,Vine的推出標(biāo)志著短視頻在社交媒體上的亮相。Vine允許用戶錄制和分享最長10秒的視頻,這種簡(jiǎn)短而有趣的內(nèi)容形式迅速走紅。?短視頻通過視頻壓縮算法與內(nèi)容分發(fā)網(wǎng)絡(luò)技術(shù),將視頻數(shù)據(jù)快速壓縮和分發(fā),確保在移動(dòng)網(wǎng)絡(luò)環(huán)境下的流暢播放。此外,短視頻平臺(tái)通過云計(jì)算技術(shù),實(shí)現(xiàn)了海量視頻內(nèi)容的存儲(chǔ)和管理。?短視頻可以即時(shí)欣賞到短視頻內(nèi)容,無需預(yù)先下載。此外,平臺(tái)通過推薦算法,為用戶提供個(gè)性化的內(nèi)容推薦。musical.ly2014年,短視頻應(yīng)用程序musical.ly上線,這是一款以音樂為主題的短視頻社交平臺(tái)。用戶可以通過選擇心儀的背景音樂,錄制自己的短視頻。musical.ly還鼓勵(lì)用戶之間的互動(dòng)和合作。用戶可以關(guān)注其他創(chuàng)作者,點(diǎn)贊、評(píng)論和分享他們的作品,還支持用戶與其他創(chuàng)作者進(jìn)行合作創(chuàng)作。musical.ly以音樂+短視頻的形式,在年輕人中風(fēng)靡一時(shí)。2017年,musical.ly被抖音的母公司字節(jié)跳動(dòng)收購,之后與TikTok合并。短視頻知識(shí)挖掘視頻感知分析視覺分析語音識(shí)別視頻知識(shí)理解實(shí)體理解主題理解視頻情景理解動(dòng)作理解場(chǎng)景理解感知分析湯姆·克魯斯麗貝卡·弗格森杰瑞米·雷納寶馬M3、伊莎、伊森拉巴特老城多模內(nèi)容解析視覺理解語音識(shí)別文本理解多模融合文字OCR知識(shí)子圖關(guān)聯(lián)實(shí)體(演員)結(jié)構(gòu)化語義理解動(dòng)作冒險(xiǎn)電影、動(dòng)作片、間諜片主題寶馬M3、辛迪加、特工其它實(shí)體(湯姆·克魯斯,演員)(麗貝卡·弗格森,演員)(杰瑞米·雷納,演員)(西蒙·佩吉,演員)(肖恩·哈里斯,演員)(碟中諜5,劇名)(伊森·亨特,角色)(伊莎·福斯特,角色)(威廉·勃蘭特,角色)(班吉·鄧恩,角色)(萊恩,角色)實(shí)體(劇名)實(shí)體(角色)視頻處理發(fā)展里程碑7-視頻生成模擬視頻AnalogVideo(PAL)1967數(shù)字視頻DigitalVideo(CCIR601)1982數(shù)字視頻壓縮DigitalVideoCompression(MPEG)1998流媒體StreamingMedia(iPod/iTunes)2001互聯(lián)網(wǎng)視頻InternetVideo(Youtube)2005短視頻ShortVideo(musical.ly)2014視頻生成VideoGeneration
(SORA)2024視頻生成視頻生成是指通過計(jì)算機(jī)算法或人工智能技術(shù),從一組輸入數(shù)據(jù)(如文本描述、圖像序列或其他形式的數(shù)據(jù))生成視頻內(nèi)容的過程。擴(kuò)散模型Sora2024年2月16日,OpenAI發(fā)布了名為文本生成視頻大模型Sora。SORA的技術(shù)基礎(chǔ)主要建立在Transformer架構(gòu)之上,同時(shí)融合了SpacetimePatch技術(shù)和擴(kuò)散DiffusionTransformer架構(gòu)的突破。這些核心技術(shù)的突破使得SORA在生成視頻的質(zhì)量和時(shí)長上遠(yuǎn)超其他前期明星產(chǎn)品,如Runway的G
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 村級(jí)小市場(chǎng)管理制度(3篇)
- 現(xiàn)代種業(yè)園區(qū)管理制度(3篇)
- 疫情期間員工工作管理制度(3篇)
- 管理制度方法和技巧論文(3篇)
- 觀光農(nóng)場(chǎng)常態(tài)化管理制度(3篇)
- 酒店前臺(tái)經(jīng)理員工管理制度(3篇)
- 長沙無人機(jī)管理制度(3篇)
- 納稅風(fēng)險(xiǎn)管控培訓(xùn)課件
- 《GAT 1054.7-2017公安數(shù)據(jù)元限定詞(7)》專題研究報(bào)告
- 養(yǎng)老院護(hù)理服務(wù)質(zhì)量規(guī)范制度
- 深圳加油站建設(shè)項(xiàng)目可行性研究報(bào)告
- 浙江省交通設(shè)工程質(zhì)量檢測(cè)和工程材料試驗(yàn)收費(fèi)標(biāo)準(zhǔn)版浙價(jià)服定稿版
- GB/T 33092-2016皮帶運(yùn)輸機(jī)清掃器聚氨酯刮刀
- 中學(xué)主題班會(huì)課:期末考試應(yīng)試技巧點(diǎn)撥(共34張PPT)
- 紅樓夢(mèng)研究最新課件
- 吊索具報(bào)廢標(biāo)準(zhǔn)
- 給紀(jì)檢監(jiān)察部門舉報(bào)材料
- 低壓電工安全技術(shù)操作規(guī)程
- 新增影像1spm12初學(xué)者指南.starters guide
- GA∕T 1577-2019 法庭科學(xué) 制式槍彈種類識(shí)別規(guī)范
- 水環(huán)境保護(hù)課程設(shè)計(jì)報(bào)告
評(píng)論
0/150
提交評(píng)論