2023年【視頻后臺專題】算法與后臺的完美結(jié)合-視頻內(nèi)容理解_第1頁
2023年【視頻后臺專題】算法與后臺的完美結(jié)合-視頻內(nèi)容理解_第2頁
2023年【視頻后臺專題】算法與后臺的完美結(jié)合-視頻內(nèi)容理解_第3頁
2023年【視頻后臺專題】算法與后臺的完美結(jié)合-視頻內(nèi)容理解_第4頁
2023年【視頻后臺專題】算法與后臺的完美結(jié)合-視頻內(nèi)容理解_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

【視頻后臺專題】算法與后臺的完美結(jié)合——視頻內(nèi)容理解視頻行業(yè)從曾經(jīng)基本以專業(yè)劇組制作內(nèi)容為主到現(xiàn)在個人博主+小型工作室+專業(yè)劇組的多元內(nèi)容制作,現(xiàn)在越來越多人開頭嘗試通過以視頻的形式承載自己想要表達的內(nèi)容。

這樣的環(huán)境下,視頻生產(chǎn)者逐月遞增,伴隨著視頻生產(chǎn)者人數(shù)的增多,視頻的供應(yīng)量便消失了指數(shù)級的增長曲線。在浩大有簡單的視頻內(nèi)容的海洋中,篩選出來優(yōu)質(zhì)視頻,淘汰劣質(zhì)視頻在當下僅通過人工的方式已經(jīng)無法掩蓋行業(yè)的素材,因此內(nèi)容理解便成為了幫助業(yè)務(wù)對視頻進行優(yōu)劣鑒定的重要引擎。

一、什么是視頻內(nèi)容理解

視頻內(nèi)容理解,主要是針對視頻進行從碼流質(zhì)量到內(nèi)容表現(xiàn)及含義的分析。視頻行業(yè)中,會針對于視頻內(nèi)容生產(chǎn)源對視頻內(nèi)容進行區(qū)分,主要是分為PPC(專業(yè)版權(quán)選購或自制內(nèi)容)、PGC(專業(yè)分賬內(nèi)容)、UGC(用戶原創(chuàng)內(nèi)容)這三類視頻內(nèi)容。

內(nèi)容理解的目的是通過AI的方式將視頻內(nèi)容(包括視頻、音頻、字幕)和視頻互動互動內(nèi)容(評論、保藏、點贊、評分、彈幕、屏蔽、不推舉等)等多維度內(nèi)容進行表征和語意的具體分析,并將分析的結(jié)果推動給前端如推舉、搜尋等業(yè)務(wù)。

1.行業(yè)進展

內(nèi)容行業(yè)進展至今主要存在三個時代:

門戶時代搜尋/社交時代智能時代(1)門戶時代

1995~2022年主要是門戶網(wǎng)站主導下的互聯(lián)網(wǎng)內(nèi)容服務(wù),國內(nèi)代表公司是四大門戶網(wǎng)站,新浪、網(wǎng)易、搜狐、騰訊。在互聯(lián)網(wǎng)的初期,由于用戶的消費信息數(shù)量基本只能從紙媒和電視中獲得,又由于紙媒版面限制和電視廣告的按時間線型排布的特點,導致報紙+電視+廣播這三種傳統(tǒng)方式內(nèi)容數(shù)據(jù)較少且不具備長時間儲存的特性。

因此在那個時代用戶亟需一個內(nèi)容聚合平臺,因此門戶網(wǎng)站變成為了人們夠快速的查找信息的基礎(chǔ)設(shè)施。門戶網(wǎng)站主要運營的方式是通過人工對內(nèi)容進行整理,然后以頻道頁形式滿意用戶需求。

前期主要是以人工對信息的推斷進行運營,伴隨著數(shù)據(jù)量級的的增多,僅依靠人工運營的方式會消失成本急劇攀升,人員沒有更多精力處理海量內(nèi)容,因此各大企業(yè)紛紛引入自動化內(nèi)容分類等技術(shù),此后,內(nèi)容分類技術(shù)伴隨著數(shù)據(jù)增多而進展快速。

(2)搜尋/社交時代

2022年~至今,國內(nèi)及海外互聯(lián)網(wǎng)都在搜尋社交的時代中。主要代表公司:騰訊、Google、Facebook、百度、愛奇藝(愛奇藝做了力量最強的全站視頻搜尋引擎)。

隨著家用電腦及智能手機的不斷普及,內(nèi)容數(shù)量和類型不斷豐富,門戶網(wǎng)站已經(jīng)很難擔當多類型海量內(nèi)容的分發(fā)任務(wù),用戶面對爆炸內(nèi)容時,傳統(tǒng)門戶網(wǎng)站對于用戶選擇呈現(xiàn)了低效的現(xiàn)象。

于是,一種新的信息分發(fā)技術(shù)誕生——搜尋。搜尋主要解決的問題是依據(jù)用戶搜尋的內(nèi)容找到相關(guān)內(nèi)容,并依據(jù)將內(nèi)容有序的呈現(xiàn)在用戶面前。搜尋初期關(guān)鍵詞技術(shù)很好的解決了這個需求,于是也成為那個時期的討論熱點。

但是關(guān)鍵詞技術(shù)同樣存在實體歧義的局限性,比如搜尋亞瑟王,關(guān)鍵詞很難區(qū)分出來是亞瑟玩?zhèn)髌娴膩喩?,還是Type-moon的Saber。在2022年Google提出學問圖譜概念,主要就是用于解決上述的實體歧義問題,實體鏈指的問題也有了比較大的進展。

(3)智能時代

自2022年~至今,伴隨著內(nèi)容爆炸式的增長,用戶消費模式更進一步融合了門戶網(wǎng)站的海量內(nèi)容呈現(xiàn)+搜尋時代的精準化內(nèi)容檢索,推舉及共性化推舉應(yīng)運而生。2022年則是作為智能時代的開端,雖然共性化推舉技術(shù)早有討論,但是對于信息分發(fā)這個任務(wù)有不行或缺的推動作用。

①圖文時代

共性化推舉其實經(jīng)受了兩個時代,其一是圖文時代,其二是視頻時代。圖文時代在國內(nèi)則是以今日頭條和一點資訊為代表的共性化圖文分發(fā)引擎,初期內(nèi)容基本上是通過爬去各個傳統(tǒng)門戶網(wǎng)站的內(nèi)容經(jīng)過自己的內(nèi)容理解做好基礎(chǔ)分類的標簽歸屬,然后在通過共性化分發(fā)引擎做到你關(guān)懷的就是頭條。

②視頻時代

自2022年開頭,伴隨4G普及及終端設(shè)備的急劇降低,用戶消費場景正式步入移動時代。在內(nèi)容消費中也逐步變成從傳統(tǒng)圖文消費轉(zhuǎn)變?yōu)榱艘曨l、音頻消費的模式。這個時候,由于音視頻本身的識別難度遠大于圖文內(nèi)容,在優(yōu)劣內(nèi)容判別時,傳統(tǒng)的學問圖譜、關(guān)鍵詞、人工運營已經(jīng)無法掩蓋生動的視頻內(nèi)容,這個時候內(nèi)容理解便得到了重要進展。

2.內(nèi)容理解的重要性

內(nèi)部因素來看:伴隨內(nèi)容爆炸式增長,UGC創(chuàng)創(chuàng)作水平、創(chuàng)作目的各不相同;PPCPGC內(nèi)容則面臨著視頻二次創(chuàng)作,選擇優(yōu)質(zhì)經(jīng)典內(nèi)容成本極高的問題;消費者存在內(nèi)容理解偏差,平臺需要保證基礎(chǔ)內(nèi)容質(zhì)量將優(yōu)質(zhì)內(nèi)容呈現(xiàn)在消費者面前。

平臺面臨運營人力成本掌握及優(yōu)質(zhì)內(nèi)容選擇,優(yōu)秀創(chuàng)篩選,版權(quán)選購及運營工業(yè)化等各方面問題。

外部因素來看:自2022年開頭,食品消費增速不斷擴大,視頻消費已經(jīng)占據(jù)用戶在內(nèi)容領(lǐng)域消費的肯定大頭,并且在2022年及之后的一段時間內(nèi)依舊是保持增長賽道。

外部需求有,內(nèi)容供應(yīng)足,運營成本高,三者結(jié)合,視頻內(nèi)容理解則成為了平臺重要扶持對象。

二、視頻內(nèi)容理解產(chǎn)品架構(gòu)

產(chǎn)品力量上來講,內(nèi)容理解主要分為三個部分:視頻信息歸類、視頻特征整理、優(yōu)劣內(nèi)容識別。

視頻信息歸類:通常狀況下內(nèi)容理解算法經(jīng)過深度學習以后,可以對視頻內(nèi)容進行內(nèi)容分類及標簽定義,用于給視頻內(nèi)容自動化定義基礎(chǔ)的分類和相近的標簽。

視頻特征整理:視頻特征主要針對于視頻內(nèi)容本身和視頻評論進行特征標識的。通常狀況下會視頻本身的特征主要是對畫面和音頻兩個方面進行特征整理。畫面方面主要是強調(diào)的是視頻主題(視頻帶貨、才藝表演、古裝電視、綜藝真人秀)、類型(穿搭博主、顏藝博主)、創(chuàng)力量及愛好(資訊版本、歷史板塊、泛學問類板塊)、OCR識別(主要識別視頻畫面中的文字關(guān)鍵信息)。

對于音頻則主要是識別音頻中的音樂(消失位置、BGM名稱等)、ASR識別(語音轉(zhuǎn)文字、音色、音調(diào)等)。針對于視頻評論主要是整理評論估量推舉度、評論關(guān)鍵詞等信息作為幫助本身本身特征及歸類的描述。

優(yōu)劣內(nèi)容識別:一般狀況下內(nèi)容理解后臺會對線上視頻內(nèi)容做組合式內(nèi)容優(yōu)劣識別,組合式包括了內(nèi)容本身及內(nèi)容評論兩個部分。這之中主要是會對內(nèi)容本身、內(nèi)容評論做獨立優(yōu)劣識別,同時會依據(jù)內(nèi)容評論的分析結(jié)果作為內(nèi)容本身優(yōu)劣的一個評判維度。

針對于內(nèi)容本身一般會分為優(yōu)質(zhì)內(nèi)容、次優(yōu)質(zhì)內(nèi)容、一般內(nèi)容、劣質(zhì)內(nèi)容四項,評論通常狀況下會分為神評論、一般評論、爭議評論、劣質(zhì)評論、抑制創(chuàng)作評論這五種類型。整體對于內(nèi)容優(yōu)劣的推斷通常如下圖所示:

1.內(nèi)容理解流程

為了快速對視頻內(nèi)容形成信息歸類、特征理解與優(yōu)劣判定,當視頻入庫的時候,內(nèi)容理解后臺會監(jiān)聽視頻內(nèi)容入庫的消息,視頻入庫完成后通常會到存儲將視頻內(nèi)容下載到內(nèi)容理解后臺中,在內(nèi)容理解后臺對視頻綻開畫面及音頻的內(nèi)容分析,確定視頻的基本歸類、特征、優(yōu)劣推斷。

在視頻上線一段時候以后,綻開周期性的依據(jù)視頻互動數(shù)據(jù)對視頻內(nèi)容理解進行多次優(yōu)化,不斷深化內(nèi)容畫像。

目前線上視頻業(yè)務(wù)中,用戶視頻通常狀況下不會給用戶對線上已發(fā)布時候進行視頻調(diào)整的機會,因此內(nèi)容理解中不太需要推斷視頻是否存在修改而進行相應(yīng)的畫像調(diào)整;版權(quán)視頻由于成本問題,通常收到監(jiān)管要求以后會對視頻進行再加工處理,因此線上視頻會進行剪輯渲染等調(diào)整,所以當內(nèi)容理解后臺監(jiān)聽到視頻調(diào)整以后,需要對視頻進行重新內(nèi)容分析。

對于一些重點內(nèi)容,需要內(nèi)容理解后臺將分析的結(jié)果呈現(xiàn)在運營面前,運營可以對分析結(jié)果進行調(diào)校。通過以上的行為,便可以對視頻內(nèi)容做相對具體的分析,結(jié)合上述內(nèi)容,內(nèi)容理解的流程如下圖所示:

2.內(nèi)容理解業(yè)務(wù)掩蓋

如前文內(nèi)容理解的介紹,內(nèi)容理解后臺主要的作用是在于視頻信息歸類、視頻特征整理與應(yīng)用、優(yōu)劣內(nèi)容識別三個部分,包含了對視頻、音頻、字幕、評論為主的多維度內(nèi)容分析。

由于在PPC、PGC、UGC內(nèi)容中業(yè)務(wù)對于視頻內(nèi)容的運營策略與人力資源的不同,因此內(nèi)容理解對于不同生產(chǎn)形勢的視頻內(nèi)容會進行區(qū)分化分析。

我們通常狀況下將版權(quán)選購和平臺自制時長高于20分鐘的視頻稱之為版權(quán)長視頻,把用戶上傳的稱作用戶視頻,目前新興的如《生活對我下手了》系列版權(quán)選購單集5分鐘以內(nèi)的視頻可以稱之為微劇。由于微劇整體從內(nèi)容供應(yīng)和消費而言與PPC、PGC長視頻相像,因此可以并入到版權(quán)或自制視頻中進行分析。

(1)信息歸類

分類:版權(quán)內(nèi)容一般會對自己的視頻做200-300個分類,包括一級分類(如電影、電視劇、綜藝、動漫、紀錄片等)、二級分類(華語、港臺、日韓、歐美等)、三級分類(喜劇、愛情、動作、青春、奇幻等)。由于版權(quán)視頻在內(nèi)容購買時存在投資與購買片庫的兩種規(guī)律,因此新熱大火的內(nèi)容通常是人工運營選擇分類,其它片庫內(nèi)容可以通過內(nèi)容理解后臺對分類進行建立。

用戶內(nèi)容通常狀況下會做相對于版權(quán)視頻相對多一些但是層級少一些的分類,一般狀況下用戶視頻分類的個數(shù)約500-800個,包括一級分類(嬉戲、舞蹈、鬼畜、美食等)、二級分類(美食制作、美食偵探、美食測評等),這部分內(nèi)容一般都是由內(nèi)容理解后臺或用戶選擇進行自動歸類(由后臺歸類節(jié)省用戶上傳視頻步驟簡單提升產(chǎn)量,因此由后臺歸類逐步變得更廣泛的應(yīng)用),頭部大號一般會有相應(yīng)的大V運營同學對分類進行調(diào)整。

標簽:一般狀況下,內(nèi)容理解后臺會依據(jù)視頻畫面內(nèi)容、音頻、字幕內(nèi)容進行初步的標簽核對,后續(xù)會通過離線加載視頻評論的方式,將視頻評論的標簽和視頻內(nèi)容的標簽全部打入視頻,后續(xù)經(jīng)過搜尋等、推舉等行為,不斷確定標簽的優(yōu)先級,將標簽打在視頻內(nèi)容、專輯、播單等主體上面。與分類相同,頭部大V的內(nèi)容會由公司運營對標簽進行調(diào)整。

(2)特征整理

特征理解主要分為視頻表征理解(如視頻主題、創(chuàng)愛好特長等)、優(yōu)質(zhì)音視頻內(nèi)容識別(精彩片段分析、BGM分析等)這兩部分。

視頻表征理解:表征理解顧名思義是對視頻表達的內(nèi)容主題、創(chuàng)長短板、消費匹配等進行分析,通過對畫面、字幕、音頻的分析,確定視頻的表達主題、出鏡人員識別(演員、網(wǎng)紅之類的)等信息,將信息存放在內(nèi)容理解庫中,并廣泛應(yīng)用于視頻的編目信息。

優(yōu)質(zhì)音視頻識別:優(yōu)質(zhì)音視頻識別的主要的應(yīng)用場景是在于長視頻消費和生產(chǎn),同樣也可以適用于直播領(lǐng)域的點播內(nèi)容制作,特別場景下的內(nèi)容呈現(xiàn)(如足球競賽的關(guān)鍵進球、紅黃牌等信息)。

由于版權(quán)視頻業(yè)務(wù)中,在消費和生產(chǎn)端存在優(yōu)質(zhì)音樂回放、優(yōu)質(zhì)視頻拆條等素材,因此在整體的制作消費環(huán)節(jié)中,內(nèi)容理解后臺可以通過算法分析并識別出優(yōu)質(zhì)的音視頻內(nèi)容給到生產(chǎn)、消費端進行使用。

音視頻特征識別除了本身作為音視頻內(nèi)容外,同時存在著從視頻中提取并分析相應(yīng)音視頻內(nèi)容,并依據(jù)內(nèi)容識別專場、優(yōu)質(zhì)幀位等信息,從而找到并廣告位精彩點位等關(guān)鍵位置;進一步生產(chǎn)共性化封面圖、共性化標題等信息用于后續(xù)的推舉、搜尋、播放等業(yè)務(wù)場景中。

(3)優(yōu)劣分析

一般狀況下內(nèi)容理解后臺會從三個方面對視頻進行優(yōu)劣推斷,分別是音視頻質(zhì)量、視頻內(nèi)容質(zhì)量、視頻互動。會對以上三個方面各處每個方面的基礎(chǔ)分數(shù),同時會將三者的分數(shù)在消費端的綜合表現(xiàn)及權(quán)重做多次加權(quán)給出總體分數(shù)。

①音視頻質(zhì)量

通常狀況下,音視頻質(zhì)量是視頻優(yōu)劣的一個重要指導指標。。一般狀況下評價音視頻質(zhì)量主要有以下3大方面:

畫面問題音頻問題音畫問題畫面問題:畫面問題主要是涵蓋了花屏、拉絲、灰屏;辨別率;幀率;橫豎屏;畫面細節(jié)呈現(xiàn);模糊、馬賽克;黑屏等問題。

音頻問題:爆音;噪音多;卡頓等問題。

音畫問題:主要面臨的問題的是音畫不同步。

依據(jù)以上三類問題,通常狀況下會將對音視頻質(zhì)量分析的步驟稱之為質(zhì)量檢測。質(zhì)量檢測一般是會依據(jù)已經(jīng)上線的視頻,根據(jù)視頻內(nèi)容的重要程度進行自動檢測及人工檢測,一般狀況下為了保證人工檢測的置信性會進行兩輪的人工檢測,視頻行業(yè)的說法是一檢和二檢。

自動檢測:

視頻進入到平臺通過平安審核上線后,會優(yōu)先利用算法對視頻進行質(zhì)量檢測,質(zhì)量審核是面對全部平臺已上線視頻做的。

一般狀況下對視頻質(zhì)量進行畫面、音頻、字幕等單方面檢測,同時會利用平臺用戶消費狀況賜予視頻一個綜合分數(shù)。在自動檢測時,為了更加清楚地了解到是平臺對視頻二次編碼的消失的質(zhì)量問題還是視頻原始介質(zhì)的問題,一般都會對原視頻介質(zhì)和線上碼流都進行自動檢測。

現(xiàn)在常用的綜合分數(shù)主要主要是分為兩種,一種是平臺自行開發(fā)的,另外一種是基于開源工具進行檢測。

VMAF是一款Netflix開發(fā)的一款基于視頻畫面進行綜合打分算法的工具,視頻畫面經(jīng)過工具后會得到PSNR的分數(shù),通常狀況下PSNR分數(shù)相差3以上基本就是肉眼可見的質(zhì)量差異。下圖上面兩張圖片PSNR分數(shù)為31分,下面兩張個圖片是34分。

雖然目前市面上各家公司都習慣于對外宣揚使用自研視頻質(zhì)量分數(shù),假如盼望做跨平臺對比視頻內(nèi)容一般還是使用第三方數(shù)據(jù)牢靠性比較高。

人工檢測:

對于平臺內(nèi)部的重點視頻在自動檢測消失消失比較有爭議的分數(shù)時,便需要人工檢測進行校驗。一般人工檢測的視頻包括平臺版權(quán)選購內(nèi)容、平臺自制內(nèi)容、頭部創(chuàng)視頻、近期播放指數(shù)陡增的視頻這四類。

人工檢測一般的檢測項和自動檢測保持全都,需要經(jīng)過二次人工檢驗對視頻進行最終定性,并給出視頻調(diào)整的綜合性建議(如對原視頻介質(zhì)進行優(yōu)化、重新對運營流進行編碼等操作)。

②視頻內(nèi)容質(zhì)量

視頻內(nèi)容質(zhì)量主要指的是視頻內(nèi)容本身(不計算編碼后音視頻碼流質(zhì)量)對于用戶價值平臺價值的綜合得分。由于這部分視頻計算得分需要仿照用戶心理狀態(tài),因此在視頻內(nèi)容質(zhì)量的計算過程中需要主要考慮的是基于平臺消費狀況視頻的客觀事實和符合平臺及用戶消費導向的優(yōu)質(zhì)視頻篩選這兩個部分進行視頻內(nèi)容質(zhì)量打分和推舉。

對于視頻內(nèi)容消費而言,人們對于優(yōu)質(zhì)的理解總是各不相同的,此時優(yōu)質(zhì)內(nèi)容的識別就需要賜予平臺調(diào)性和主推以及用戶消費進行綜合性篩選;劣質(zhì)內(nèi)容的認定基本上用戶會形成相應(yīng)的共識,因此內(nèi)容理解后臺對于劣質(zhì)內(nèi)容識別可以通過規(guī)章及算法精準找到。

劣質(zhì)視頻識別:

劣質(zhì)的視頻內(nèi)容一般可以通過標題與內(nèi)容的聯(lián)系、視頻內(nèi)容畫面、音頻等元素是可以通過系統(tǒng)識別出來的。詳細的表現(xiàn)有標題黨、視頻時間過短、營銷導流(貼二維碼、硬廣)、有明顯的臺標、作品重復、誘導互動、性示意、非原創(chuàng)投自制等。通過這樣通用性的劣質(zhì)視頻規(guī)章和算法的識別可以第一時間內(nèi)識別出來平臺內(nèi)的劣質(zhì)視頻并加以標識。

優(yōu)質(zhì)視頻探究:優(yōu)質(zhì)視頻需要滿意的條件是熱門、多樣、經(jīng)典、符合平臺價值觀這三方面的需求。

熱門多樣經(jīng)典符合平臺價值觀視頻的熱門推斷:

熱門內(nèi)容一般分為總體熱門內(nèi)容和地方性熱門內(nèi)容,總體熱門內(nèi)容主要是需要具備的條件是實效性、權(quán)威性、廣泛性這三大特點。

實效性內(nèi)容主要是基于熱點大事,網(wǎng)絡(luò)用戶查閱量較高的話題做成的內(nèi)容,筆者當年做了一個監(jiān)控微博熱搜+自動圖文轉(zhuǎn)視頻的工具,對實效性內(nèi)容制作和分發(fā)起到了還不錯的收益;

權(quán)威性主要指的是賬號,對于熱門內(nèi)容而言,最簡潔的推斷方法是看賬號的屬性;

廣泛性指的是需要篩選出來的內(nèi)容具備規(guī)模效應(yīng),至少平臺中60%以上的用戶會喜愛這樣的內(nèi)容,產(chǎn)生的長播放掩蓋占比需要超過當日活躍用戶數(shù)的30%以上,比如B站在熱門內(nèi)容的選擇中對于二次元宅舞動漫混剪會有相應(yīng)加權(quán)。

地方性熱門內(nèi)容需要賜予LBS進行推舉,作為一手分析優(yōu)質(zhì)內(nèi)容的視頻理解后臺,需要對地方性優(yōu)質(zhì)內(nèi)容做好相應(yīng)的地域標記,比如某些地區(qū)其次天強暴雨預警就是地方性很強的熱門內(nèi)容。

視頻多樣性選擇:

平臺在推斷優(yōu)質(zhì)內(nèi)容的時候,會依據(jù)內(nèi)容分類在每個分類下都找到一些評分較高的視頻,在整體的視頻內(nèi)容召回時,不在單純進行整體的評分排序,而是根據(jù)平臺視頻消費的內(nèi)容頻道、視頻歸類等因素,根據(jù)頻道或者歸類(在統(tǒng)計頻道或者歸類時需要獵取不同類目下內(nèi)容和實際產(chǎn)生vv占比及BI猜測占比)進行按比例召回,依據(jù)頻道歸類的消費指數(shù)*視頻分數(shù)進行統(tǒng)一排序后再通過算法模型做肯定的挨次打亂,通過這樣的方式召回的視頻用以構(gòu)成了平臺的優(yōu)質(zhì)內(nèi)容多樣性,讓用戶在消費中可以感受到平臺內(nèi)容多且種類多。

經(jīng)典視頻的篩選:

在視頻平臺中都存在著一些能夠長期穩(wěn)定獵取vv及長播放的視頻內(nèi)容,長視頻平臺中可以發(fā)覺如優(yōu)酷的《甄嬛傳》、愛奇藝的《請回答1988.》、B站的《半澤直樹》這樣的內(nèi)容,短視頻平臺中如講解古生物的《鬼谷說》系列、講解人物歷史的《東夢人物志》系列;美食作家王剛、廚師長農(nóng)國棟、覓大叔這類有用型教授做菜、選東西的內(nèi)容等。

那么這部門視頻內(nèi)容的獵取便需要內(nèi)容理解后臺借助于消費數(shù)據(jù)不斷刷新獵取具有長效不斷vv,且長播放相對較高的視頻內(nèi)容,將這些視頻填充進入優(yōu)質(zhì)內(nèi)容池中作為平臺經(jīng)典內(nèi)容呈現(xiàn)。

平臺價值觀的嵌套:

平臺需要有自己的價值觀,內(nèi)容理解后臺在獵取優(yōu)質(zhì)視頻內(nèi)容時需要和平臺價值觀做充分綁定的。有些時候用戶喜愛喜愛看的未必是在社會上平臺中需要努力宣揚的視頻,這個時候平臺需要依據(jù)自己推崇的標簽分類或是學問圖譜中對上述三者選出的內(nèi)容進行權(quán)重的二次安排,從而形成最終的優(yōu)質(zhì)內(nèi)容。

③視頻互動

視頻互動主要作用于優(yōu)劣視頻篩選和優(yōu)劣互動內(nèi)容識別,主要的原則有三點:

通過互動數(shù)據(jù)調(diào)教原視頻的特征利用互動數(shù)據(jù)幫助推斷視頻優(yōu)劣互動數(shù)據(jù)分析并賦能給消費及生產(chǎn)互動數(shù)據(jù)調(diào)教原視頻的特征:視頻互動數(shù)據(jù)包括基礎(chǔ)的贊、踩、舉報,也包括主管評論、標簽添加等信息。在內(nèi)容理解中,可以通過用戶的互動數(shù)據(jù)進行學問圖譜、關(guān)鍵詞等信息,對原視頻特征做二次校正,補充僅通過內(nèi)容角度分析缺失的數(shù)據(jù)同時對特征權(quán)重根據(jù)用戶的消費進行重新調(diào)整。

利用互動數(shù)據(jù)幫助推斷視頻優(yōu)劣:通過對用戶互動內(nèi)容,可以最直接的得到視頻在消費端消費好壞的狀況,基于視頻消費狀況對視頻優(yōu)劣進行二次校正,可以最大限度讓優(yōu)質(zhì)小眾視頻不收到埋沒,讓廣泛消費的視頻得到更加公眾的判罰。

互動數(shù)據(jù)分析并賦能給消費及生產(chǎn):一般狀況下內(nèi)容理解后臺對于主管評價內(nèi)容會會進行兩個方面的展露,其一是對生產(chǎn)者,其二是對消費者。

生產(chǎn)者盼望獵取的評論內(nèi)容是專業(yè)、輕松好玩的、負面較少的評論內(nèi)容,只有這樣的內(nèi)容更多才能促進平臺內(nèi)容生產(chǎn),創(chuàng)內(nèi)容更加精進。

對于消費者而言,用戶喜愛和視頻主題相關(guān)的,好玩,符合大多評論氛圍的評價。

因此內(nèi)容理解后臺在推斷優(yōu)質(zhì)內(nèi)容上面需要依據(jù)視頻內(nèi)容、評論內(nèi)容及心情表達選出好玩、有用、符合平臺調(diào)性、相關(guān)性強、負面少的內(nèi)容作為視頻的優(yōu)質(zhì)評論。

劣質(zhì)評論內(nèi)容相對于優(yōu)質(zhì)評論內(nèi)容則更簡單識別,由于人們往往對優(yōu)質(zhì)的定義許多,但是對劣質(zhì)的定義卻是有很強的統(tǒng)一性。因此在劣質(zhì)內(nèi)容識別上,內(nèi)容理解后臺可以結(jié)合反垃圾的做法快速篩選出來劣質(zhì)內(nèi)容。

3.內(nèi)容理解后臺產(chǎn)品架構(gòu)

內(nèi)容理解定義:對接平臺線上視頻及互動數(shù)據(jù),對介入的視頻多業(yè)務(wù)級多維度歸類分析,同時進行標簽、學問圖譜對齊,利用線上數(shù)據(jù)及算法模型對視頻整體內(nèi)容進行歸類、特征梳理、優(yōu)劣辨析;對視頻二創(chuàng)進行制作指導;對視頻消費進行業(yè)務(wù)化處理。

因此在整體內(nèi)容理解后臺的產(chǎn)品架構(gòu)中,需要先做數(shù)據(jù)輸入與輸出的處理,依據(jù)所需要的數(shù)據(jù)找到對應(yīng)數(shù)據(jù)平臺從而完成整體架構(gòu)設(shè)計。

(1)內(nèi)容理解后臺數(shù)據(jù)交互

我們將內(nèi)容理解定義為兩部分:通過內(nèi)容本身理解內(nèi)容、通過用戶行為理解內(nèi)容。前者主要是針對內(nèi)容抽取歸類于標簽。后者通過累計的用戶數(shù)據(jù),經(jīng)過統(tǒng)計、建模、平臺傾向、產(chǎn)品規(guī)章等方面對內(nèi)容進行分析。

(2)內(nèi)容理解后臺產(chǎn)品架構(gòu)

通過上述數(shù)據(jù)交互,可以清楚的了解到內(nèi)容理解后臺外在數(shù)據(jù)獵取及數(shù)據(jù)處理中需要對接的系統(tǒng),主要包括了素材庫、生產(chǎn)制作系統(tǒng)、運營系統(tǒng)、BI、視頻互動數(shù)據(jù)庫、OCR等。

由于內(nèi)容理解后臺的使用特性,故而繼承了工具+服務(wù)兩部分的屬性。服務(wù)則存在于工程和算法兩個方面,工程上主要是數(shù)據(jù)讀寫和接口服務(wù),算法上則是內(nèi)容分析、互動分析等算法。結(jié)合數(shù)據(jù)流轉(zhuǎn)可以得到如下簡要內(nèi)容理解后臺架構(gòu)圖:

三、視頻內(nèi)容理解產(chǎn)品設(shè)計

在整理完成內(nèi)容理解后臺的業(yè)務(wù)掩蓋,梳理數(shù)據(jù)流轉(zhuǎn)、業(yè)務(wù)流程和產(chǎn)品架構(gòu)以后,下一步就是內(nèi)容理解后臺的產(chǎn)品設(shè)計階段。

由于內(nèi)容理解后臺相對于基礎(chǔ)后臺比較偏重于算法,因此產(chǎn)品經(jīng)理在整體的產(chǎn)品階段需要負責模塊不僅僅存在于功能方面,還有肯定的算法需求。產(chǎn)品經(jīng)理在這種類型的產(chǎn)品價值則主要體現(xiàn)在了業(yè)務(wù)發(fā)掘、產(chǎn)品設(shè)計、跨部門溝通。

1.業(yè)務(wù)發(fā)掘

對于視頻理解這種新型后臺產(chǎn)品,不像傳統(tǒng)后臺有著自然?的使用方,為了能夠讓產(chǎn)品逐步做起來,最重要的事情是在業(yè)務(wù)中找到業(yè)務(wù)痛點,在產(chǎn)品上線初期可以讓更多的用戶來使用后臺(包括后臺的數(shù)據(jù))從而不斷得到優(yōu)化迭代的機會,讓產(chǎn)品能夠存續(xù)下來。

完成了生存挑戰(zhàn),后續(xù)就是讓產(chǎn)品掩蓋更多的業(yè)務(wù),存在更多的力量,整合更多的系統(tǒng),讓產(chǎn)品成為基礎(chǔ)建設(shè)。最終一步就是讓產(chǎn)品變現(xiàn),將整體的力量變成對外服務(wù),做基礎(chǔ)建設(shè)的力量輸出獲利。

產(chǎn)品經(jīng)理在整體的流程中,很重要的一點就是業(yè)務(wù)發(fā)掘力量,在整體業(yè)務(wù)發(fā)掘中主要是對需求的發(fā)覺與收集力量,這之中主要是通過對B端的實地觀看訪談和對消費端的實際使用。

對B端用戶的發(fā)掘主要是通過觀看法和訪談法進行,主要的目的是通過觀看和訪談?wù)业綐I(yè)務(wù)操作上的痛點和實際業(yè)務(wù)流程。業(yè)務(wù)痛點主要是核心是老生常談的效率問題,如海量視頻歸類,優(yōu)質(zhì)片段的查找,優(yōu)質(zhì)視頻的查找,高優(yōu)評論的識別,劣質(zhì)內(nèi)容的提示等。

在消費的時候,其實可以發(fā)覺如視頻冷啟動內(nèi)容不夠精準,視頻評論將更好的評論放在了更靠后的地方等等。通過這些在消費端發(fā)覺的問題,可以找到內(nèi)容理解后臺可以增加的業(yè)務(wù)范圍或優(yōu)化的方向。

2.跨部門溝通

前文說了,對于內(nèi)容理解這樣的后臺產(chǎn)品而言,需要許多數(shù)據(jù)和服務(wù),因此在需求明確之后,產(chǎn)品設(shè)計之前,需要排列出來可能要合作的部門,需要不斷開會拉起各個部門的實際負責人和相關(guān)產(chǎn)品研發(fā)人員,確定哪些力量是當下支持的,哪些力量需要開發(fā),各自負責的邊界范圍是什么,然后依據(jù)現(xiàn)有力量組裝內(nèi)容理解后臺的力量掩蓋。

后期則是對于功能的研發(fā)及為了業(yè)務(wù)進展更好,對整體數(shù)據(jù)指標的建立與拉齊。

(1)業(yè)務(wù)打通

業(yè)務(wù)初期階段,產(chǎn)品經(jīng)理需要在依據(jù)架構(gòu)梳理出來需要對接的外部團隊,找到做內(nèi)容理解后臺對于每個業(yè)務(wù)的收益從而獲得其他業(yè)務(wù)的支持。

之后便是依據(jù)數(shù)據(jù)流轉(zhuǎn)和各服務(wù)之間的架構(gòu)做好相應(yīng)的業(yè)務(wù)流程和產(chǎn)品流程。由于現(xiàn)在中臺化服務(wù)已經(jīng)在各大公司普及開來,因此串聯(lián)業(yè)務(wù)的工作必定是內(nèi)容理解后臺需要做的工作,產(chǎn)品經(jīng)理在這里最重要的事情便是梳理大體的業(yè)務(wù)流程。

(2)指標建立與拉齊

在上線以后,為了能夠獲得系統(tǒng)間更快的響應(yīng),讓用戶及服務(wù)前端的數(shù)據(jù)獲得更加靈敏的響應(yīng),產(chǎn)品經(jīng)理需要為內(nèi)容理解后臺做以下3件事情:

找到長期支持內(nèi)容理解后臺的合作伙伴建立各項指標讓全部服務(wù)方對齊建設(shè)長效的問題反饋收集反饋機制,促進產(chǎn)品迭代。3.產(chǎn)品設(shè)計

在對業(yè)務(wù)發(fā)掘以后,下一步就是依據(jù)發(fā)覺的問題,找到功能或者策略可以解決的方式供應(yīng)服務(wù)。由于內(nèi)容理解后臺是集成多種服務(wù)的算法+工具+服務(wù)形式后臺產(chǎn)品,因此產(chǎn)品經(jīng)理在產(chǎn)品設(shè)計中的核心力量是打通系統(tǒng)之間的數(shù)據(jù)、供應(yīng)工具給用戶使用、優(yōu)化模型建立評價體系。

(1)流程設(shè)計

對于內(nèi)容理解后臺這種需要多服務(wù)支持的后臺產(chǎn)品,系統(tǒng)間的產(chǎn)品流程是特別重要的。在流程設(shè)計中,由于需要進行系統(tǒng)串聯(lián),所以需要主要考慮的地方在于分析的靈敏性、精準性。

靈敏性:流程設(shè)計主要是盼望整體的分析速度能夠更快,因此需要在設(shè)計中做盡量多的并行大事。需要了解系統(tǒng)間對于數(shù)據(jù)分析的前后關(guān)系,合理支配數(shù)據(jù)入庫的挨次并完成分析。

精準性:需要對輸出的數(shù)據(jù)進行負責,因此在整體設(shè)計中需要盡量規(guī)避可能消失數(shù)據(jù)消失問題的流程設(shè)計,做到不漏、不偏。

(2)工具設(shè)計

內(nèi)容理解工具主要的目的是有兩點:

幫助運營推斷內(nèi)容展現(xiàn)流程提升問題排查效率①內(nèi)容推斷

工具設(shè)計中主要需要展現(xiàn)原本內(nèi)容和分析結(jié)果,需要將整體視頻展現(xiàn)做到全面和精確?????,在分布上需要做到模塊挨次可以調(diào)整,默認狀態(tài)下讓依據(jù)最大原則定好模塊排布挨次。因此從工具上需要為用戶展現(xiàn)內(nèi)容池、內(nèi)容詳細信息兩個模塊。

內(nèi)容池:主要是根據(jù)業(yè)務(wù)需求以肯定的規(guī)章算法選出一些類型的內(nèi)容池,如熱門內(nèi)容池、新用戶冷啟動內(nèi)容池、優(yōu)質(zhì)內(nèi)容池、點贊飆升內(nèi)容池等等,用戶可以設(shè)置一些條件和維度進行內(nèi)容篩查。

內(nèi)容信息:內(nèi)容信息一般展現(xiàn)用戶查詢內(nèi)容的基本信息及內(nèi)容理解后臺給出的分析信息,功能上需要支持基本的查看和修改力量。同時用戶修改的操作的正負向信息需要傳遞給算法,從而優(yōu)化算法模型。

②流程排查

主要用于視頻內(nèi)容分析故障的時候,確定故障緣由,找到第一責任人進行故障排查,讓業(yè)務(wù)順當進行下去。

③小結(jié)

內(nèi)容理解工具端的設(shè)計組要服務(wù)于兩大方面,其一是內(nèi)容推斷,其二是流程排查。內(nèi)容推斷主要是內(nèi)容池展現(xiàn)和內(nèi)容展現(xiàn),流程排查需要將分析流程明盒化,供應(yīng)給研發(fā)排查問題,產(chǎn)品也可以依據(jù)流程做效率上的進一步優(yōu)化,

(3)建立評判體系

基于內(nèi)容理解的算法,產(chǎn)品經(jīng)理需要建立指標體系不斷提升算法力量,提升分析模型。指標體系主要需要應(yīng)對兩個方面的的挑戰(zhàn),企業(yè)內(nèi)部需要查看業(yè)務(wù)掩蓋量,面對用戶需要查看推舉數(shù)據(jù)的詳細指標完成狀況。產(chǎn)品經(jīng)理需要和算法工程師一起制定指標,讓分析力量增加,推舉數(shù)據(jù)更優(yōu),掩蓋業(yè)務(wù)更廣。

企業(yè)內(nèi)考量:

產(chǎn)品經(jīng)理需要在企業(yè)內(nèi)容查找到可掩蓋的業(yè)務(wù),了解清晰業(yè)務(wù)注意的供應(yīng)數(shù)據(jù)和核心看重的規(guī)章和數(shù)據(jù)指標,產(chǎn)品經(jīng)理需要分業(yè)務(wù)和算法工程師對齊內(nèi)容篩選指標,讓更多業(yè)務(wù)用起來。

對于企業(yè)內(nèi)考量則是掩蓋有效業(yè)務(wù)范圍是一個考量指標,上限是100%;新業(yè)務(wù)接入速度也是一個考量指標,服務(wù)足夠完備的狀況下,新業(yè)務(wù)接入可以根據(jù)天來計算。

分析精確?????性也是一個重要指標,一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論