基于內(nèi)容的視頻分類技術(shù)研究_第1頁(yè)
基于內(nèi)容的視頻分類技術(shù)研究_第2頁(yè)
基于內(nèi)容的視頻分類技術(shù)研究_第3頁(yè)
基于內(nèi)容的視頻分類技術(shù)研究_第4頁(yè)
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

精品文檔-下載后可編輯基于內(nèi)容的視頻分類技術(shù)研究在通信與互聯(lián)網(wǎng)普及的今天,數(shù)字視頻在網(wǎng)絡(luò)上的傳播更加容易,在全世界范圍內(nèi)形成了海量的數(shù)據(jù)庫(kù)。面對(duì)這些海量的視頻信息,如何對(duì)它進(jìn)行有效地組織、管理、分類以及檢索,近年來(lái)已經(jīng)成為國(guó)內(nèi)外眾多學(xué)者研究的主要熱點(diǎn)之一,也是極具挑戰(zhàn)性的研究課題。

現(xiàn)有視頻分類的主流解決方案分析

目前,視頻分類的主流解決思路是采用基于視頻內(nèi)容的處理和檢索,主要通過(guò)以下兩類方式實(shí)現(xiàn):

一、部分區(qū)域固定特征監(jiān)測(cè)方式。即通過(guò)逐幀的分析視頻圖像,定位圖像中需要查詢的相關(guān)特征,根據(jù)此特征的匹配程度,確定圖形和視頻是否屬于視頻。此類方法的代表性處理手段有:匹配組織旗幟或臺(tái)標(biāo),匹配服飾特征,匹配特定性人物等。通常要實(shí)現(xiàn)此類方法,需要采用人臉識(shí)別、紋理識(shí)別、相似度計(jì)算等方法。

該方式的缺點(diǎn)是由于過(guò)度依賴固定特征和固定區(qū)域,當(dāng)視頻內(nèi)容發(fā)生變化時(shí),難以有效區(qū)分。具體而言,在采用一些組織的旗幟、臺(tái)標(biāo)等特定特征進(jìn)行識(shí)別時(shí),對(duì)于基于該類組織的暴視頻的識(shí)別效果會(huì)比較好。然而一旦出現(xiàn)新的組織或者該組織改用新的旗幟和臺(tái)標(biāo),即這些特定特征發(fā)生變化了,新的視頻就很難在該類識(shí)別算法中被分類出來(lái)。

二、圖像整體特征方式。即通過(guò)圖像特征提取算法,獲得圖像整體系統(tǒng)特征,通過(guò)大量數(shù)據(jù)的訓(xùn)練,獲得分類器模型,利用此分類器模型實(shí)現(xiàn)對(duì)后續(xù)的圖像視頻的分類識(shí)別。此類方法中采用的圖像特征提取算法通常有:SIFT算法、灰度共生矩陣法、傅里葉功率譜法等。

該方式的缺點(diǎn)是由于采用的是固定特征提取算法,當(dāng)視頻中摻雜了干擾數(shù)據(jù)后,此類算法將會(huì)獲得大量帶噪音的特征,極大降低分類的效果。尤其在海量數(shù)據(jù)下,難以適應(yīng)特定需求。具體而言,在采用一些現(xiàn)成的視頻比如組織進(jìn)行教授爆炸物制作方法的視頻進(jìn)行整體特征提取后,一旦遇到跟此特征比較相似行為的視頻(如影視劇中相似的情節(jié),甚至是動(dòng)畫(huà)片中有類似的情節(jié))等,都可能會(huì)被歸類為而被識(shí)別出來(lái),導(dǎo)致分類效果大打折扣。

深度網(wǎng)絡(luò)特征的視頻分類技術(shù)

通過(guò)對(duì)現(xiàn)有視頻分類技術(shù)深入分析,現(xiàn)在出現(xiàn)了基于內(nèi)容的深度網(wǎng)絡(luò)特征的視頻分類技術(shù),該技術(shù)分為線下訓(xùn)練和線上預(yù)測(cè)兩大部分。

線下訓(xùn)練部分:用戶提供同時(shí)包含敏感視頻和正常視頻的訓(xùn)練數(shù)據(jù)。該技術(shù)從這些訓(xùn)練數(shù)據(jù)中提取視頻幀并利用深度人工神經(jīng)網(wǎng)絡(luò)從中抽取能夠表示視頻內(nèi)容的視覺(jué)特征。深度神經(jīng)網(wǎng)絡(luò)在一定程度上模仿了人腦對(duì)于外在世界的從粗到細(xì)的視覺(jué)感知過(guò)程。因此,較傳統(tǒng)經(jīng)驗(yàn)設(shè)計(jì)的諸如顏色、紋理、SIFT直方圖等特征,基于深度網(wǎng)絡(luò)得到的視覺(jué)特征能夠在多個(gè)粒度上更有效地描述視頻內(nèi)容。因此該種特征特別適用于分析含有復(fù)雜內(nèi)容的視頻數(shù)據(jù)。再進(jìn)一步通過(guò)結(jié)合后續(xù)的有監(jiān)督學(xué)習(xí),該描述能夠自動(dòng)識(shí)別區(qū)分視頻與正常視頻的視覺(jué)模式。該技術(shù)與其他視頻檢索分類算法相比,其優(yōu)勢(shì)在于識(shí)別過(guò)程不依賴于人為指定的特征庫(kù),比如特定臺(tái)標(biāo)、旗幟等,這就使得該技術(shù)對(duì)于未知視頻有更好的適應(yīng)性。

分類器訓(xùn)練模塊主要是建立用于區(qū)分敏感視頻和正常視頻的決策模型??紤]到訓(xùn)練數(shù)據(jù)量很大,且正負(fù)樣本分布極不平衡,即敏感視頻相對(duì)只占極少部分。因此,傳統(tǒng)的分類器訓(xùn)練方法在此場(chǎng)景下并不適用。為此,設(shè)計(jì)了一種基于迭代集成學(xué)習(xí)的訓(xùn)練算法,即通過(guò)多次加權(quán)采樣,解決大數(shù)據(jù)量和樣本分布不平衡問(wèn)題――綿羊sheep。該技術(shù)通過(guò)多輪迭代,自動(dòng)從海量數(shù)據(jù)中找到最容易被錯(cuò)分為sheep的訓(xùn)練樣本。將這些樣本加到線下訓(xùn)練部分,可提高視頻分類技術(shù)的判別能力。

線上預(yù)測(cè)部分:未知視頻數(shù)據(jù)。同樣調(diào)用特征提取模塊從中抽取視頻特征,然后利用已訓(xùn)練好的決策模型對(duì)它們進(jìn)行預(yù)測(cè),并返回可能性最大的視頻供人工檢驗(yàn)。在保證100%召回率(把所有目標(biāo)視頻都找到)的前提下,該技術(shù)能夠有效排除大量正常視頻,從而極大提高人工檢索的效率。

將一組(10個(gè))測(cè)試視頻的視頻幀集隨機(jī)摻入一個(gè)包含120萬(wàn)張網(wǎng)絡(luò)圖片的數(shù)據(jù)集中,技術(shù)對(duì)所有圖像、視頻進(jìn)行打分并排序,檢查需要查看多少?gòu)垐D片,才能完全找到這10個(gè)視頻(檢測(cè)準(zhǔn)確率)。

這10個(gè)視頻,在技術(shù)打分排序后的位置分別為:第1,24,28,35,69,90,121,123,125,135處。也就是說(shuō)要完全確定這10個(gè)視頻,只需要人工查看前135個(gè)預(yù)測(cè)結(jié)果即可,檢測(cè)準(zhǔn)確率為:10/135=7%

在上述實(shí)驗(yàn)中,針對(duì)模糊視頻如何提高技術(shù)的識(shí)別分類能力。采用增加訓(xùn)練集合樣例的方式,重新訓(xùn)練模型。讓技術(shù)識(shí)別能力得到進(jìn)一步提

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論