智能視頻分析結(jié)課論文_第1頁
智能視頻分析結(jié)課論文_第2頁
智能視頻分析結(jié)課論文_第3頁
智能視頻分析結(jié)課論文_第4頁
智能視頻分析結(jié)課論文_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、中國傳媒大學(xué)20142015學(xué)年第上學(xué)期 智能視頻分析技術(shù)課程題 目人工智能和模式識別的結(jié)合運用學(xué)生姓名劉晶晶學(xué)號201110013208班級數(shù)字媒體技術(shù)學(xué)生所屬學(xué)院信息工程學(xué)院任課教師呂朝輝教師所屬信息工程學(xué)院2014.11.27時 間人工智能和模式識別的結(jié)合應(yīng)用計算機硬件的迅速發(fā)展,計算機應(yīng)用領(lǐng)域的不斷開拓,迫切地要求計算機能夠更 有效地感知諸如聲音、文字、圖像、溫度、震動等人類賴以發(fā)展自身、改造環(huán)境所運 用的信息資料。但就一般意義來說,目前一般計算機卻無法直接感知它們,鍵盤、鼠 標(biāo)等外部設(shè)備,對于這樣五花八門的外部世界顯得無能為力??v然電視攝像機、圖文 掃描儀、話筒等設(shè)備業(yè)已解決了上述非

2、電信號的轉(zhuǎn)換,并與計算機聯(lián)機,但由于識別 技術(shù)不高,而未能使計算機真正知道采錄后的究竟是什么信息。計算機對外部世界感 知能力的低下,成為開拓計算機應(yīng)用的瓶頸,也與其高超的運算能力形成強烈的對比。 于是,著眼于拓寬計算機的應(yīng)用領(lǐng)域,提高其感知外部信息能力的學(xué)科一一模式識別, 便得到迅速發(fā)展。人工智能所研究的模式識別是指用計算機代替人類或幫助人類感知 模式,是對人類感知外界功能的模擬,研究的是計算機模式識別系統(tǒng),也就是使一個 計算機系統(tǒng)具有模擬人類通過感官接受外界信息、識別和理解周圍環(huán)境的感知能力。關(guān)鍵詞:人工智能、模式識別、應(yīng)用(一)人工智能人工智能(Artificial Intelligenc

3、e)是相對人的自然智能而言,即用人工的方法 和技術(shù),模仿、延伸和擴展人的智能,實現(xiàn)某些“機器思維”作為一門學(xué)科,人工智 能研究智能行為的計算模型,研制具有感知、推理、學(xué)習(xí)、聯(lián)想、決策等思維活動的 計算系統(tǒng),解決需要人類專家才能處理的復(fù)雜問題。人工智能就其本質(zhì)而言,是對人 的思維的信息過程的模擬。(二)模式識別模式識別是指利用計算機或者其他輔助工具對圖形圖像、語言文字、自然物體等 進行信息統(tǒng)計、特征識別和分類的一門學(xué)科。20世紀(jì)50年代人工智能技術(shù)的興起,極大 的帶動了模式識別技術(shù)的發(fā)展。模式識別技術(shù)被廣泛應(yīng)用與人工智能、計算機工程、 神經(jīng)生物學(xué)、智能機器人學(xué)、醫(yī)學(xué)、高能物理、地質(zhì)勘探等多個領(lǐng)域

4、的語音識別、圖 像識別、人臉識別、指紋識別、特征聚類等研究中。模式識別技術(shù)應(yīng)用統(tǒng)計學(xué)方法對 數(shù)據(jù)進行分析和處理,進而指導(dǎo)實際應(yīng)用,對國民經(jīng)濟的發(fā)展和科學(xué)技術(shù)的進步產(chǎn)生 了極大的推動作用。這里,我們把環(huán)境與客體統(tǒng)稱為“模式”,隨著計算機技術(shù)的發(fā)展, 人類有可能研究復(fù)雜的信息處理過程。用計算機實現(xiàn)模式(文字、聲音、人物、物體等) 的自動識別,是開發(fā)智能機器的一個最關(guān)鍵的突破口,也為人類認(rèn)識自身智能提供線 索。信息處理過程的一個重要形式是生命體對環(huán)境及客體的識別。對人類來說,特別 重要的是對光學(xué)信息(通過視覺器官來獲得)和聲學(xué)信息(通過聽覺器官來獲得)的識 別。這是模式識別的兩個重要方面。市場上可見

5、到的代表性產(chǎn)品有光學(xué)字符識別系統(tǒng) (Optical character Recognition, OCR)、語音識別系統(tǒng)等。所謂模式識別,可以理 解為根據(jù)識別對象特征的觀察值將其分到某個類別中的過程。利用計算機進行模式識 別在20世紀(jì)60年代初迅速發(fā)展并成為一門新學(xué)科。模式識別技術(shù)的研究內(nèi)容和研究方法模式識別的主要研究內(nèi)容分為兩個方面。一方面是研究生物體感知對象時所使用 的主要方法和特征,該研究內(nèi)容屬于認(rèn)知科學(xué)范疇;一方面是按照限定條件,利用現(xiàn) 有的模式識別理論和識別方法對給定的目標(biāo)進行識別和分類,改研究內(nèi)容屬于信息科 學(xué)研究范疇。本文所述的模式識別研究內(nèi)容主要指后一類內(nèi)容?,F(xiàn)有的模式識別研究

6、類型有統(tǒng)計模式識別和結(jié)構(gòu)模式識別兩種。其中統(tǒng)計模式識別研 究是當(dāng)前模式識別研究的熱點,其使用基于概率論的貝葉斯決策系統(tǒng)對最優(yōu)分類器進 行設(shè)計,進而實現(xiàn)對目標(biāo)的識別;而結(jié)構(gòu)模式識別則是通過模式與子模式分層結(jié)構(gòu)的 樹狀信息進行識別。統(tǒng)計模式識別研究方法的主要原理為:將相似度超過預(yù)定閾值的樣本聚類成簇。 具體來說,對所要識別的對象的特征觀察量進行特征提取,然后將所提取的特征構(gòu)成 特征向量d,總結(jié)特征向量d,表明當(dāng)前研究的問題具有c個類別,每個類別都有自己 的狀態(tài)w,計算不同模式之間的距離函數(shù),將給定的模式歸入到某一類別中實現(xiàn)特征分 類和模式識別。具體的統(tǒng)計模式識別的分類方法有判別函數(shù)法、k緊鄰分類法

7、、非線性映射法、 特征分解法、主因子分析法等。模式識別技術(shù)的應(yīng)用當(dāng)前的模式識別主要應(yīng)用在以下幾個方面。首先是文字識別。其通過使用計算機 對現(xiàn)有的字符進行聚類分析,得到相應(yīng)的模板庫或者樣本簇,然后對所需識別的文字 進行信息采集和特征分析與處理,進而按照得到的特征進行判別和歸類,實現(xiàn)對文字 的識別。常用的文字識別方法有模板匹配法和幾何特征抽取法等。文字的模式識別是 模式識別最為成熟的應(yīng)用領(lǐng)域,如閱讀、翻譯、檢索、稿件校對和編輯、信息分類等。 其次是語音識別。語音識別的實現(xiàn)需要綜合多學(xué)科技術(shù),如信號處理、信息論和概率 論、人工智能、發(fā)生機理和聽覺機理等才能夠?qū)崿F(xiàn)對語音的識別。語音識別首先要構(gòu) 建樣本

8、模板庫,按照不同語音的頻譜特性或其他特性等進行特征描述,構(gòu)建模板庫, 然后對需要識別的語音信息進行數(shù)字化處理,轉(zhuǎn)變?yōu)檫m合計算機分析的數(shù)字信息,在 模板庫的基礎(chǔ)上對采集到的語音信息按照特定的方式進行人工智能處理,最終實現(xiàn)識 別。近年來,生物識別技術(shù)得到了廣泛的應(yīng)用。其中聲紋識別技術(shù)因具有方便、經(jīng)濟、 準(zhǔn)確等特點被用做身份驗證的一種方式應(yīng)用人們?nèi)粘5纳詈凸ぷ髦?。其中基于基?算法訓(xùn)練的連續(xù)隱馬爾科夫模型語音識別方法具有識別速度快、識別精度高等優(yōu)點, 已經(jīng)成為語音識別中所使用的主流技術(shù)。再次是生物特征識別。生物特征識別技術(shù)是結(jié)合傳感器、生物統(tǒng)計學(xué)、光學(xué)、聲 學(xué)以及計算機技術(shù)等多種高科技技術(shù)而發(fā)展起

9、來的,對人體固有生理特征和行為特征 進行分類和識別的一種技術(shù)。該技術(shù)具有生物學(xué)特性,不僅僅局限于人類本身,諸如 細胞或者人體的指紋等均屬于生物特征識別技術(shù)范疇。這種識別技術(shù)被廣泛應(yīng)用與身 份認(rèn)證中。模式識別技術(shù)的發(fā)展趨勢隨著智能化、信息化、網(wǎng)絡(luò)化的深入,人工智能會更加成熟和完善,而人工智能 技術(shù)的支撐技術(shù)之一就是模式識別技術(shù),因此模式識別技術(shù)具有非常大的發(fā)展空間, 各科研機構(gòu)均將其作為未來科技發(fā)展的重點來對待。具體來說,未來的模式識別技術(shù) 的主要發(fā)展方向有以下幾個方面。(1)語音識別技術(shù)。雖然語音識別技術(shù)在當(dāng)前社會中已經(jīng)有所應(yīng)用,但是其對語 音識別的精度還不夠高,在語音應(yīng)用方面還存在諸多問題,

10、如對中文的識別不夠好等。 同時,鑒于語音技術(shù)正在逐漸成為人機交互的一個關(guān)鍵接口,語音識別的發(fā)展還存在 巨大的空間。我國的互聯(lián)網(wǎng)中心的預(yù)測資料表明,未來五年內(nèi),中文語音識別市場會 有超過400億的市場容量,且之后會按照超過30%的速度進行增長。(2)生物認(rèn)證技術(shù)。生物特征具有唯一性,因此應(yīng)用生物特性進行安全認(rèn)證可以 有效保證認(rèn)證的精度和準(zhǔn)確度,因此基于模式識別技術(shù)的生物認(rèn)證技術(shù)是社會發(fā)展的 方向。完善的生物認(rèn)證技術(shù)可以讓人們脫離對密碼、磁卡或者其他憑證的依賴,只需 要依靠自身的生物特征即可實現(xiàn)身份標(biāo)識。(3)數(shù)字水印技術(shù)。數(shù)字水印技術(shù)在不影響原數(shù)字載體的使用價值的前提下對載 體進行標(biāo)識,這種隱藏

11、的標(biāo)識信息可以被用來進行驗證、識別或者對比等,進而確認(rèn) 數(shù)字載體是否合法或者可用。數(shù)字水印技術(shù)是信息隱藏技術(shù)的一個重要發(fā)展方向。(三)人工智能在模式識別方面的應(yīng)用數(shù)字識別,漢字識別與語音識別手寫體數(shù)字識別在郵政編碼識別、銀行業(yè)務(wù)等方面有重要應(yīng)用,由于字體變化大, 對識別率要求高,所以有較大困難。手寫體數(shù)字識別使用的技術(shù)是人工智能中的神經(jīng) 網(wǎng)絡(luò)技術(shù),神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)能力和快速并行實現(xiàn)的特點,可以用于解決這一問題。相比而言,漢字的識別是更加困難的一件事。常用漢字共有6763個,分為兩級, 第一級3755,第二級包括3008個,在使用的過程中有時還可能會用到其他的外國的字 符以及特殊的符號。每個字符

12、都對應(yīng)著一個類別。即開頭有變化,發(fā)生畸變或受到干 擾等影響的同一字屬于一類,相對于只有10個的數(shù)字而言,漢字的數(shù)量因為大于6000, 而且又有印刷體和手寫體之分,因此,要用計算機進行精確的分類,其困難的程度也 比數(shù)字識別大多了。所以,手寫體漢字的識別是一個很困難的模式識別問題。解決的 辦法,同樣需要神經(jīng)網(wǎng)絡(luò)技術(shù)的支持,而且還要從不同地區(qū)搜集大量的手寫體漢字作 為樣本集對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。其運算量也是驚人的。幸運的是,現(xiàn)在已經(jīng)有了一些 印刷體漢字識別軟件,如清華紫光0cR軟件,就可以識別掃描圖片中的漢字,雖然準(zhǔn)確 率還不是100%,但是這說明在漢字識別方面畢竟已經(jīng)取得了一些進展。中科院自動化 研

13、究所漢王公司開發(fā)成功的“漢王筆”是一套在一塊手寫板上書寫,從而把漢字輸入 計算機的聯(lián)機手寫漢字識別系統(tǒng)。語音識別就是讓計算機能聽懂人說的話,一個重要的例子就是七國語言(英、日、 意、韓、法、德、書口語自動翻譯系統(tǒng)。其中,中文部分的實驗平臺設(shè)立在中國科學(xué) 院自動化所的模式識別國家重點實驗室,這是口語翻譯研究跨入世界領(lǐng)先水平的標(biāo)志。 該系統(tǒng)實現(xiàn)后,人們出國預(yù)定旅館、購買機票、在餐館對話和兌換外幣時,只要利用 電話網(wǎng)絡(luò)和國際聯(lián)網(wǎng),就可用手機、電話等與“老外”通話?;谀J阶R別的網(wǎng)絡(luò)考試系統(tǒng)設(shè)計這是一種基于模式識別的網(wǎng)絡(luò)考試系統(tǒng),對整個軟件的系統(tǒng)結(jié)構(gòu)、功能以及實現(xiàn) 的關(guān)鍵技術(shù)進行了探討。該系統(tǒng)采用SQ

14、L Server數(shù)據(jù)庫和指紋模式識別技術(shù),成功地 實現(xiàn)了網(wǎng)上考試、培訓(xùn)和學(xué)習(xí)等。隨著信息化的不斷發(fā)展,人們需要不斷地進行知識 更新。由于流動單位如乘務(wù)員的工作性質(zhì)較特殊,大規(guī)模的集中學(xué)習(xí)和考試無法滿足 正常的工作需要,而基于模式識別的網(wǎng)絡(luò)考試系統(tǒng)即可達到這一目的。該系統(tǒng)的使用 對基本技能和企業(yè)管理水平的提高有較大的實用價值。本系統(tǒng)主要應(yīng)用于企業(yè)內(nèi)多媒 體教室中,主要由一臺服務(wù)器(PIV,K12MB),多臺PC(PII1533,內(nèi)存28MB)和兩個指紋識別儀,其網(wǎng)絡(luò)布局總體上是采用樹型拓撲結(jié)構(gòu)。本系統(tǒng)采用c+Builder5.0 作為開發(fā)工具,服務(wù)器配置為windows NT操作系統(tǒng)、SQL S

15、erver數(shù)據(jù)庫;教師管理計 算機配置為windows 2000操作系統(tǒng);考生考試終端配置為windows 98 / 2000操作系統(tǒng)。 整個考試系統(tǒng)軟件可分為四個部分:指紋校驗、試卷管理、考生考試和考試記錄。其 中的指紋校驗作為考試系統(tǒng)的關(guān)鍵技術(shù)之一,采用的即是人工智能的模式識別。指紋 模式識別技術(shù)及應(yīng)用實現(xiàn)如下。目前的指紋識別系統(tǒng)總體來看分為兩大類:驗證和辨識。驗證就是通過把一個現(xiàn) 場采集到的指紋與一個已經(jīng)登記的指紋進行一對一的比對來確認(rèn)身份的過程。為驗證 的前提條件,他的指紋必須在指紋庫中已經(jīng)注冊。指紋以一定的壓縮格式存儲,并與 其姓名或其標(biāo)識(ID,PIN)聯(lián)系起來。在比對現(xiàn)場,先驗證

16、其標(biāo)識,然后利用系統(tǒng)的指 紋與現(xiàn)場采集的指紋比對來證明其標(biāo)識是合法的。辨識則是把現(xiàn)場采集到的指紋同指 紋驗證和辨識在比對算法和系統(tǒng)設(shè)計上各具技術(shù)特點。本系統(tǒng)在數(shù)據(jù)庫管理、教師控 制PC和考生登錄上應(yīng)用了指紋驗證和指紋辨識技術(shù)。計算機處理指紋時只涉及到指紋 的一些有限信息,而且比對算法并不是精確匹配,其結(jié)果也不能保證100%準(zhǔn)確。盡管 指紋識別系統(tǒng)存在著可靠性問題,但其安全性比相同可靠性級別的“用戶ID+密碼”方 案的安全性高得多。例如,采用四位數(shù)字密碼的系統(tǒng)不安全概率為).01%,如果同采 用誤判率為0. 01%指紋識別系統(tǒng)相比,由于不誠實的人可以在一段時間內(nèi)試用所有可 能的密碼,因此四位密碼

17、并不安全,但他絕對不可能找到一千個人去為他把所有的手 指(十個手指)都試遍??紤]到指紋識別儀發(fā)生故障等原因,本系統(tǒng)在各種權(quán)限登錄上 設(shè)置了 “用戶ID+密碼”的方式。圖像傳感器CCD驅(qū)動器定時產(chǎn)生器相關(guān)的雙采樣自助增益控制液晶顯示器圖像處理圖像壓縮信號處理器DSPNTSC/PAL 視頻輸出RS232圖1人臉識別系統(tǒng)人臉立體模式識別人臉識別的過程分為3個主要部分:人臉模式庫,即判斷所采集圖像中是否存在人 臉,若有,給出每個人臉的位置、大??;面部特征定位,即對每個人臉檢測其主要器 官的位置和形狀信息,并將其歸一化處理;比對,即根據(jù)面部特征定位的結(jié)果,與圖 像庫中人臉對比,判斷該人臉的身份信息。主流

18、的人臉識別技術(shù)基本上可以歸結(jié)為3 類:基于幾何特征的方法,基于模板的方法和基于模型的方法。基于幾何特征的方法 是最典型的方法,通常需要和其他算法結(jié)合才能有比較好的效果;基于模板的方法可 以分為基于相關(guān)匹配的方法、特征臉方法、線性判別分析方法、奇異值分解方法、神 經(jīng)網(wǎng)絡(luò)方法、動態(tài)連接匹配方法等。基于模型的方法則有基于隱馬爾可夫模型、主動 形狀模型和主動外觀模型的方法等?;谌四樚卣鬟M行身份驗證,易用性好,精確度高,用戶容易接受,穩(wěn)定性好, 相比其它人體生物特征,它具有直接、友好、方便的特點。表情、光照和一定范圍內(nèi) 的姿態(tài)變化是目前人臉識別技術(shù)中影響識別精確度的主要因素。人臉識別的二維圖像 技術(shù)已

19、經(jīng)有很多不同的方法,但基于三維立體圖像的人臉識別技術(shù)卻較少報道。人臉 二維和三維模型獲取不同的臉部外貌特征,二維圖像中的灰度值表示了人臉表面亮度 差異,而三維圖像中加入的深度信息是表示臉形的數(shù)據(jù),信息量更為豐富,更有利于 提高識別效率。所謂數(shù)字信號處理器(Digital signals Process,DSP)嵌入式系統(tǒng),實際上就是 把DSP系統(tǒng)嵌入到應(yīng)用電子系統(tǒng)中,軟件、硬件可裁剪,滿足應(yīng)用系統(tǒng)對功能、可靠性、 成本、體積、功耗等嚴(yán)格要求的專用計算機系統(tǒng),它是一種典型的軟硬件混合系統(tǒng), 自底向上可以分為硬件環(huán)境、嵌入式操作系統(tǒng)和應(yīng)用程序3個部分。基于DSP如模擬器 件(ADI)公司的ADSP系列和德州儀器(TI)公司的TMs系列的立體人臉圖像識別便攜系統(tǒng) 高速準(zhǔn)確,實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論