版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
人工智能的核心技術(shù)是什么?《人工智能原則化白皮書()》1機器學(xué)習(xí)機器學(xué)習(xí)(MachineLearning)是一門涉及統(tǒng)計學(xué)、系統(tǒng)辨識、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計算機科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,研究計算機如何模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識構(gòu)造使之不停改善本身的性能,是人工智能技術(shù)的核心?;跀?shù)據(jù)的機器學(xué)習(xí)是當(dāng)代智能技術(shù)中的重要辦法之一,研究從觀察數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,運用這些規(guī)律對將來數(shù)據(jù)或無法觀察的數(shù)據(jù)進行預(yù)測。根據(jù)學(xué)習(xí)模式、學(xué)習(xí)辦法以及算法的不同,機器學(xué)習(xí)存在不同的分類辦法。(1)根據(jù)學(xué)習(xí)模式將機器學(xué)習(xí)分類為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)等。監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)是運用已標(biāo)記的有限訓(xùn)練數(shù)據(jù)集,通過某種學(xué)習(xí)方略/辦法建立一個模型,實現(xiàn)對新數(shù)據(jù)/實例的標(biāo)記(分類)/映射,最典型的監(jiān)督學(xué)習(xí)算法涉及回歸和分類。監(jiān)督學(xué)習(xí)規(guī)定訓(xùn)練樣本的分類標(biāo)簽已知,分類標(biāo)簽精確度越高,樣本越含有代表性,學(xué)習(xí)模型的精確度越高。監(jiān)督學(xué)習(xí)在自然語言解決、信息檢索、文本挖掘、手寫體辨識、垃圾郵件偵測等領(lǐng)域獲得了廣泛應(yīng)用。無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)是運用無標(biāo)記的有限數(shù)據(jù)描述隱藏在未標(biāo)記數(shù)據(jù)中的構(gòu)造/規(guī)律,最典型的非監(jiān)督學(xué)習(xí)算法涉及單類密度預(yù)計、單類數(shù)據(jù)降維、聚類等。無監(jiān)督學(xué)習(xí)不需要訓(xùn)練樣本和人工標(biāo)注數(shù)據(jù),便于壓縮數(shù)據(jù)存儲、減少計算量、提高算法速度,還能夠避免正、負(fù)樣本偏移引發(fā)的分類錯誤問題。重要用于經(jīng)濟預(yù)測、異常檢測、數(shù)據(jù)挖掘、圖像解決、模式識別等領(lǐng)域,例如組織大型計算機集群、社交網(wǎng)絡(luò)分析、市場分割、天文數(shù)據(jù)分析等。強化學(xué)習(xí)強化學(xué)習(xí)是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使強化信號函數(shù)值最大。由于外部環(huán)境提供的信息極少,強化學(xué)習(xí)系統(tǒng)必須靠本身的經(jīng)歷進行學(xué)習(xí)。強化學(xué)習(xí)的目的是學(xué)習(xí)從環(huán)境狀態(tài)到行為的映射,使得智能體選擇的行為能夠獲得環(huán)境最大的獎賞,使得外部環(huán)境對學(xué)習(xí)系統(tǒng)在某種意義下的評價為最佳。其在機器人控制、無人駕駛、下棋、工業(yè)控制等領(lǐng)域獲得成功應(yīng)用。(2)根據(jù)學(xué)習(xí)辦法能夠?qū)C器學(xué)習(xí)分為傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)。傳統(tǒng)機器學(xué)習(xí)傳統(tǒng)機器學(xué)習(xí)從某些觀察(訓(xùn)練)樣本出發(fā),試圖發(fā)現(xiàn)不能通過原理分析獲得的規(guī)律,實現(xiàn)對將來數(shù)據(jù)行為或趨勢的精確預(yù)測。有關(guān)算法涉及邏輯回歸、隱馬爾科夫辦法、支持向量機辦法、K近鄰辦法、三層人工神經(jīng)網(wǎng)絡(luò)辦法、Adaboost算法、貝葉斯辦法以及決策樹辦法等。傳統(tǒng)機器學(xué)習(xí)平衡了學(xué)習(xí)成果的有效性與學(xué)習(xí)模型的可解釋性,為解決有限樣本的學(xué)習(xí)問題提供了一種框架,重要用于有限樣本狀況下的模式分類、回歸分析、概率密度預(yù)計等。傳統(tǒng)機器學(xué)習(xí)辦法共同的重要理論基礎(chǔ)之一是統(tǒng)計學(xué),在自然語言解決、語音識別、圖像識別、信息檢索和生物信息等許多計算機領(lǐng)域獲得了廣泛應(yīng)用。深度學(xué)習(xí)深度學(xué)習(xí)是建立深層構(gòu)造模型的學(xué)習(xí)辦法,典型的深度學(xué)習(xí)算法涉及深度置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、受限玻爾茲曼機和循環(huán)神經(jīng)網(wǎng)絡(luò)等。深度學(xué)習(xí)又稱為深度神經(jīng)網(wǎng)絡(luò)(指層數(shù)超出3層的神經(jīng)網(wǎng)絡(luò))。深度學(xué)習(xí)作為機器學(xué)習(xí)研究中的一個新興領(lǐng)域,由Hinton等人于年提出。深度學(xué)習(xí)源于多層神經(jīng)網(wǎng)絡(luò),其實質(zhì)是給出了一種將特性表達(dá)和學(xué)習(xí)合二為一的方式。深度學(xué)習(xí)的特點是放棄了可解釋性,單純追求學(xué)習(xí)的有效性。通過數(shù)年的探索嘗試和研究,已經(jīng)產(chǎn)生了諸多深度神經(jīng)網(wǎng)絡(luò)的模型,其中卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)是兩類典型的模型。卷積神經(jīng)網(wǎng)絡(luò)常被應(yīng)用于空間性分布數(shù)據(jù);循環(huán)神經(jīng)網(wǎng)絡(luò)在神經(jīng)網(wǎng)絡(luò)中引入了記憶和反饋,常被應(yīng)用于時間性分布數(shù)據(jù)。深度學(xué)習(xí)框架是進行深度學(xué)習(xí)的基礎(chǔ)底層框架,普通包含主流的神經(jīng)網(wǎng)絡(luò)算法模型,提供穩(wěn)定的深度學(xué)習(xí)API,支持訓(xùn)練模型在服務(wù)器和GPU、TPU間的分布式學(xué)習(xí),部分框架還含有在涉及移動設(shè)備、云平臺在內(nèi)的多個平臺上運行的移植能力,從而為深度學(xué)習(xí)算法帶來前所未有的運行速度和實用性?,F(xiàn)在主流的開源算法框架有TensorFlow、Caffe/Caffe2、CNTK、MXNet、Paddle-paddle、Torch/PyTorch、Theano等。(3)另外,機器學(xué)習(xí)的常見算法還涉及遷移學(xué)習(xí)、主動學(xué)習(xí)和演化學(xué)習(xí)等。遷移學(xué)習(xí)遷移學(xué)習(xí)是指當(dāng)在某些領(lǐng)域無法獲得足夠多的數(shù)據(jù)進行模型訓(xùn)練時,運用另一領(lǐng)域數(shù)據(jù)獲得的關(guān)系進行的學(xué)習(xí)。遷移學(xué)習(xí)能夠把已訓(xùn)練好的模型參數(shù)遷移到新的模型指導(dǎo)新模型訓(xùn)練,能夠更有效的學(xué)習(xí)底層規(guī)則、減少數(shù)據(jù)量?,F(xiàn)在的遷移學(xué)習(xí)技術(shù)重要在變量有限的小規(guī)模應(yīng)用中使用,如基于傳感器網(wǎng)絡(luò)的定位,文字分類和圖像分類等。將來遷移學(xué)習(xí)將被廣泛應(yīng)用于解決更有挑戰(zhàn)性的問題,如視頻分類、社交網(wǎng)絡(luò)分析、邏輯推理等。主動學(xué)習(xí)主動學(xué)習(xí)通過一定的算法查詢最有用的未標(biāo)記樣本,并交由專家進行標(biāo)記,然后用查詢到的樣本訓(xùn)練分類模型來提高模型的精度。主動學(xué)習(xí)能夠選擇性地獲取知識,通過較少的訓(xùn)練樣本獲得高性能的模型,最慣用的方略是通過不擬定性準(zhǔn)則和差別性準(zhǔn)則選用有效的樣本。演化學(xué)習(xí)演化學(xué)習(xí)對優(yōu)化問題性質(zhì)規(guī)定極少,只需能夠評定解的好壞即可,合用于求解復(fù)雜的優(yōu)化問題,也能直接用于多目的優(yōu)化。演化算法涉及粒子群優(yōu)化算法、多目的演化算法等?,F(xiàn)在針對演化學(xué)習(xí)的研究重要集中在演化數(shù)據(jù)聚類、對演化數(shù)據(jù)更有效的分類,以及提供某種自適應(yīng)機制以擬定演化機制的影響等。2知識圖譜知識圖譜本質(zhì)上是構(gòu)造化的語義知識庫,是一種由節(jié)點和邊構(gòu)成的圖數(shù)據(jù)結(jié)構(gòu),以符號形式描述物理世界中的概念及其互有關(guān)系,其基本構(gòu)成單位是“實體—關(guān)系—實體”三元組,以及實體及其有關(guān)“屬性—值”對。不同實體之間通過關(guān)系互相聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識構(gòu)造。在知識圖譜中,每個節(jié)點表達(dá)現(xiàn)實世界的“實體”,每條邊為實體與實體之間的“關(guān)系”。通俗地講,知識圖譜就是把全部不同種類的信息連接在一起而得到的一種關(guān)系網(wǎng)絡(luò),提供了從“關(guān)系”的角度去分析問題的能力。知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領(lǐng)域,需要用到異常分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘辦法。特別地,知識圖譜在搜索引擎、可視化展示和精確營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但是,知識圖譜的發(fā)展尚有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)本身有錯誤或者數(shù)據(jù)存在冗余。隨著知識圖譜應(yīng)用的不停進一步,尚有一系列核心技術(shù)需要突破。3自然語言解決自然語言解決是計算機科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一種重要方向,研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的多個理論和辦法,涉及的領(lǐng)域較多,重要涉及機器翻譯、機器閱讀理解和問答系統(tǒng)等。(1)機器翻譯機器翻譯技術(shù)是指運用計算機技術(shù)實現(xiàn)從一種自然語言到另外一種自然語言的翻譯過程?;诮y(tǒng)計的機器翻譯辦法突破了之前基于規(guī)則和實例翻譯辦法的局限性,翻譯性能獲得巨大提高?;谏疃壬窠?jīng)網(wǎng)絡(luò)的機器翻譯在日??谡Z等一些場景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和知識邏輯推理能力的發(fā)展,自然語言知識圖譜不停擴充,機器翻譯將會在多輪對話翻譯及篇章翻譯等領(lǐng)域獲得更大進展?,F(xiàn)在非限定領(lǐng)域機器翻譯中性能較佳的一種是統(tǒng)計機器翻譯,涉及訓(xùn)練及解碼兩個階段。訓(xùn)練階段的目的是獲得模型參數(shù),解碼階段的目的是運用所預(yù)計的參數(shù)和給定的優(yōu)化目的,獲取待翻譯語句的最佳翻譯成果。統(tǒng)計機器翻譯重要包括語料預(yù)解決、詞對齊、短語抽取、短語概率計算、最大熵調(diào)序等環(huán)節(jié)?;谏窠?jīng)網(wǎng)絡(luò)的端到端翻譯辦法不需要針對雙語句子專門設(shè)計特性模型,而是直接把源語言句子的詞串送入神經(jīng)網(wǎng)絡(luò)模型,通過神經(jīng)網(wǎng)絡(luò)的運算,得到目的語言句子的翻譯成果。在基于端到端的機器翻譯系統(tǒng)中,普通采用遞歸神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)對句子進行表征建模,從海量訓(xùn)練數(shù)據(jù)中抽取語義信息,與基于短語的統(tǒng)計翻譯相比,其翻譯成果更加流暢自然,在實際應(yīng)用中獲得了較好的效果。(2)語義理解語義理解技術(shù)是指運用計算機技術(shù)實現(xiàn)對文本篇章的理解,并且回答與篇章有關(guān)問題的過程。語義理解更重視于對上下文的理解以及對答案精確程度的把控。隨著MCTest數(shù)據(jù)集的公布,語義理解受到更多關(guān)注,獲得了快速發(fā)展,有關(guān)數(shù)據(jù)集和對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮。語義理解技術(shù)將在智能客服、產(chǎn)品自動問答等有關(guān)領(lǐng)域發(fā)揮重要作用,進一步提高問答與對話系統(tǒng)的精度。在數(shù)據(jù)采集方面,語義理解通過自動構(gòu)造數(shù)據(jù)辦法和自動構(gòu)造填空型問題的辦法來有效擴充數(shù)據(jù)資源。為理解決填充型問題,某些基于深度學(xué)習(xí)的辦法相繼提出,如基于注意力的神經(jīng)網(wǎng)絡(luò)辦法。現(xiàn)在主流的模型是運用神經(jīng)網(wǎng)絡(luò)技術(shù)對篇章、問題建模,對答案的開始和終止位置進行預(yù)測,抽取出篇章片段。對于進一步泛化的答案,解決難度進一步提高,現(xiàn)在的語義理解技術(shù)仍有較大的提高空間。(3)問答系統(tǒng)問答系統(tǒng)分為開放領(lǐng)域的對話系統(tǒng)和特定領(lǐng)域的問答系統(tǒng)。問答系統(tǒng)技術(shù)是指讓計算機像人類同樣用自然語言與人交流的技術(shù)。人們能夠向問答系統(tǒng)提交用自然語言體現(xiàn)的問題,系統(tǒng)會返回關(guān)聯(lián)性較高的答案。盡管問答系統(tǒng)現(xiàn)在已有了不少應(yīng)用產(chǎn)品出現(xiàn),但大多是在實際信息服務(wù)系統(tǒng)和智能手機助手等領(lǐng)域中的應(yīng)用,在問答系統(tǒng)魯棒性方面仍然存在著問題和挑戰(zhàn)。自然語言解決面臨四大挑戰(zhàn):一是在詞法、句法、語義、語用和語音等不同層面存在不擬定性;二是新的詞匯、術(shù)語、語義和語法造成未知語言現(xiàn)象的不可預(yù)測性;三是數(shù)據(jù)資源的不充足使其難以覆蓋復(fù)雜的語言現(xiàn)象;四是語義知識的含糊性和錯綜復(fù)雜的關(guān)聯(lián)性難以用簡樸的數(shù)學(xué)模型描述,語義計算需要參數(shù)龐大的非線性計算。4人機交互人機交互重要研究人和計算機之間的信息交換,重要涉及人到計算機和計算機到人的兩部分信息交換,是人工智能領(lǐng)域的重要的外圍技術(shù)。人機交互是與認(rèn)知心理學(xué)、人機工程學(xué)、多媒體技術(shù)、虛擬現(xiàn)實技術(shù)等親密有關(guān)的綜合學(xué)科。傳統(tǒng)的人與計算機之間的信息交換重要依靠交互設(shè)備進行,重要涉及鍵盤、鼠標(biāo)、操縱桿、數(shù)據(jù)服裝、眼動跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓力筆等輸入設(shè)備,以及打印機、繪圖儀、顯示屏、頭盔式顯示屏、音箱等輸出設(shè)備。人機交互技術(shù)除了傳統(tǒng)的基本交互和圖形交互外,還涉及語音交互、情感交互、體感交互及腦機交互等技術(shù),下列對后四種與人工智能關(guān)聯(lián)親密的典型交互手段進行介紹。(1)語音交互語音交互是一種高效的交互方式,是人以自然語音或機器合成語音同計算機進行交互的綜合性技術(shù),結(jié)合了語言學(xué)、心理學(xué)、工程和計算機技術(shù)等領(lǐng)域的知識。語音交互不僅要對語音識別和語音合成進行研究,還要對人在語音通道下的交互機理、行為方式等進行研究。語音交互過程涉及四部分:語音采集、語音識別、語義理解和語音合成。語音采集完畢音頻的錄入、采樣及編碼;語音識別完成語音信息到機器可識別的文本信息的轉(zhuǎn)化;語義理解根據(jù)語音識別轉(zhuǎn)換后的文本字符或命令完畢對應(yīng)的操作;語音合成完畢文本信息到聲音信息的轉(zhuǎn)換。作為人類溝通和獲取信息最自然便捷的手段,語音交互比其它交互方式含有更多優(yōu)勢,能為人機交互帶來根本性變革,是大數(shù)據(jù)和認(rèn)知計算時代將來發(fā)展的制高點,具有廣闊的發(fā)展前景和應(yīng)用前景。(2)情感交互情感是一種高層次的信息傳遞,而情感交互是一種交互狀態(tài),它在體現(xiàn)功效和信息時傳遞情感,勾起人們的記憶或內(nèi)心的情愫。傳統(tǒng)的人機交互無法理解和適應(yīng)人的情緒或心境,缺少情感理解和體現(xiàn)能力,計算機難以含有類似人同樣的智能,也難以通過人機交互做到真正的和諧與自然。情感交互就是要賦予計算機類似于人同樣的觀察、理解和生成多個情感的能力,最后使計算機像人同樣能進行自然、親切和生動的交互。情感交互已經(jīng)成為人工智能領(lǐng)域中的熱點方向,旨在讓人機交互變得更加自然?,F(xiàn)在,在情感交互信息的解決方式、情感描述方式、情感數(shù)據(jù)獲取和解決過程、情感體現(xiàn)方式等方面尚有諸多技術(shù)挑戰(zhàn)。(3)體感交互體感交互是個體不需要借助任何復(fù)雜的控制系統(tǒng),以體感技術(shù)為基礎(chǔ),直接通過肢體動作與周邊數(shù)字設(shè)備裝置和環(huán)境進行自然的交互。根據(jù)體感方式與原理的不同,體感技術(shù)重要分為三類:慣性感測、光學(xué)感測以及光學(xué)聯(lián)合感測。體感交互普通由運動追蹤、手勢識別、運動捕獲、面部表情識別等一系列技術(shù)支撐。與其它交互手段相比,體感交互技術(shù)無論是硬件還是軟件方面都有了較大的提高,交互設(shè)備向小型化、便攜化、使用方便化等方面發(fā)展,大大減少了對顧客的約束,使得交互過程更加自然。現(xiàn)在,體感交互在游戲娛樂、醫(yī)療輔助與康復(fù)、全自動三維建模、輔助購物、眼動儀等領(lǐng)域有了較為廣泛的應(yīng)用。(4)腦機交互腦機交互又稱為腦機接口,指不依賴于外圍神經(jīng)和肌肉等神經(jīng)通道,直接實現(xiàn)大腦與外界信息傳遞的通路。腦機接口系統(tǒng)檢測中樞神經(jīng)系統(tǒng)活動,并將其轉(zhuǎn)化為人工輸出指令,能夠替代、修復(fù)、增強、補充或者改善中樞神經(jīng)系統(tǒng)的正常輸出,從而變化中樞神經(jīng)系統(tǒng)與內(nèi)外環(huán)境之間的交互作用。腦機交互通過對神經(jīng)信號解碼,實現(xiàn)腦信號到機器指令的轉(zhuǎn)化,普通涉及信號采集、特性提取和命令輸出三個模塊。從腦電信號采集的角度,普通將腦機接口分為侵入式和非侵入式兩大類。除此之外,腦機接口尚有其它常見的分類方式:按照信號傳輸方向能夠分為腦到機、機到腦和腦機雙向接口;按照信號生成的類型,可分為自發(fā)式腦機接口和誘發(fā)式腦機接口;按照信號源的不同還可分為基于腦電的腦機接口、基于功效性核磁共振的腦機接口以及基于近紅外光譜分析的腦機接口。5計算機視覺計算機視覺是使用計算機模仿人類視覺系統(tǒng)的科學(xué),讓計算機擁有類似人類提取、解決、理解和分析圖像以及圖像序列的能力。自動駕駛、機器人、智能醫(yī)療等領(lǐng)域均需要通過計算機視覺技術(shù)從視覺信號中提取并解決信息。近來隨著深度學(xué)習(xí)的發(fā)展,預(yù)解決、特性提取與算法解決漸漸融合,形成端到端的人工智能算法技術(shù)。根據(jù)解決的問題,計算機視覺可分為計算成像學(xué)、圖像理解、三維視覺、動態(tài)視覺和視頻編解碼五大類。(1)計算成像學(xué)計算成像學(xué)是探索人眼構(gòu)造、相機成像原理以及其延伸應(yīng)用的科學(xué)。在相機成像原理方面,計算成像學(xué)不停增進現(xiàn)有可見光相機的完善,使得當(dāng)代相機更加輕便,能夠合用于不同場景。同時計算成像學(xué)也推動著新型相機的產(chǎn)生,使相機超出可見光的限制。在相機應(yīng)用科學(xué)方面,計算成像學(xué)能夠提高相機的能力,從而通過后續(xù)的算法解決使得在受限條件下拍攝的圖像更加完善,例如圖像去噪、去含糊、暗光增強、去霧霾等,以及實現(xiàn)新的功效,例如全景圖、軟件虛化、超分辨率等。(2)圖像理解圖像理解是通過用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界的一門科學(xué)。普通根據(jù)理解信息的抽象程度可分為三個層次:淺層理解,涉及圖像邊沿、圖像特性點、紋理元素等;中層理解,涉及物體邊界、區(qū)域與平面等;高層理解,根據(jù)需要抽取的高層語義信息,可大致分為識別、檢測、分割、姿態(tài)預(yù)計、圖像文字闡明等?,F(xiàn)在高層圖像理解算法已逐步廣泛應(yīng)用于人工智能系統(tǒng),如刷臉支付、智慧安防、圖像搜索等。(3)三維視覺三維視覺即研究如何通過視覺獲取三維信息(三維重建)以及如何理解所獲取的三維信息的科學(xué)。三維重建能夠根據(jù)重建的信息來源,分為單目圖像重建、多目圖像重建和深度圖像重建等。三維信息理解,即使用三維信息輔助圖像理解或者直接理解三維信息。三維信息理解可分為,淺層:角點、邊沿、法向量等;中層:平面、立方體等;高層:物體檢測、識別、分割等。三維視覺技術(shù)能夠廣泛應(yīng)用于機器人、無人駕駛、智慧工廠、虛擬/增強現(xiàn)實等方向。(4)動態(tài)視覺動態(tài)視覺即分析視頻或圖像序列,模擬人解決時序圖像的科學(xué)。普通動態(tài)視覺問題能夠定義為尋找圖像元素,如像素、區(qū)域、物體在時序上的對應(yīng),以及提取其語義信息的問題。動態(tài)視覺研究被廣泛應(yīng)用在視頻分析以及人機交互等方面。(5)視頻編解碼視頻編解碼是指通過特定的壓縮技術(shù),將視頻流進行壓縮。視頻流傳輸中最為重要的編解碼原則有國際電聯(lián)的H.261、H.263、H.264、H.265、M-JPEG和MPEG系列原則。視頻壓縮編碼重要分為兩大類:無損壓縮和有損壓縮。無損壓縮指使用壓縮后的數(shù)據(jù)進行重構(gòu)時,重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)完全相似,例如磁盤文獻的壓縮。有損壓縮也稱為不可逆編碼,指使用壓縮后的數(shù)據(jù)進行重構(gòu)時,重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)有差別,但不會影響人們對原始資料所體現(xiàn)的信息產(chǎn)生誤解。有損壓縮的應(yīng)用范疇廣泛,例如視頻會議、可視電話、視頻廣播、視頻監(jiān)控等?,F(xiàn)在,計算機視覺技術(shù)發(fā)展快速,已含有初步的產(chǎn)業(yè)規(guī)模。將來計算機視覺技術(shù)的發(fā)展重要面臨下列挑戰(zhàn):一是如何在不同的應(yīng)用領(lǐng)域和其它技術(shù)更加好的結(jié)合,計算機視覺在解決某些問題時能夠廣泛運用大數(shù)據(jù),已經(jīng)逐步成熟并且能夠超出人類,而在某些問題上卻無法達(dá)成很高的精度;二是如何減少計算機視覺算法的開發(fā)時間和人力成本,現(xiàn)在計算機視覺算法需要大量的數(shù)據(jù)與人工標(biāo)注,需要較長的研發(fā)周期以達(dá)成應(yīng)用領(lǐng)域所規(guī)定的精度與耗時;三是如何加緊新型算法的設(shè)計開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),針對不同芯片與數(shù)據(jù)采集設(shè)備的計算機視覺算法的設(shè)計與開發(fā)也是挑戰(zhàn)之一。6生物特性識別生物特性識別技術(shù)是指通過個體生理特性或行為特性對個體身份進行識別認(rèn)證的技術(shù)。從應(yīng)用流程看,生物特性識別普通分為注冊和識別兩個階段。注冊階段通過傳感器對人體的生物表征信息進行采集,如運用圖像傳感器對指紋和人臉等光學(xué)信息、麥克風(fēng)對說話聲等聲學(xué)信息進行采集,運用數(shù)據(jù)預(yù)解決以及特性提取技術(shù)對采集的數(shù)據(jù)進行解決,得到對應(yīng)的特性進行存儲。識別過程采用與注冊過程一致的信息采集方式看待識別人進行信息采集、數(shù)據(jù)預(yù)解決和特性提取,然后將提取的特性與存儲的特性進行比對分析,完畢識別。從應(yīng)用任務(wù)看,生物特性識別普通分為識別與確認(rèn)兩種任務(wù),識別是指從存儲庫中擬定待識別人身份的過程,是一對多的問題;確認(rèn)是指將待識別人信息與存儲庫中特定單人信息進行比對,擬定身份的過程,是一對一的問題。生物特性識別技術(shù)涉及的內(nèi)容十分廣泛,涉及指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多個生物特性,其識別過程涉及到圖像解決、計算機視覺、語音識別、機器學(xué)習(xí)等多項技術(shù)?,F(xiàn)在生物特性識別作為重要的智能化身份認(rèn)證技術(shù),在金融、公共安全、教育、交通等領(lǐng)域得到廣泛的應(yīng)用。下面將對指紋識別、人臉識別、虹膜識別、指靜脈識別、聲紋識別以及步態(tài)識別等技術(shù)進行介紹。(1)指紋識別指紋識別過程普通涉及數(shù)據(jù)采集、數(shù)據(jù)解決、分析鑒別三個過程。數(shù)據(jù)采集通過光、電、力、熱等物理傳感器獲取指紋圖像;數(shù)據(jù)解決涉及預(yù)解決、畸變校正、特性提取三個過程;分析鑒別是對提取的特性進行分析鑒別的過程。(2)人臉識別人臉識別是典型的計算機視覺應(yīng)用,從應(yīng)用過程來看,可將人臉識別技術(shù)劃分為檢測定位、面部特性提取以及人臉確認(rèn)三個過程。人臉識別技術(shù)的應(yīng)用重要受到光照、拍攝角度、圖像遮擋、年紀(jì)等多個因素的影響,在約束條件下人臉識別技術(shù)相對成熟,在自由條件下人臉識別技術(shù)還在不停改善。(3)虹膜識別虹膜識別的理論框架重要涉及虹膜圖像分割、虹膜區(qū)域歸一化、特性提取和識別四個部分,研究工作大多是基于此理論框架發(fā)展而來。虹膜識別技術(shù)應(yīng)用的重要難題包含傳感器和光照影響兩個方面:首先,由于虹膜尺寸小且受黑色素遮擋,需在近紅外光源下采用高分辨圖像傳感器才可清晰成像,對傳感器質(zhì)量和穩(wěn)定性規(guī)定比較高;另首先,光照的強弱變化會引發(fā)瞳孔縮放,造成虹膜紋理產(chǎn)生復(fù)雜形變,增加了匹配的難度。(4)指靜脈識別指靜脈識別是運用了人體靜脈血管中的脫氧血紅蛋白對特定波長范疇內(nèi)的近紅外線有較好的吸取作用這一特性,采用近紅外光對指靜脈進行成像與識別的技術(shù)。由于指靜脈血管分布隨機性很強,其網(wǎng)絡(luò)特性含有較好的唯一性,且屬于人體內(nèi)部特性,不受到外界影響,因此模態(tài)特性十分穩(wěn)定。指靜脈識別技術(shù)應(yīng)用面臨的重要難題來自于成像單元。(5)聲紋識別聲紋識別是指根據(jù)待識別語音的聲紋特性識別說話人的技術(shù)。聲紋識別技術(shù)普通能夠分為前端解決和建模分析兩個階段。聲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026河北滄州醫(yī)學(xué)高等??茖W(xué)校高層次人才選聘50人參考筆試題庫附答案解析
- 2026中能建城市投資發(fā)展有限公司校園招聘模擬筆試試題及答案解析
- 2025重慶機場集團有限公司校園招聘36人備考筆試題庫及答案解析
- 2025山西長治市上黨區(qū)公益性崗位人員招聘50人備考考試試題及答案解析
- 2025福建廈門市集美區(qū)寧寶幼兒園非在編廚房人員招聘1人模擬筆試試題及答案解析
- 2025江蘇南京鼓樓醫(yī)院人力資源服務(wù)中心招聘4人備考考試試題及答案解析
- 2025廣東佛山市南海區(qū)國有資產(chǎn)監(jiān)督管理局財務(wù)總監(jiān)招聘1人參考筆試題庫附答案解析
- 2025廣西玉林市玉州區(qū)仁東中心衛(wèi)生院招聘編外人員2人備考考試試題及答案解析
- 2025湖南衡陽市衡陽縣衛(wèi)健系統(tǒng)招聘專業(yè)技術(shù)人員48人考試備考題庫及答案解析
- 2025廣東廣州市衛(wèi)生健康委員會直屬事業(yè)單位廣州市第十二人民醫(yī)院招聘26人(第一次)備考筆試試題及答案解析
- 護理手術(shù)室理論知識培訓(xùn)課件
- 寧德時代shl測試題庫以及答案解析
- 立體倉庫安全操作培訓(xùn)課件
- 2025年廣西公需科目一區(qū)兩地一園一通道建設(shè)題庫與答案
- 導(dǎo)游講解員培訓(xùn)
- 護士藥品管理工作總結(jié)
- 水庫工程初步設(shè)計報告技術(shù)審查要點(湖南省)
- 放療患者的飲食指導(dǎo)及護理
- 2025年高鐵專用電纜溝工程設(shè)計與施工總承包合同
- 瞼板腺按摩知識培訓(xùn)課件
- 檢修掛牌制度培訓(xùn)課件
評論
0/150
提交評論