工業(yè)互聯(lián)系統(tǒng)分析與設(shè)計(jì) 課件 第六章 工業(yè)人工智能(5、6課時(shí))_第1頁
工業(yè)互聯(lián)系統(tǒng)分析與設(shè)計(jì) 課件 第六章 工業(yè)人工智能(5、6課時(shí))_第2頁
工業(yè)互聯(lián)系統(tǒng)分析與設(shè)計(jì) 課件 第六章 工業(yè)人工智能(5、6課時(shí))_第3頁
工業(yè)互聯(lián)系統(tǒng)分析與設(shè)計(jì) 課件 第六章 工業(yè)人工智能(5、6課時(shí))_第4頁
工業(yè)互聯(lián)系統(tǒng)分析與設(shè)計(jì) 課件 第六章 工業(yè)人工智能(5、6課時(shí))_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

工業(yè)互聯(lián)網(wǎng)

IndustrialInternet01第五章工業(yè)人工智能——課時(shí)安排本章課時(shí)任務(wù)時(shí)間270分鐘(6課時(shí))主要學(xué)習(xí)內(nèi)容人工智能背景(1課時(shí));人工智能模型(3課時(shí));工業(yè)大數(shù)據(jù)案例分析(2課時(shí))。本課時(shí)主要目標(biāo)了解工業(yè)人工智能的背景與發(fā)展歷程;了解工業(yè)人工智能的基本流程。第六章工業(yè)人工智能26.6工業(yè)人工智能案例分析(一)

自然語言處理3第六章工業(yè)人工智能——背景圖靈測(cè)試指測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)隔開的情況下,通過一些裝置(如鍵盤)向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后,如果機(jī)器讓平均每個(gè)參與者做出超過30%的誤判,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能。4第六章工業(yè)人工智能——背景ChatGPT

5第六章工業(yè)人工智能案例—自然語言處理自然語言處理在本次課中,將會(huì)向大家展示關(guān)于工業(yè)人工智能的案例分析——自然語言處理。以下會(huì)介紹工業(yè)人工智能領(lǐng)域的實(shí)例:ChatGPT6第六章工業(yè)人工智能案例—自然語言處理自然語言處理——大語言模型大語言模型(英文:LargeLanguageModel,縮寫LLM),也稱大型語言模型,是一種人工智能模型,旨在理解和生成人類語言。它們?cè)诖罅康奈谋緮?shù)據(jù)上進(jìn)行訓(xùn)練,可以執(zhí)行廣泛的任務(wù),包括文本總結(jié)、翻譯、情感分析等等。7第六章工業(yè)人工智能案例—自然語言處理大語言模型有多大?拿GPT來說,GPT其實(shí)出現(xiàn)了好幾代,GPT3它有45個(gè)tb的訓(xùn)練數(shù)據(jù),那么整個(gè)維基百科里面的數(shù)據(jù)只相當(dāng)于他訓(xùn)練數(shù)據(jù)的0.6%。我們?cè)谶@個(gè)訓(xùn)練的時(shí)候把這個(gè)東西稱作語料,就語言材料,這個(gè)語料的量是可以說是集中到我們?nèi)祟愃姓Z言文明的精華在里面,這是一個(gè)非常非常龐大的一個(gè)數(shù)據(jù)庫。8第六章工業(yè)人工智能案例—自然語言處理大語言模型歷史

2018年的時(shí)候谷歌提出了Bert的模型,然后到GPT2,從340兆到10億、15億,然后到83億,然后到170億,然后到GPT31750億的參數(shù)。但是到了2020年的5月,GPT3出來之后,其實(shí)就有了非常大的變化,GPT3的性能比GPT2好很多,它的數(shù)參數(shù)的數(shù)量級(jí)大概是GPT2-10倍以上。9第六章工業(yè)人工智能案例—自然語言處理大語言模型訓(xùn)練方式訓(xùn)練過程包括兩個(gè)主要步驟:預(yù)訓(xùn)練和精調(diào)。在預(yù)訓(xùn)練階段:模型從一個(gè)巨大的、多樣化的數(shù)據(jù)集中學(xué)習(xí),這個(gè)階段允許模型學(xué)習(xí)一般的語言模式和表征。在精調(diào)階段:模型在與目標(biāo)任務(wù)或領(lǐng)域相關(guān)的更具體、更小的數(shù)據(jù)集上進(jìn)一步訓(xùn)練。這有助于模型精調(diào)其理解,并適應(yīng)任務(wù)的特殊要求。10第六章工業(yè)人工智能案例—自然語言處理常見的大語言模型

GPT-3(OpenAI):GPT-3是最著名的LLM之一,擁有1750億個(gè)參數(shù)。目前OpenAI已經(jīng)迭代到了GPT-4版本。

BERT(谷歌):BERT是另一個(gè)流行的LLM,對(duì)NLP研究產(chǎn)生了重大影響。該模型使用雙向方法從一個(gè)詞的左右兩邊捕捉上下文,使得各種任務(wù)的性能提高,如情感分析和命名實(shí)體識(shí)別。

T5(谷歌):T5是一個(gè)LLM,該模型將所有的NLP任務(wù)限定為文本到文本問題,簡(jiǎn)化了模型適應(yīng)不同任務(wù)的過程。T5在總結(jié)、翻譯和問題回答等任務(wù)中表現(xiàn)出強(qiáng)大的性能。

ERNIE3.0文心大模型(百度):百度推出的大語言模型ERNIE3.0首次在百億級(jí)和千億級(jí)預(yù)訓(xùn)練模型中引入大規(guī)模知識(shí)圖譜,提出了海量無監(jiān)督文本與大規(guī)模知識(shí)圖譜的平行預(yù)訓(xùn)練方法。11第六章工業(yè)人工智能案例—自然語言處理自然語言處理——語義分析在這一部分中,我們將要介紹NLP領(lǐng)域的一個(gè)重要問題:語義分析。語義分析分為兩個(gè)部分:詞匯級(jí)語義分析以及句子級(jí)語義分析。12第六章工業(yè)人工智能案例—自然語言處理詞匯級(jí)語義分析——詞義消歧自然語言中一個(gè)詞具有多種含義的現(xiàn)象非常普遍。在英語中,bank這個(gè)詞可能表示銀行,也可能表示河岸;而在漢語中,這樣的例子就更可怕了,比如:13第六章工業(yè)人工智能案例—自然語言處理詞匯級(jí)語義分析——監(jiān)督的語義消歧方法監(jiān)督學(xué)習(xí)的方法就是,數(shù)據(jù)的類別在學(xué)習(xí)之前已經(jīng)知道。在語義消歧的問題上,每個(gè)詞所有可能的義項(xiàng)都是已知的。有監(jiān)督的語義消歧方法是通過一個(gè)已標(biāo)注的語料庫學(xué)習(xí)得到一個(gè)分類模型。常用的方法有:1.基于貝葉斯分類器的詞義消歧方法2.基于最大熵的詞義消歧方法3.基于互信息的消歧方法下面我們只介紹第二種方法14第六章工業(yè)人工智能案例—自然語言處理基于最大熵的詞義消歧方法

在詞義消歧中,最大熵模型的建模與訓(xùn)練如下圖所示:15第六章工業(yè)人工智能案例—自然語言處理基于最大熵的詞義消歧方法訓(xùn)練過后,我們將新的句子輸入模型中,模型會(huì)給出一個(gè)概率分布(其實(shí)最大熵模型的輸出就是一個(gè)概率分布),我們選取其中概率最大的結(jié)果作為模型輸出,整個(gè)過程如下圖所示:16第六章工業(yè)人工智能案例—自然語言處理句子級(jí)語義分析——格文法格文法是從語義的角度出發(fā),即從句子的深層結(jié)構(gòu)來研究句子的結(jié)構(gòu),著重探討句法結(jié)構(gòu)與語義之間關(guān)系的文法理論。17第六章工業(yè)人工智能案例—自然語言處理句子級(jí)語義分析——格文法在傳統(tǒng)語法中,“格”是指主格、賓格等。然而在格文法中,格是深層格,是指句子中的體詞(名詞、代詞等)和謂詞(動(dòng)詞、形容詞等)之間的及物性關(guān)系。這個(gè)概念有些難懂,我們舉個(gè)例子:18第六章工業(yè)人工智能案例—自然語言處理句子級(jí)語義分析——語義角色標(biāo)注法(SRL)基于格文法,提出了一種語義分析的方法——語義角色標(biāo)注。語義角色標(biāo)注方法分為如下三種:1.基于完全句法分析的語義角色標(biāo)注2.基于局部句法分析的語義角色標(biāo)注3.基于依存句法分析的語義角色標(biāo)注但是無論那種方法,語義角色標(biāo)注的過程都如下圖所示:19第六章工業(yè)人工智能案例—自然語言處理基于完全句法分析的統(tǒng)計(jì)SRL方法

舉個(gè)例子,我們?cè)嫉妮斎刖渥邮牵骸熬煲训浆F(xiàn)場(chǎng),正在詳細(xì)調(diào)查事故原因”那么我們的任務(wù)如下:20第六章工業(yè)人工智能案例—自然語言處理基于依存句法分析的統(tǒng)計(jì)SRL方法同樣以“警察已到現(xiàn)場(chǎng),正在詳細(xì)調(diào)查事故原因”為例。由于句法分析方法發(fā)生了改變,所以與上述方法不同的是SRL的輸入:21第六章工業(yè)人工智能案例—自然語言處理基于依存句法分析的神經(jīng)網(wǎng)絡(luò)SRL方法上述兩種方法都是通過概率統(tǒng)計(jì)法進(jìn)行SRL的方法(之前的兩種方法屬于左下角的概率統(tǒng)計(jì)方法)22第六章工業(yè)人工智能案例—自然語言處理自然語言處理——語義分析我們之前提到,神經(jīng)網(wǎng)絡(luò)法的主要目的是為了利用神經(jīng)網(wǎng)絡(luò)自動(dòng)構(gòu)建特征,那么我們很自然就可以想到,該種方法與概率統(tǒng)計(jì)法的主要區(qū)別就在于模型,神經(jīng)網(wǎng)絡(luò)模型架構(gòu)如下:23第六章工業(yè)人工智能案例—自然語言處理自然語言處理——文本分類文本分類(TextClassification或TextCategorization,TC),或者稱為自動(dòng)文本分類(AutomaticTextCategorization),是指計(jì)算機(jī)將載有信息的一篇文本映射到預(yù)先給定的某一類別或某幾類別主題的過程。文本分類系統(tǒng)如下圖所示:24第六章工業(yè)人工智能案例—自然語言處理文本分類——文本預(yù)處理文本要轉(zhuǎn)化成計(jì)算機(jī)可以處理的數(shù)據(jù)結(jié)構(gòu),就需要將文本切分成構(gòu)成文本的語義單元。這些語義單元可以使句子、短語、詞語或單個(gè)的字。本文無論對(duì)于中文還是英文文本,統(tǒng)一將最小語義單元稱為“詞組”。25第六章工業(yè)人工智能案例—自然語言處理文本分類——文本特征提取文本特征提取是自然語言處理中的重要步驟之一,其核心目標(biāo)是從文本數(shù)據(jù)中抽取出能夠描述文本內(nèi)容的有用信息。這些信息可以用于文本分類、情感分析、信息檢索等各種文本分析任務(wù)中。26第六章工業(yè)人工智能案例—自然語言處理文本分類——分類模型

TextCNN是利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)文本進(jìn)行分類的算法詳細(xì)的原理圖如下。27第六章工業(yè)人工智能案例—自然語言處理自然語言處理——情感分析情感分析是自然語言處理中常見的場(chǎng)景,比如淘寶商品評(píng)價(jià),餓了么外賣評(píng)價(jià)等,對(duì)于指導(dǎo)產(chǎn)品更新迭代具有關(guān)鍵性作用。通過情感分析,可以挖掘產(chǎn)品在各個(gè)維度的優(yōu)劣,從而明確如何改進(jìn)產(chǎn)品。28第六章工業(yè)人工智能案例—自然語言處理情感分析——基于詞典的情感分類步驟基于情感詞典的方法,先對(duì)文本進(jìn)行分詞和停用詞處理等預(yù)處理,再利用先構(gòu)建好的情感詞典,對(duì)文本進(jìn)行字符串匹配,從而挖掘正面和負(fù)面信息。如圖:29第六章工業(yè)人工智能案例—自然語言處理情感分析——情感詞典情感詞典包含正面詞語詞典、負(fù)面詞語詞典、否定詞語詞典、程度副詞詞典等四部分。一般詞典包含兩部分,詞語和權(quán)重。30第六章工業(yè)人工智能案例—自然語言處理情感分析——情感詞典文本匹配算法基于詞典的文本匹配算法相對(duì)簡(jiǎn)單。逐個(gè)遍歷分詞后的語句中的詞語,如果詞語命中詞典,則進(jìn)行相應(yīng)權(quán)重的處理31第六章工業(yè)人工智能案例—自然語言處理自然語言處理——自然語言生成(NLG)自然語言生成是一項(xiàng)復(fù)雜的任務(wù),它要求計(jì)算機(jī)系統(tǒng)能夠理解語境、掌握語法規(guī)則,并生成通順、自然的文本。它不僅可以用于自動(dòng)化報(bào)告生成、智能助手,還在創(chuàng)意寫作、廣告創(chuàng)意等領(lǐng)域展現(xiàn)了巨大的潛力。

以下是其步驟:32第六章工業(yè)人工智能案例—自然語言處理自然語言生成——內(nèi)容確定作為第一步,NLG系統(tǒng)需要決定哪些信息應(yīng)該包含在正在構(gòu)建的文本中,哪些不應(yīng)該包含。通常數(shù)據(jù)中包含的信息比最終傳達(dá)的信息要多。33第六章工業(yè)人工智能案例—自然語言處理自然語言生成——文本結(jié)構(gòu)確定需要傳達(dá)哪些信息后,NLG系統(tǒng)需要合理的組織文本的順序。例如在報(bào)道一場(chǎng)籃球比賽時(shí),會(huì)優(yōu)先表達(dá)“什么時(shí)間”“什么地點(diǎn)”“哪2支球隊(duì)”,然后再表達(dá)“比賽的概況”,最后表達(dá)“比賽的結(jié)局”。34第六章工業(yè)人工智能案例—自然語言處理自然語言生成——句子聚合不是每一條信息都需要一個(gè)獨(dú)立的句子來表達(dá),將多個(gè)信息合并到一個(gè)句子里表達(dá)可能會(huì)更加流暢,也更易于閱讀。35第六章工業(yè)人工智能案例—自然語言處理自然語言生成——語法化當(dāng)每一句的內(nèi)容確定下來后,就可以將這些信息組織成自然語言了。這個(gè)步驟會(huì)在各種信息之間加一些連接詞,看起來更像是一個(gè)完整的句子。36第六章工業(yè)人工智能案例—自然語言處理自然語言生成——參考表達(dá)式生成(REG)這個(gè)步驟跟語法化很相似,都是選擇一些單詞和短語來構(gòu)成一個(gè)完整的句子。不過他跟語法化的本質(zhì)區(qū)別在于“REG需要識(shí)別出內(nèi)容的領(lǐng)域,然后使用該領(lǐng)域(而不是其他領(lǐng)域)的詞匯”。37第六章工業(yè)人工智能案例—自然語言處理自然語言生成——語言實(shí)現(xiàn)最后,當(dāng)所有相關(guān)的單詞和短語都已經(jīng)確定時(shí),需要將它們組合起來形成一個(gè)結(jié)構(gòu)良好的完整句子。38第六章工業(yè)人工智能案例—自然語言處理工業(yè)人工智能案例——ChatGPT

ChatGPT(全名:ChatGenerativePre-trainedTransformer),是OpenAI研發(fā)的一款聊天機(jī)器人程序,于2022年11月30日發(fā)布。ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計(jì)規(guī)律,來生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),真正像人類一樣來聊天交流,甚至能完成撰寫論文、郵件、腳本、文案、翻譯、代碼等任務(wù)。39第六章工業(yè)人工智能案例—自然語言處理ChatGPT在工業(yè)自動(dòng)化領(lǐng)域的探索

PLC(ProgrammableLogicController),全稱可編程控制器,相當(dāng)于微型計(jì)算機(jī),通過接收指令控制各種類型的機(jī)械或生產(chǎn)過程,是制造業(yè)在工業(yè)自動(dòng)化時(shí)代進(jìn)行轉(zhuǎn)型升級(jí)的核心設(shè)備,其應(yīng)用領(lǐng)域涵蓋了整個(gè)工業(yè)自動(dòng)化過程的方方面面。ChatGPT與專業(yè)的PLC編程人員比,優(yōu)勢(shì)在什么地方呢?為何西門子選擇PLC編程作為ChatGPT與工業(yè)自動(dòng)化結(jié)合的突破口呢?40第六章工業(yè)人工智能案例—自然語言處理ChatGPT在工業(yè)自動(dòng)化領(lǐng)域的探索一些業(yè)內(nèi)用戶就嘗試過利用ChatGPT生成PLC代碼,發(fā)現(xiàn)目前ChatGPT已經(jīng)能夠進(jìn)行簡(jiǎn)單的代碼編寫,隨后我們也進(jìn)行測(cè)試,讓ChatGPT用梯形語言生成西門子的S7-200PLC的程序,效果如下。41第六章工業(yè)人工智能案例—自然語言處理ChatGPT在工業(yè)自動(dòng)化領(lǐng)域的探索

ChatGPT不僅根據(jù)指令寫出了完整的邏輯結(jié)構(gòu),而且還在最后給了用戶提示:需要根據(jù)不同需求進(jìn)行更改。根據(jù)西門子的理想成果,未來ChatGPT在PLC編程上能夠?qū)崿F(xiàn)根據(jù)自然語言生成PLC代碼,并且只需對(duì)其生成的程序進(jìn)行檢查測(cè)試,節(jié)省編寫時(shí)間,并大大降低代碼錯(cuò)誤概率,節(jié)省代碼修改時(shí)間。42第六章工業(yè)人工智能案例—自然語言處理ChatGPT在工業(yè)自動(dòng)化領(lǐng)域的探索基于OPENAI的技術(shù),企業(yè)有望實(shí)現(xiàn)PLC編程的自動(dòng)化,并且提高PLC編程的效率,同時(shí)也會(huì)大大降低PLC編程的門檻。但是,需要明確的一點(diǎn)是,自動(dòng)化編程技術(shù)需要有一個(gè)合理的框架和算法體系,才能在實(shí)際應(yīng)用中發(fā)揮良好的效果。下面介紹一些主流PLC編程軟件:43第六章工業(yè)人工智能案例—自然語言處理ChatGPT隱藏的風(fēng)險(xiǎn)與挑戰(zhàn)自2023年3月11日韓國三星電子允許部分半導(dǎo)體業(yè)務(wù)部門員工使用ChatGPT開始,在短短20天內(nèi)便爆出了三起機(jī)密資料外泄事件。這表明ChatGPT在釋放企業(yè)勞動(dòng)力和提高工作效率同時(shí)所帶來的風(fēng)險(xiǎn)與挑戰(zhàn)也是不可忽略的。具體表現(xiàn)在以下幾方面:44第六章工業(yè)人工智能案例—自然語言處理ChatGPT隱藏的風(fēng)險(xiǎn)與挑戰(zhàn)成本挑戰(zhàn):除了信息安全外,運(yùn)行成本也是企業(yè)使用ChatGPT前需要考慮的重要條件之一。下面例舉了兩項(xiàng)主要成本僅供參考。第六章工業(yè)人工智能456.6工業(yè)人工智能案例分析(二)

計(jì)算機(jī)視覺46第六章工業(yè)人工智能——案例分析計(jì)算機(jī)視覺的概念計(jì)算機(jī)視覺是人工智能的一個(gè)重要分支,它是研究計(jì)算機(jī)如何獲取、處理、分析和理解數(shù)字圖像的技術(shù)。簡(jiǎn)單來說,,計(jì)算機(jī)視覺的研究者試圖讓計(jì)算機(jī)擁有像人類一樣感知視覺世界并從圖像中了解場(chǎng)景和環(huán)境的能力。47第六章工業(yè)人工智能——案例分析圖像與數(shù)字圖像

?

圖像定義為二維函數(shù)f(x,y),其中x、y是空間坐標(biāo),f(x,y)是點(diǎn)(x,y)的幅值。?

灰度圖像是一個(gè)二維灰度(或亮度)函數(shù)f(x,y)。?彩色圖像由三個(gè)(如RGB)二維灰度(或亮度)函f(x,y)組成。48第六章工業(yè)人工智能——案例分析

?

數(shù)字圖像由二維的元素組成,每一個(gè)元素具有一個(gè)特定的位置(x,y)和分量幅值f(x,y),這些元素就稱為像素。?灰度圖像每個(gè)像素的亮度用一個(gè)數(shù)值來表示,通常數(shù)值范圍在0到255之間,0表示黑、255表示白,其它值表示處于黑白之間的灰度。?彩色圖像可以用紅、綠、藍(lán)三元組的二維矩陣來表示。通常,三元組的每個(gè)數(shù)值也是在0到255之間,0表示相應(yīng)的基色在該像素中沒有,而255則代表相應(yīng)的基色在該像素中取得最大值。49第六章工業(yè)人工智能——案例分析圖像分類與特征提取

將圖像分類到不同的類別,如狗、貓、人等。它利用機(jī)器學(xué)習(xí)技術(shù)訓(xùn)練一個(gè)分類器,然后對(duì)新圖像進(jìn)行預(yù)測(cè)和分類。圖像分類是計(jì)算機(jī)視覺最基本的任務(wù)。50第六章工業(yè)人工智能——案例分析

特征提取就是對(duì)圖片進(jìn)行數(shù)值處理,轉(zhuǎn)換成計(jì)算機(jī)可理解的特征,常用特征提取方法有:HSV直方圖、方向梯度直方圖(HistogramofOrientedGradients,HOG)、局部二值模式(LocalBinaryPattern,LBP)。

HSV(Hue,Saturation,Value)是根據(jù)顏色的直觀特性由A.R.Smith在1978年創(chuàng)建的一種顏色空間,也稱六角錐體模型(HexconeModel)。這個(gè)模型中顏色的參數(shù)分別是:色調(diào)(H),飽和度(S),亮度(V)。51第六章工業(yè)人工智能——案例分析

色調(diào)H:用角度度量,取值范圍為0°~360°,從紅色開始按逆時(shí)針方向計(jì)算,紅色為0°,綠色為120°,藍(lán)色為240°。它們的補(bǔ)色是:黃色為60°,青色為180°,品紅為300°;

飽和度S:取值范圍為0.0~1.0;

亮度V:取值范圍為0.0(黑色)~1.0(白色)。52第六章工業(yè)人工智能——案例分析

HSV特征提取就是將圖像所有像素的RGB值轉(zhuǎn)化為HSV格式,并將HSV值量化后一維展開。53第六章工業(yè)人工智能——案例分析

HOG特征描述符基于圖像局部區(qū)域的梯度方向直方圖來表示圖像特征。它通過計(jì)算圖像中不同方向上的梯度強(qiáng)度和方向,將它們組織成直方圖的形式,從而形成特征向量。這個(gè)特征向量能夠捕捉到圖像中的邊緣、紋理等結(jié)構(gòu)信息,從而用于圖像識(shí)別和目標(biāo)檢測(cè)等任務(wù)。最早由法國研究員Dalal等在CVPR-2005上提出,用于解決人體目標(biāo)檢測(cè)問題。54第六章工業(yè)人工智能——案例分析

主要步驟:灰度化和gamma校正->計(jì)算梯度->統(tǒng)計(jì)cell的梯度方向直方圖->Block塊內(nèi)歸一化->生成HOG特征。55第六章工業(yè)人工智能——案例分析

優(yōu)點(diǎn):1、HOG表示的是邊緣(梯度)的結(jié)構(gòu)特征,因此可以描述局部的形狀信息;2、采取在局部區(qū)域歸一化直方圖,可以部分抵消光照變化帶來的影響。3、由于一定程度忽略了光照顏色對(duì)圖像造成的影響,使得圖像所需要的表征數(shù)據(jù)的維度降低了。4、分塊分單元的處理方法使得圖像局部像素點(diǎn)之間的關(guān)系可以很好得到的表征。缺點(diǎn):1、描述子生成過程冗長(zhǎng),導(dǎo)致速度慢,實(shí)時(shí)性差;2、很難處理遮擋問題;3、由于梯度的性質(zhì),該描述子對(duì)噪點(diǎn)相當(dāng)敏感;4、只使用灰度圖像,未考慮顏色信息。

56第六章工業(yè)人工智能——案例分析

LBP(LocalBinaryPattern,局部二值模式)是一種用來描述圖像局部紋理特征的算子,它具有旋轉(zhuǎn)不變性和灰度不變性等顯著的優(yōu)點(diǎn)。它是首先由T.Ojala,M.Pietik?inen和D.Harwood在1994年提出,用于紋理特征提取。而且,提取的特征是圖像的局部的紋理特征。57第六章工業(yè)人工智能——案例分析

主要步驟:(1)首先將檢測(cè)窗口劃分為16×16的小區(qū)域(cell);(2)對(duì)于每個(gè)cell中的一個(gè)像素,將相鄰的8個(gè)像素的灰度值與其進(jìn)行比較,若周圍像素值大于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0,產(chǎn)生的8位二進(jìn)制數(shù)即該窗口中心像素點(diǎn)的LBP值;(3)然后計(jì)算每個(gè)cell的直方圖,即每個(gè)數(shù)字(假定是十進(jìn)制數(shù)LBP值)出現(xiàn)的頻率;然后對(duì)該直方圖進(jìn)行歸一化處理。(4)最后將得到的每個(gè)cell的統(tǒng)計(jì)直方圖進(jìn)行連接成為一個(gè)特征向量,也就是整幅圖的LBP紋理特征向量。58第六章工業(yè)人工智能——案例分析圖像分割

?在對(duì)圖像的研究和應(yīng)用中,人們往往僅對(duì)圖像中的某些部分感興趣,這些部分一般稱為目標(biāo)或前景。

?為了辨識(shí)和分析目標(biāo),首先需要將有關(guān)區(qū)域分離提取出來,在此基礎(chǔ)上對(duì)目標(biāo)進(jìn)一步利用,如進(jìn)行特征提取和測(cè)量,最后才是識(shí)別。

?圖像分割就是指把圖像分成各具特性的區(qū)域并提取出感興趣目標(biāo)的技術(shù)和過程。59第六章工業(yè)人工智能——案例分析

基本思路:從簡(jiǎn)到難,逐級(jí)分割?控制背景環(huán)境,降低分割難度;?注意力集中在感興趣的對(duì)象,縮小不相干圖像成分的干擾。60第六章工業(yè)人工智能——案例分析

·分割的三大類方法

?根據(jù)區(qū)域間灰度不連續(xù)搜尋區(qū)域之間的邊界,即基于邊緣檢測(cè)的圖像分割;

?以像素性質(zhì)的分布進(jìn)行閾值處理,即基于閾值的圖像分割;

?直接搜尋區(qū)域進(jìn)行分割,即基于區(qū)域的圖像分割。61第六章工業(yè)人工智能——案例分析

基于邊緣檢測(cè)的圖像分割算法是通過檢測(cè)包含不同區(qū)域的邊緣來解決分割問題。它可以說是人們最先想到也是研究最多的方法之一。Prewitt和Sobel算法是最常用的兩種邊緣檢測(cè)算法,Prewitt算法比Sobel算法簡(jiǎn)單,但Sobel算法能夠有效抑制噪聲。梯度算法的結(jié)果Sobel算法Prewitt算法62第六章工業(yè)人工智能——案例分析

閾值法的基本思想是基于圖像的灰度特征來計(jì)算一個(gè)或多個(gè)灰度閾值,并將圖像中每個(gè)像素的灰度值與閾值作比較,最后將像素根據(jù)比較結(jié)果分到合適的類別中。因此,該方法最為關(guān)鍵的一步就是按照某個(gè)準(zhǔn)則函數(shù)來求解最佳灰度閾值。

原始圖像

閾值低,對(duì)亮區(qū)效果好,暗區(qū)差

閾值高,對(duì)暗區(qū)效果好,亮區(qū)差63第六章工業(yè)人工智能——案例分析

分水嶺分割方法,是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測(cè)地學(xué)上的拓?fù)涞孛?,灰度值高的區(qū)域可以被看成是山峰,灰度值低的區(qū)域可以看成是山谷。我們向每一個(gè)山谷中灌注不同顏色的水。隨著水位的升高,不同山谷的水就會(huì)相遇匯合,為了防止不同山谷得到水匯合,我們需要在水匯合的地方構(gòu)建起堤壩。不停的灌水,不停的構(gòu)建堤壩直到所有的山峰都被水淹沒。我們構(gòu)建好的堤壩就是對(duì)圖像的分割。64第六章工業(yè)人工智能——案例分析目標(biāo)跟蹤與圖像理解

目標(biāo)跟蹤,就是指在圖像序列中持續(xù)地估計(jì)出感興趣的運(yùn)動(dòng)目標(biāo)所在區(qū)域(位置),形成運(yùn)動(dòng)目標(biāo)的運(yùn)動(dòng)軌跡;有時(shí)還需要估計(jì)出運(yùn)動(dòng)目標(biāo)的某些運(yùn)動(dòng)參數(shù)(比如速度、加速度等)。65第六章工業(yè)人工智能——案例分析

目標(biāo)跟蹤的表示方法:點(diǎn)表示:在圖像中用一個(gè)點(diǎn)或點(diǎn)集來表示被跟蹤目標(biāo),這些點(diǎn)一般取為目標(biāo)的質(zhì)心、角點(diǎn)等。這種表示方式通常使用在目標(biāo)區(qū)域相對(duì)整個(gè)圖像比較小或者目標(biāo)為只有幾個(gè)到十幾個(gè)像素的點(diǎn)目標(biāo)的情況下。

基本幾何形狀表示:目標(biāo)被表示為一個(gè)矩形區(qū)域或橢圓區(qū)域,這種表示法可以描述目標(biāo)的平移、仿射變換或者投影變換,并且對(duì)剛體和非剛體目標(biāo)都可以表示。66第六章工業(yè)人工智能——案例分析

關(guān)節(jié)模型表示:當(dāng)目標(biāo)可以認(rèn)為是由各個(gè)部位通過結(jié)點(diǎn)銜接到一起的時(shí)候,就可以用關(guān)節(jié)模型來表示,而各個(gè)部位則可以用幾何形狀來表示。

輪廓表示:目標(biāo)的外邊界稱為輪廓,而輪廓內(nèi)的區(qū)域被稱為側(cè)影,它們都可以用來表示復(fù)雜的非剛體目標(biāo)。

骨架模型表示:目標(biāo)骨架可以通過對(duì)側(cè)影的中軸變換得到。骨架模型通??梢员硎娟P(guān)節(jié)模型目標(biāo)和非剛體目標(biāo)。67第六章工業(yè)人工智能——案例分析

目前主流的目標(biāo)跟蹤處理方法是模板匹配法,即在圖像中尋找與樣板相同或相似的區(qū)域。68第六章工業(yè)人工智能——案例分析

圖像理解是對(duì)圖像的語義理解,以圖像為對(duì)象,以知識(shí)為核心。研究:(1)圖像中的目標(biāo);(2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論