計(jì)算機(jī)本科畢業(yè)設(shè)計(jì)-瀏覽器過濾軟件的實(shí)現(xiàn)_第1頁
計(jì)算機(jī)本科畢業(yè)設(shè)計(jì)-瀏覽器過濾軟件的實(shí)現(xiàn)_第2頁
計(jì)算機(jī)本科畢業(yè)設(shè)計(jì)-瀏覽器過濾軟件的實(shí)現(xiàn)_第3頁
計(jì)算機(jī)本科畢業(yè)設(shè)計(jì)-瀏覽器過濾軟件的實(shí)現(xiàn)_第4頁
計(jì)算機(jī)本科畢業(yè)設(shè)計(jì)-瀏覽器過濾軟件的實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

瀏覽器過濾軟件的實(shí)現(xiàn)摘要近年來,惡意信息(主要是淫穢色情內(nèi)容)蔓延到互聯(lián)網(wǎng)和移動(dòng)通信網(wǎng)絡(luò),對(duì)廣大未成年人的身心健康造成了不利影響。這個(gè)問題越來越受到各個(gè)學(xué)科的關(guān)注。目前,不良照片和不良網(wǎng)站主要有三種過濾技術(shù):基于URL的過濾、基于文本的過濾和基于圖像的過濾。與前兩種技術(shù)相比,基于圖像內(nèi)容的過濾技術(shù)更具適應(yīng)性和靈活性。本主題重點(diǎn)介紹基于圖像內(nèi)容的過濾。截至2019年9月,我們尚未獲得關(guān)于應(yīng)用于CNKI移動(dòng)瀏覽器的基于圖像內(nèi)容的惡意圖像過濾的國內(nèi)論文調(diào)查。此外,搜索引擎也沒有找到任何用于銷售或推廣的國內(nèi)應(yīng)用程序?;谝苿?dòng)瀏覽器中圖像內(nèi)容的流氓圖像過濾軟件。首先,在桌面Windows的瀏覽器中實(shí)現(xiàn)過濾不良圖像的軟件。軟件的網(wǎng)絡(luò)數(shù)據(jù)截取模塊采用LSP技術(shù),圖像檢測(cè)模塊采用人臉檢測(cè)、白平衡、皮膚檢測(cè)、支持向量機(jī)等技術(shù)。SWM等(包括膚色檢測(cè)、紋理檢測(cè)、連續(xù)皮膚區(qū)域檢測(cè)等)。該軟件已被證明非常準(zhǔn)確,可以實(shí)時(shí)過濾從桌面Windows瀏覽器訪問的不良圖像。之后我將不適用于WindowsMobile的Openc庫移植到WindowsMobile6平臺(tái),并將針對(duì)桌面Windows開發(fā)的瀏覽器惡意圖片過濾軟件移植到WindowsMobile6平臺(tái)。經(jīng)測(cè)試,在Windows手機(jī)上運(yùn)行良好,但由于智能手機(jī)的硬件狀態(tài),智能手機(jī)上的人臉檢測(cè)一般需要大量計(jì)算,圖像檢測(cè)模塊需要時(shí)間。關(guān)鍵詞:瀏覽器過濾軟件系統(tǒng)設(shè)計(jì)手機(jī)PC端

目錄TOC\o"1-3"\h\u13150摘要 123237第一章緒論 1288091.1研究背景 1175991.2研究意義 126351.3國內(nèi)外研究現(xiàn)狀 211024第二章相關(guān)技術(shù)概述 532562.1網(wǎng)絡(luò)監(jiān)控技術(shù) 549382.2信息過濾 5221802.3基于URL的過濾技術(shù) 614935第三章軟件需求分析和總體框架設(shè)計(jì) 711564第四章基于內(nèi)容的敏感圖片過濾技術(shù) 8177424.1圖片庫的建立 830004.2掩碼圖像的輔助處理 8107494.3紋理檢測(cè)模型建立 924785第五章網(wǎng)頁內(nèi)容分級(jí)過濾系統(tǒng)設(shè)計(jì) 1153355.1總體設(shè)計(jì) 1117755.2分級(jí)過濾系統(tǒng)客戶端設(shè)計(jì) 12325415.3使用BHO監(jiān)控IE瀏覽器 13103第六章圖像檢測(cè)模塊設(shè)計(jì)、實(shí)現(xiàn)與測(cè)試 15326326.1OpenCV概述 15307576.2圖像檢測(cè)模塊及其在Windows上的實(shí)現(xiàn) 15287826.2.1人臉檢測(cè) 16217186.2.2皮膚檢測(cè) 1790326.3圖像檢測(cè)模塊及其在Windows上的測(cè)試 1823203第七章瀏覽器過濾軟件的設(shè)計(jì) 20193067.1LSP技術(shù)相關(guān)模塊向WindowsMobile移植 20306577.2WindowsMobile手機(jī)瀏覽器不良圖片過濾軟件的測(cè)試與改進(jìn) 2127947第八章總結(jié) 2231310參考文獻(xiàn) 24第一章緒論研究背景在過去的幾年里隨著互聯(lián)網(wǎng)的普及色情信息已遍布互聯(lián)網(wǎng)。這對(duì)未成年人的身心健康造成了巨大的影響,2009年公安部宣布公安機(jī)關(guān)關(guān)閉了9200多個(gè)色情網(wǎng)站,如何防止未成年人接觸網(wǎng)絡(luò)色情內(nèi)容正在日趨成熟[1]。對(duì)所有研究領(lǐng)域的興趣增加另一方面這一解決方案與網(wǎng)絡(luò)監(jiān)控部門和網(wǎng)絡(luò)運(yùn)營商的努力密不可分,另一方面,對(duì)客戶在瀏覽互聯(lián)網(wǎng)時(shí)訪問的色情數(shù)據(jù)進(jìn)行實(shí)時(shí)保護(hù)和過濾是一種有效解決該問題的方法1.目前,在客戶端過濾來自互聯(lián)網(wǎng)的色情內(nèi)容主要有三種技術(shù),通過UniformResourceLocatorURL過濾。按文字內(nèi)容過濾,按圖片內(nèi)容過濾。前兩種技術(shù)有明確的局限性和界限。基于URL的過濾技術(shù)有兩種格式:白名單和黑名單[2]。這是因?yàn)槭跈?quán)和中斷網(wǎng)站的數(shù)量是有限的。因此,白名單計(jì)劃非常死板、不靈活,難以適應(yīng)互聯(lián)網(wǎng)用戶的需求。黑名單項(xiàng)目每天都在世界各地的色情網(wǎng)站上出現(xiàn)和消失。及時(shí)更新網(wǎng)站的黑名單是很困難的[3]。而魚難免會(huì)漏網(wǎng)。如果頁面不包含敏感關(guān)鍵字基于文本內(nèi)容的過濾技術(shù)會(huì)失敗并且誤報(bào)率很高。這是因?yàn)楹茈y準(zhǔn)確理解上下文的含義。大多數(shù)色情網(wǎng)站和頁面都包含色情圖片。基于圖像內(nèi)容的過濾技術(shù)檢測(cè)圖像是否包含色情內(nèi)容。它受到學(xué)術(shù)研究人員和軟件公司的廣泛青睞。這是因?yàn)榕c之前的兩種技術(shù)相比,它提供了適應(yīng)性和靈活性。本文檔開發(fā)的濾鏡軟件框架主要針對(duì)基于圖像內(nèi)容的濾鏡。但是上面提到的三種過濾技術(shù)可以相應(yīng)地?cái)U(kuò)展。然后它被廣泛用于軟件中。軟件框架的設(shè)計(jì)是開發(fā)用于過濾網(wǎng)絡(luò)色情的客戶端軟件的關(guān)鍵問題。通用框架使用BrowserHelper的BHO技術(shù),ObjectBHO是一個(gè)COM組件,是微軟為第三方程序員提供的交互式瀏覽器開發(fā)接口[4]。BHO的限制是只能在瀏覽器中使用。僅限IE內(nèi)核在Firefox、Opera、Chrome等非IE瀏覽器中無法實(shí)現(xiàn)。本白皮書提供了一個(gè)基于Winsock2LayeredServiceProviderLSP的網(wǎng)絡(luò)色情過濾軟件框架,適用于IE內(nèi)核瀏覽器和非IE內(nèi)核瀏覽器。LSP技術(shù)可以實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)包攔截,圖像識(shí)別模塊使用開源計(jì)算機(jī)視覺庫實(shí)現(xiàn),OpenCVVisualC++9作為集成開發(fā)環(huán)境[5]。研究意義謀取利益避免缺點(diǎn)積極控制互聯(lián)網(wǎng)對(duì)青少年的影響。并將互聯(lián)網(wǎng)變成青年成長和進(jìn)步的綠色階梯。中國相關(guān)服務(wù)商表示:“綠色上網(wǎng)”和相關(guān)政府機(jī)構(gòu)是可能的。發(fā)布口號(hào)“青年互聯(lián)網(wǎng)在中國”綠網(wǎng)行動(dòng):信息產(chǎn)業(yè)部于2006年2月在陽光綠網(wǎng)計(jì)劃下開展了一系列活動(dòng),指導(dǎo)綠色互聯(lián)網(wǎng)中國的實(shí)施[6]。電信啟動(dòng)了全民綠網(wǎng)項(xiàng)目,中國通信標(biāo)準(zhǔn)協(xié)會(huì)和中國互聯(lián)網(wǎng)協(xié)會(huì)正在研究環(huán)保的互聯(lián)網(wǎng)接入標(biāo)準(zhǔn)。教育應(yīng)該是防止青少年被不良網(wǎng)站毒害的最根本途徑。只有當(dāng)年輕人真正意識(shí)到這些網(wǎng)站的危險(xiǎn)時(shí),才能完全避免它們。但實(shí)際上年輕人的好奇心相當(dāng)高,這些網(wǎng)站大多是為了牟利而使用有趣的主題[7]。讓人們,尤其是青少年,迷失方向并最終沉迷其中。并停止了他們的研究。仍然需要計(jì)算機(jī)和一些網(wǎng)絡(luò)技術(shù)來限制用戶上網(wǎng)。未成年人是社會(huì)的總理,也是國家的未來。現(xiàn)代傳播方式的廣泛使用,為色情內(nèi)容的迅速傳播創(chuàng)造了有利條件,對(duì)未成年人的身心健康構(gòu)成嚴(yán)重威脅。重要性很緊迫,也很實(shí)際。有效阻斷互聯(lián)網(wǎng)上的錯(cuò)誤信息,需要網(wǎng)絡(luò)運(yùn)營者和網(wǎng)絡(luò)運(yùn)營者的共同努力。他們可以使用網(wǎng)絡(luò)控制功能從源頭阻止錯(cuò)誤網(wǎng)站[8]。為了不讓他們提供的虛假內(nèi)容泄露給互聯(lián)網(wǎng)用戶。許多不良網(wǎng)站和不良信息仍然在網(wǎng)絡(luò)上流傳,因此您還需要在Internet客戶端上安裝過濾軟件產(chǎn)品。隨著移動(dòng)平臺(tái)成為未成年人理想的在線工具。在移動(dòng)客戶端上啟用色情過濾與在桌面客戶端上一樣重要。本文檔中介紹的適用于這款適用于WindowsMobile手機(jī)瀏覽器的假圖片過濾軟件是在移動(dòng)設(shè)備上過濾色情內(nèi)容的有益嘗試。大多數(shù)色情網(wǎng)站和色情網(wǎng)站都包含色情內(nèi)容,因此色情分類是過濾色情的重要技術(shù)?;趫D像內(nèi)容的過濾技術(shù)是互聯(lián)網(wǎng)色情過濾技術(shù)中不可替代的重要組成部分。本軟件選用的圖像探傷原理是基于圖像內(nèi)容的檢測(cè)技術(shù)。這是因?yàn)樗然趫D像內(nèi)容的過濾技術(shù)更加通用和準(zhǔn)確。根據(jù)智能手機(jī)平臺(tái)的軟硬件特點(diǎn)本軟件使用的圖像識(shí)別原理主要是皮膚識(shí)別[9]。人臉檢測(cè)特別是,SVM因其低復(fù)雜度和高皮膚檢測(cè)精度而被分類。為未來的發(fā)展提供思路和參考。國內(nèi)外研究現(xiàn)狀目前過濾色情網(wǎng)站的方法主要有四種:關(guān)鍵字?jǐn)r截,即下載時(shí)掃描網(wǎng)站。如果下載的內(nèi)容包含預(yù)定義的關(guān)鍵字網(wǎng)站將被封鎖這種方法不是很有效。這是因?yàn)檎Z言和語言環(huán)境的清晰度很高。并且沒有文字關(guān)鍵字是無法處理圖片的[10]。封包攔截,例如通過攔截特定IP地址的請(qǐng)求進(jìn)行訪問控制,快速且易于使用。但是對(duì)于一些新技術(shù)沒有動(dòng)力,比如獨(dú)立的虛擬IP主機(jī)。帶有URL阻塞的訪問控制,也就是URL阻塞,有兩種行動(dòng)方案。該系統(tǒng)旨在僅訪問人們認(rèn)為合適的網(wǎng)站。這限制了可以訪問的URL太多。被拒絕訪問的URL集由軟件保留。并且只能訪問未包含的URL這個(gè)方法是不行的,因?yàn)樗簧仙榫W(wǎng)站的刷新率[11]。按內(nèi)容過濾圖片。此方法使用圖像顏色、紋理和其他屬性?;谀w色屬性向量標(biāo)記膚色區(qū)域并過濾敏感圖像。該技術(shù)克服了基本P地址過濾技術(shù)的滯后性和基本網(wǎng)站過濾中的文本內(nèi)容限制。這導(dǎo)致一些相關(guān)站點(diǎn)的丟失并阻止了許多有用的站點(diǎn)。當(dāng)今的網(wǎng)絡(luò)安全技術(shù)普遍解決了過濾和視覺檢測(cè)能力不足的問題。上述過濾方式也存在問題:分類方式難以對(duì)所有網(wǎng)站進(jìn)行分類。實(shí)時(shí)性下降:更新敏感的URL數(shù)據(jù)庫發(fā)現(xiàn)很難跟蹤色情網(wǎng)站的增長速度。由于局限性,缺乏檢測(cè)和誤報(bào):大多數(shù)色情網(wǎng)站使用不同的信息網(wǎng)站,如:B.base10網(wǎng)站中的圖片文字內(nèi)容過濾技術(shù)不完整。內(nèi)容包括圖像和不斷變化的關(guān)鍵字。遮擋效果不可行,識(shí)別效果不理想[12]。目前,國內(nèi)外一些科學(xué)家正在研究基于內(nèi)容的圖像過濾技術(shù)并提供初步成果。但是filter模型的正檢率和誤檢率等等,很多問題都沒有解決。不理想,檢測(cè)速度不滿足實(shí)時(shí)性要求。因此,必須改進(jìn)技術(shù)。針對(duì)以下高靈敏度圖像識(shí)別技術(shù):然后通過人體手勢(shì)識(shí)別進(jìn)一步判斷該圖像是否為敏感圖像。并且每張圖片允許運(yùn)行6分鐘,在一個(gè)有565張敏感圖片和4289張敏感圖片的圖庫中,誤報(bào)率是4%,正向識(shí)別率只有52.2%。這個(gè)系統(tǒng)工作。慢不適合網(wǎng)絡(luò)條件下的大規(guī)模實(shí)時(shí)處理。且檢測(cè)精度不足[13]。1997年,JamesZeWang使用了一種將常規(guī)高感光圖像預(yù)組裝的非感光圖像比較方法,用于與已知圖像進(jìn)行高感光圖像識(shí)別,通常會(huì)創(chuàng)建高感光度。并提取各種特征出去創(chuàng)建一個(gè)圖像屬性庫。在記憶中提取已知圖像屬性并與圖像屬性庫的屬性進(jìn)行比較。如果您發(fā)現(xiàn)在您的照片庫中最相似的圖像中發(fā)現(xiàn)了一定比例的敏感圖像,圖像被認(rèn)為是敏感的。否則它被認(rèn)為是一個(gè)微妙的形象。細(xì)膩的畫面。這種方法的問題在于創(chuàng)建圖像庫和選擇特征向量。由于大量敏感和不敏感圖像結(jié)果,特別有許多精致的圖像。如何有效組織一個(gè)精致不敏感的圖片庫而你可以選擇哪些功能來顯示這些細(xì)膩、不敏感的圖像是很難修復(fù)的[14]。速度不符合實(shí)時(shí)要求。首先,使用膚色模型來確定圖像中是否存在任何膚色。如果不它被認(rèn)為是低靈敏度圖像,這種情況下,考慮圖像是否有人臉??紤]一張人臉比例高的照片是否細(xì)膩,以及圖片的任何部分是否不包含人臉。如果不包括零件人體的它被認(rèn)為是不精致的圖像。否則,使用手勢(shì)識(shí)別。如果發(fā)現(xiàn)淫穢手勢(shì)這些圖像是保密的。該方法通過排除單個(gè)層來執(zhí)行。它有很多技術(shù),但沒有太多動(dòng)作。識(shí)別結(jié)果未在文檔中描述。雖然可以檢測(cè)但實(shí)時(shí)檢測(cè)的速度可能難以匹敵,2001年,中國科學(xué)院計(jì)算技術(shù)研究所的段麗娟及其同事提出了一種利用顯示過濾色情內(nèi)容的方法,利用計(jì)算機(jī)視覺和模式識(shí)別的結(jié)果。過濾方法:該方法提供了一個(gè)多層次的圖像處理框架,結(jié)合了膚色模型的驗(yàn)證。由于支持向量機(jī)(SVM)的分類和人類視覺圖像分析工具研究的最接近的驗(yàn)證結(jié)果。這種方法可以達(dá)到85%以上,識(shí)別模型的準(zhǔn)確率有待進(jìn)一步提高。因此,基于內(nèi)容的高靈敏度圖像濾波技術(shù)值得進(jìn)一步研究[15]。當(dāng)今Internet上提供三種主要類型的惡意過濾技術(shù)?;赨RL的聯(lián)合過濾、網(wǎng)站文字內(nèi)容過濾圖像內(nèi)容過濾“綠壩花季護(hù)航”軟件(可擴(kuò)展為視頻)同時(shí)使用前三級(jí)調(diào)平技術(shù)。前兩種技術(shù)很容易使用,但是也有明顯的局限性。基于URL的過濾技術(shù)有兩種類型:白名單和黑名單。白名單程序相當(dāng)有限,靜態(tài)的,有限的,不靈活的,難以根據(jù)互聯(lián)網(wǎng)用戶的需求進(jìn)行定制。并且只適合小孩子。各種網(wǎng)站它不斷彈出和死去在正確的時(shí)間更新色情網(wǎng)站黑名單很困難。魚在網(wǎng)上游蕩是不可避免的。消息內(nèi)容過濾技術(shù)將失效。申請(qǐng)有限制并且很難準(zhǔn)確地了解上下文的含義。這導(dǎo)致高誤報(bào)率。大多數(shù)色情網(wǎng)站和頁面都包含色情圖片。基于圖像內(nèi)容的過濾技術(shù)使用圖像處理技術(shù)來確定圖像是否包含色情內(nèi)容。與前兩種技術(shù)相比,它的適應(yīng)性和靈活性被研究人員和軟件公司廣泛使用。幸運(yùn)的是,本主題側(cè)重于按圖像內(nèi)容進(jìn)行過濾[16]。

第二章相關(guān)技術(shù)概述2.1網(wǎng)絡(luò)監(jiān)控技術(shù)網(wǎng)絡(luò)監(jiān)控技術(shù)通過分析通過網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)來做到這一點(diǎn)。目前有兩種方法用于在網(wǎng)絡(luò)中檢索信息。第一種方法是通過方法。還有一種是pass-by方式,pass-by方式是重定向用戶流量。用戶流量必須經(jīng)過相關(guān)系統(tǒng)分析處理后才能傳輸。這可能會(huì)導(dǎo)致用戶訪問延遲[17]。該系統(tǒng)使用分布式計(jì)算。內(nèi)存數(shù)據(jù)庫和其他技術(shù)提供用戶信息加工。減緩信息的流動(dòng)當(dāng)網(wǎng)絡(luò)電流超過過濾設(shè)備可以傳輸?shù)拈撝禃r(shí),就會(huì)發(fā)生網(wǎng)絡(luò)擁塞。在正常網(wǎng)絡(luò)負(fù)載條件下使用通過方法的過濾器產(chǎn)品會(huì)產(chǎn)生30-100毫秒延遲時(shí)間的響應(yīng),從而增加管理和成本。第4層負(fù)載分配器通常需要在多個(gè)過濾器產(chǎn)品之間動(dòng)態(tài)分配流量。然而,在企業(yè)的早期階段,這可能是一個(gè)失敗點(diǎn)。系統(tǒng)負(fù)載輕,前期投入小,路徑模式下,在采集點(diǎn)向系統(tǒng)發(fā)送一份用戶流量副本[18]。系統(tǒng)將對(duì)其進(jìn)行分析和處理,以確定該信息是否被截獲。如果你不想攔截此消息將被取消,處理將結(jié)束。如果需要攔截發(fā)送消息提示用戶訪問Web服務(wù)器以終止連接并將用戶的請(qǐng)求重定向到另一個(gè)位置。路徑模式使用不影響網(wǎng)絡(luò)流量的身份驗(yàn)證模式。本質(zhì)上不會(huì)影響網(wǎng)絡(luò)性能并且不需要對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行任何更改[19]。2.2信息過濾過濾和提取數(shù)據(jù)是兩個(gè)不同的概念。它們都需要?jiǎng)討B(tài)過濾信息流。但數(shù)據(jù)過濾側(cè)重于排除用戶不想接收的數(shù)據(jù)和用戶的長期需求。(在一段時(shí)間內(nèi)相對(duì)恒定)搜索呈現(xiàn)用戶。你需要的信息和你的需求一直在變化,然而,它們是密切相關(guān)的。并且很多過濾方式還使用了以前成功的搜索方式,比如匹配、按預(yù)定義的人口統(tǒng)計(jì)或類別輕松過濾。決定將顯示哪些內(nèi)容和服務(wù)[20]。例如,員工可以根據(jù)工作性質(zhì)使用個(gè)人網(wǎng)站訪問與工作相關(guān)的信息和應(yīng)用程序。僅基于年齡和屬性值等指標(biāo)規(guī)則過濾根據(jù)特定規(guī)則應(yīng)用過濾。為此,管理員(在顧問的幫助下)必須設(shè)置適當(dāng)?shù)囊?guī)則。監(jiān)管方法提供了一種靈活的機(jī)制來制定業(yè)務(wù)應(yīng)用程序或營銷活動(dòng)的規(guī)則。交叉銷售是基于規(guī)則的電子商務(wù)過濾的一個(gè)示例。因?yàn)橘徺I了產(chǎn)品Y的客戶也可能對(duì)產(chǎn)品x感興趣,“向最近購買產(chǎn)品Y的客戶提供有關(guān)產(chǎn)品X的信息”,因此購買了一本書的客戶可能對(duì)另一本當(dāng)前或以前的書感興趣?;蛟摃髡叩耐槐緯磧?nèi)容過濾推薦相關(guān)內(nèi)容和書籍它也是關(guān)于分析一個(gè)對(duì)象的內(nèi)容以創(chuàng)建一組訪問者感興趣的對(duì)象。通常,這種分析需要您指定一個(gè)關(guān)鍵屬性集并為每個(gè)對(duì)象輸入一個(gè)值。該技術(shù)的一個(gè)常見示例是按關(guān)鍵字分析文檔的文檔過濾系統(tǒng)。支持購買電影和電視節(jié)目是按內(nèi)容過濾的另一個(gè)示例。協(xié)同過濾使用顯式或隱式評(píng)級(jí)來收集觀眾意見。創(chuàng)建一群志趣相投的朋友。查看附近的朋友群。并查找特定訪問者的文章。內(nèi)容過濾查找具有相似屬性的對(duì)象。協(xié)同過濾可以找到具有相似品味的訪問者。協(xié)同過濾生成的推薦基于對(duì)等組的響應(yīng)。并且不限于簡單的屬性匹配,但是協(xié)同過濾需要訪問者對(duì)對(duì)象進(jìn)行評(píng)分,并向不同的訪問者呈現(xiàn)不同的品味。任何狀況之下有些人有獨(dú)特的愛好。所以有些人不會(huì)那樣做。有些人會(huì)做出極端的決定,而另一些人會(huì)做出溫和的決定。這使得你很難組建一個(gè)同事小組[21]。2.3基于URL的過濾技術(shù)基于URL的過濾技術(shù)通過創(chuàng)建不允許或未授權(quán)訪問的URL列表來實(shí)現(xiàn)此目的。這項(xiàng)技術(shù)的好處要么被列入黑名單,要么被列入白名單,這都非常容易,因?yàn)槊總€(gè)URL的最終標(biāo)識(shí)都是人工審核的。并由政府機(jī)構(gòu)或相關(guān)公司的高級(jí)人員提交。誤判沒問題,對(duì)于網(wǎng)絡(luò)運(yùn)營商,尤其是網(wǎng)絡(luò)運(yùn)營商。設(shè)置網(wǎng)站黑名單是排查不良網(wǎng)站、防止不良信息在互聯(lián)網(wǎng)上傳播的有效方法,但這項(xiàng)技術(shù)的局限性也很明顯[22]。首先,我們來說一下名單大綱。白名單上的站點(diǎn)數(shù)量有限且相對(duì)穩(wěn)定。這使得它對(duì)互聯(lián)網(wǎng)用戶非常嚴(yán)格。并且有必要充分利用互聯(lián)網(wǎng)上的海量信息來獲得您想要的內(nèi)容。因此,適應(yīng)互聯(lián)網(wǎng)的客觀情況是每天都有大量的新網(wǎng)站被創(chuàng)建。只為年幼的孩子對(duì)于黑名單方案全球色情網(wǎng)站每天都在創(chuàng)建和消失。這使得廣泛的報(bào)道和及時(shí)的更新變得困難并在網(wǎng)絡(luò)上被列入黑名單。色情是不可避免的。內(nèi)容提供者可以通過更改網(wǎng)址返回,此外,黑名單方案也無法處理某些官方網(wǎng)站上偶爾出現(xiàn)的不良信息,例如某些網(wǎng)民在其網(wǎng)站上發(fā)布的淫穢照片。

第三章軟件需求分析和總體框架設(shè)計(jì)這個(gè)主題開發(fā)和使用的這個(gè)壞照片過濾軟件的主要特點(diǎn)是該軟件實(shí)時(shí)檢查每個(gè)網(wǎng)站上的圖像,當(dāng)用戶點(diǎn)擊該網(wǎng)站時(shí)。該軟件立即向用戶顯示警告信息。色情網(wǎng)站可以在所有瀏覽器中關(guān)閉和關(guān)閉。這是因?yàn)樯橥ǔEc色情網(wǎng)站和信息相關(guān)聯(lián)。在客戶端阻止色情內(nèi)容是不夠的。關(guān)閉色情網(wǎng)站或完全關(guān)閉瀏覽器將阻止用戶在線訪問色情內(nèi)容。瀏覽器訪問大部分網(wǎng)頁使用的應(yīng)用層協(xié)議是HTTP(如Web超文本傳輸協(xié)議),除了HTTP協(xié)議,手機(jī)使用WAP無線應(yīng)用協(xié)議,傳輸層協(xié)議。使用的一種是TCP和這個(gè)軟件大多使用糟糕的網(wǎng)絡(luò)圖像過濾[23]。通過HTTP協(xié)議的Internet正在成為移動(dòng)Internet訪問的標(biāo)準(zhǔn)。過濾虛假網(wǎng)絡(luò)圖像您需要三個(gè)稱為圖像檢測(cè)程序的功能模塊。網(wǎng)絡(luò)監(jiān)聽模塊和HTTP文本分析模塊,圖片識(shí)別機(jī)制的作用是判斷導(dǎo)入的圖片是否色情。網(wǎng)絡(luò)攔截器的作用是利用TCP協(xié)議攔截設(shè)備收發(fā)的所有網(wǎng)絡(luò)數(shù)據(jù)包。并將其轉(zhuǎn)發(fā)給HTTP數(shù)據(jù)包分析器進(jìn)行分析。關(guān)閉網(wǎng)頁或?yàn)g覽器。HTTP數(shù)據(jù)包分析模塊的功能是分析網(wǎng)絡(luò)攔截器發(fā)送的數(shù)據(jù)包。判斷是HTTP圖像請(qǐng)求消息還是HTTP圖像響應(yīng)消息,并從Web圖像文件中提取相關(guān)信息。這個(gè)軟件的整體框架如圖2.1所示,由于你使用的是WindowsMobile,所以應(yīng)用開發(fā)和Windows32桌面應(yīng)用開發(fā)有很多相似之處,開發(fā)過程中必須將OpenCV遷移到WorkwithWindowsMobile。最初安裝基于Windows的桌面瀏覽器是為了方便調(diào)試和基準(zhǔn)測(cè)試。安裝流氓照片過濾軟件。然后將端口過濾器和OpenCV軟件安裝在WindowsMobile平臺(tái)上[24]。

第四章基于內(nèi)容的敏感圖片過濾技術(shù)4.1圖片庫的建立按內(nèi)容過濾敏感圖像可以被視為對(duì)圖像的理解和感知的問題。對(duì)于圖像的復(fù)雜背景條件,很難將所有屬性與一個(gè)簡單的代表模型結(jié)合起來。光照條件不一致各種形式的圖像分析工具以不同方式基于人體圖像。和色情本身定義這項(xiàng)技術(shù)的關(guān)鍵是檢測(cè)或識(shí)別皮膚d-pixel的表面積,并且僅在在此基礎(chǔ)上,我們可以對(duì)整個(gè)圖像的感覺做出更多的判斷。彩色圖像中的皮膚識(shí)別也是人臉識(shí)別等應(yīng)用的重要基礎(chǔ)參考。手勢(shì)識(shí)別基于生物特征圖像的內(nèi)容視頻搜索和圖像內(nèi)容檢查今天,大多數(shù)皮膚識(shí)別方法都使用皮膚的特定顏色特征。來自眾多統(tǒng)計(jì)研究膚色因種族而有很大差異。但是把亮度調(diào)到標(biāo)準(zhǔn)后人類的膚色非常相似。并且只占用少量的色彩空間,相似度高,協(xié)調(diào)性高,可以設(shè)計(jì)出更好的皮膚/非皮膚分類器,但是圖像中存在多個(gè)與膚色顏色相同或相同的物體.膚色過濾器將不可避免地錯(cuò)誤地將這些對(duì)象識(shí)別為皮膚。以及相應(yīng)的分類算法對(duì)敏感圖像濾波器進(jìn)行建模,實(shí)現(xiàn)敏感圖像識(shí)別。本白皮書中的所有實(shí)驗(yàn)均在實(shí)驗(yàn)庫中進(jìn)行。它們分為培訓(xùn)畫廊和測(cè)試畫廊。在實(shí)驗(yàn)圖庫中,有2750張照片,分為1450張訓(xùn)練照片,其中750張是敏感的,700張是正常的。人們?cè)谟?xùn)練庫中的照片中,只有400張人體皮膚黃黑色區(qū)域的照片,只有400張人體皮膚白色區(qū)域的照片。測(cè)試庫由1300張圖片組成,其中機(jī)密圖片700張,普通圖片600張,在測(cè)試庫中人們拍攝的照片中,只有400張是人體皮膚的黃黑色區(qū)域。以及350張人體皮膚白色區(qū)域的照片。4.2掩碼圖像的輔助處理提高從膚色檢測(cè)模型得到的蒙版圖像的效果,減少蒙版圖像不必要的劃痕和點(diǎn)。在本文檔中通過使用低通濾鏡增強(qiáng)了圖像遮罩的效果,在本文中,我們使用了改進(jìn)的5X5濾鏡,通過特寫檢測(cè)進(jìn)行附加處理。蒙版對(duì)每個(gè)像素執(zhí)行5X5近距離檢測(cè),如果膚色像素與周圍總像素的比率超過某個(gè)閾值,則計(jì)算24個(gè)周圍像素。(實(shí)驗(yàn)表明,0.65的閾值是最佳的。)像素被認(rèn)為是膚色,否則像素與皮膚的陰影不同。圖1顯示了未過濾的蒙版和圖像。相比下您會(huì)看到過濾后的圖像明顯優(yōu)于未處理的圖像。4.3紋理檢測(cè)模型建立圖4.1采用濾波前后的圖像比較紋理在圖像處理中起著重要作用。模式識(shí)別和計(jì)算機(jī)視覺每個(gè)圖像的紋理都以包含重要信息的紋理為特征,例如對(duì)象的結(jié)構(gòu)及其與環(huán)境的關(guān)系。紋理表示圖像中特定圖4.2敏感圖像經(jīng)膚色模型與紋理模型處理結(jié)果圖4.3非敏感圖像經(jīng)膚色模型與紋理模型處理結(jié)果空間結(jié)構(gòu)的特定屬性。這種空間結(jié)構(gòu)的具體屬性可以通過相鄰像素之間的關(guān)系來確定。沒有理由談?wù)撚蓡为?dú)像素組成的紋理。定義紋理:(1)GrayscaleCommonsMatrix由像素間距和灰度圖像對(duì)齊創(chuàng)建。矩陣紋理(2)您可以將有意義的圖像紋理屬性與tamura屬性區(qū)分開來。作為人類心理的主觀度量,Tamura推薦了六種基本表面屬性,如粒度、對(duì)比度、方向、線性、周期性和粗糙度。比共存矩陣(3)的小波變換更清楚的是,紋理屬性是從小波變換中提取的統(tǒng)計(jì)技術(shù)。小波變換可以與其他方法結(jié)合使用。為了獲得更好的結(jié)果(4)馬爾科夫隨機(jī)場模型該方法假設(shè)表面是馬爾科夫隨機(jī)場形成,并通過局部檢測(cè)來描述表面。(空間)和圖像中的相關(guān)信息。紋理可以被認(rèn)為是空間灰度變化產(chǎn)生的圖案。這是圖像真實(shí)空間的特定屬性色情作品中的大多數(shù)膚色都具有平滑特性。實(shí)驗(yàn)表明,膚色模型感知細(xì)膩的圖像。然后根據(jù)顏色的相似性歪曲圖像。黃色沙發(fā)黃色毯子等是有膚色的區(qū)域,也會(huì)出現(xiàn)不需要的警報(bào)。引入表面模型的主要目的是去除被錯(cuò)誤識(shí)別為皮膚區(qū)域的非皮膚區(qū)域,同時(shí)獲得結(jié)果?;谀w色蒙版圖像必須有一定的正向識(shí)別率。必須有一個(gè)普遍的分類。分類器的過濾功能供以后使用。圖2和圖3分別是使用膚色和紋理模型處理精致和非精致圖像的示例。這清楚地表明了紋理模型正在嘗試做什么。具體方法是先從膚色模型中獲取圖像的膚色區(qū)域。然后在該區(qū)域中檢測(cè)到表面,并移除低于表面模型閾值的區(qū)域中的點(diǎn)。高效使用降低誤報(bào)率。

第五章網(wǎng)頁內(nèi)容分級(jí)過濾系統(tǒng)設(shè)計(jì)5.1總體設(shè)計(jì)用于對(duì)Web內(nèi)容進(jìn)行分類的基于Web服務(wù)的過濾系統(tǒng)具有多種使用模式。本白皮書中使用的系統(tǒng)使用第一種模式,ClientWebServices(C-W)模式,在這種模式下,Web服務(wù)允許客戶對(duì)網(wǎng)頁進(jìn)行分類和評(píng)分??蛻魧⒏鶕?jù)Web服務(wù)返回的結(jié)果決定是否允許查看該頁面。在客戶端Web服務(wù)調(diào)用者的具體實(shí)現(xiàn)可能是瀏覽器插件或監(jiān)控軟件,檢查下面的HTTP數(shù)據(jù)包。要使用的插件還需要特定的管理功能,例如b.使用。瀏覽器內(nèi)插件和用戶年齡設(shè)定管理從以上分析分級(jí)頁面內(nèi)容過濾系統(tǒng)由IE瀏覽器插件、系統(tǒng)管理模塊、IE瀏覽器插件三部分組成。和網(wǎng)絡(luò)服務(wù)每個(gè)由幾個(gè)子模塊組成??蛻舳税惭bIE瀏覽器插件和系統(tǒng)管理模塊,服務(wù)端使用Web服務(wù)。Web服務(wù)允許客戶過濾網(wǎng)頁的層次結(jié)構(gòu)。并將結(jié)果以分類分層標(biāo)簽的形式返回給客戶端??蛻舳说腎E瀏覽器插件判斷一個(gè)標(biāo)簽是否跨越了“條件標(biāo)簽”,以及頁面是通過還是阻止瀏覽。大多數(shù)系統(tǒng)管理模塊都知道管理瀏覽器插件等功能。用戶年齡管理、加密和網(wǎng)絡(luò)數(shù)據(jù)庫管理。系統(tǒng)范圍的功能模塊配置如圖4所示。圖5.1網(wǎng)頁內(nèi)容分級(jí)過濾系統(tǒng)層次圖圖中各子模塊的功能如下:加密模塊有兩個(gè)功能。一是對(duì)最近訪問的網(wǎng)站分類數(shù)據(jù)庫進(jìn)行加密,防止用戶誤解和破壞內(nèi)容。另一種方法是年齡加密,因此父母可以設(shè)置年齡密碼,以防止孩子未經(jīng)允許更改父母設(shè)置的年齡。年齡輸入模塊允許用戶輸入年齡并定義?!皹?biāo)準(zhǔn)標(biāo)簽”是合適的。瀏覽器插件管理模塊用于查看插件使用情況,控制是否使用瀏覽器插件。數(shù)據(jù)庫管理模塊用于管理最近訪問網(wǎng)站的評(píng)分?jǐn)?shù)據(jù)庫,如查詢、添加和刪除記錄。在這份白皮書中該數(shù)據(jù)庫使用文本文件存儲(chǔ)最近訪問的30個(gè)網(wǎng)站的訪問日期、URL和相關(guān)評(píng)級(jí)信息。記錄還按訪問日期排序。并且訪問日期越近職位越高網(wǎng)頁內(nèi)容提取模塊的作用是提取網(wǎng)頁的文本內(nèi)容,即從HTML文件體中去除HTML標(biāo)簽后留下的內(nèi)容,生成Web服務(wù)字符串。一個(gè)Web服務(wù)模塊,它調(diào)用Web服務(wù)作為客戶端調(diào)用對(duì)象,并將網(wǎng)頁內(nèi)容作為調(diào)用參數(shù)發(fā)送到Web服務(wù)。標(biāo)簽比較模塊將頁面標(biāo)簽與定義頁面選擇的“標(biāo)準(zhǔn)標(biāo)簽”只要頁面標(biāo)簽高于“條件標(biāo)簽”級(jí)別,就無法打開頁面。頁面渲染模塊根據(jù)頁面渲染模塊返回的結(jié)果控制瀏覽器1E的渲染頁面。比較標(biāo)簽如果允許文本該消息將成功運(yùn)行,您將看到您正在訪問的網(wǎng)頁。否則它不會(huì)顯示或網(wǎng)頁將被重定向到警告頁面。每個(gè)分類級(jí)別映射模塊主要用于基于從關(guān)鍵字組合獲得的布爾模型對(duì)網(wǎng)頁內(nèi)容進(jìn)行分類和評(píng)級(jí)。該模塊是整個(gè)系統(tǒng)的核心模塊。而分層過濾算法決定了Web服務(wù)的核心性能,即過濾的準(zhǔn)確性,從而決定了整個(gè)系統(tǒng)的效率。標(biāo)簽返回模塊的作用是結(jié)合類別和層次。作為網(wǎng)頁標(biāo)簽輸入并返回給客戶端。5.2分級(jí)過濾系統(tǒng)客戶端設(shè)計(jì)正如剛才提到的系統(tǒng)客戶端由兩部分組成:IE瀏覽器插件和管理工具。為了使用InternetExplorer(1E)瀏覽器實(shí)時(shí)監(jiān)控客戶端的網(wǎng)頁內(nèi)容,網(wǎng)頁內(nèi)容分級(jí)過濾系統(tǒng)客戶端過濾軟件采用IE插件的形式。獨(dú)立應(yīng)用程序。IE插件是IE綁定的DLL,它通過IE事件監(jiān)控瀏覽器窗口并執(zhí)行必要的動(dòng)作。以下指導(dǎo)IE插件的設(shè)計(jì)。用于基于IE瀏覽器事件過濾系統(tǒng)以及本文檔中DLL的原理和使用,描述了系統(tǒng)管理程序的設(shè)計(jì)。圖5.2IE的主要事件WebBrowser控件由四個(gè)接口組成:IWebBrowser.IWebBrowserAPP、IWebBrowser2和DWebBrowserEvents2。IWebBrowser是唯一一個(gè)接口,最初代表WebBrowser控件并提供瀏覽功能的基礎(chǔ)知識(shí),例如漫游到網(wǎng)頁或?qū)Ш铰斡涗浀?1WebBrowserAPP表示IE窗口的一個(gè)實(shí)例,通常控制瀏覽器窗口的用戶界面功能,例如狀態(tài)欄、工具欄和菜單欄。IWebBroser2繼承自IwebBrowser和IWebBrowserAPP。它還提供了兩者都沒有的功能。因此,1E校驗(yàn)和應(yīng)該使用IWebBrowser2接口。IWebBrowser2方法和屬性提供了一些導(dǎo)航和用戶界面控件。但是即使你不控制瀏覽器做什么:當(dāng)它控制時(shí),你也沒有完全的控制權(quán)。因此,IE使用了一種“事件”機(jī)制,事件可以在特定時(shí)間觸發(fā)并與之交互。這是通過一個(gè)編程接口。圖5.2顯示了IE的一些里程碑。在4.0版本中,IE通過該接口發(fā)送事件。DWebBrowserEvents2您可以通過控制IE事件來監(jiān)視和執(zhí)行必要的操作。5.3使用BHO監(jiān)控IE瀏覽器每個(gè)IE實(shí)例啟動(dòng)時(shí)它在注冊(cè)表中搜索唯一鍵(HKEYLOCALMACHINE\SOFTWAREWIicrosoft\Windows\CurrentVersion\Explorer\BrowserHelperObjects),如果找到該鍵,則為瀏覽器助手對(duì)象鍵下列出的每個(gè)CLSID(類標(biāo)識(shí)符)。注冊(cè)表中的瀏覽器在實(shí)例化瀏覽器時(shí),IE調(diào)用CoCreateInstance。在與相應(yīng)瀏覽器實(shí)例相同的進(jìn)程空間中創(chuàng)建BHO實(shí)例。換句話說,IE是BHO的一個(gè)正在進(jìn)行的COM服務(wù)器,這意味著每次創(chuàng)建瀏覽器窗口時(shí)。該對(duì)象的一個(gè)新實(shí)例被創(chuàng)建。所有BHO實(shí)例與瀏覽器實(shí)例同時(shí)創(chuàng)建和銷毀。創(chuàng)建BHO程序時(shí),IE為IWebBrowser2指針提供了一個(gè)BHO,BHO可以使用指針控制IE實(shí)例,記錄相關(guān)事件。跟蹤用戶的在線管理過程。并做出決定和過濾網(wǎng)頁內(nèi)容。請(qǐng)注意,BHO僅在InternetExplorer4.0及更高版本中可用,WindowsExplorer也支持BHO。第一步在D11Main()編碼過程中完成,當(dāng)WindowsExplorer調(diào)用DLL進(jìn)程時(shí),D11Main()函數(shù)返回False并停止加載。第二步,獲取SetSite()方法的WebBrowse對(duì)象的指針,要攔截瀏覽器觸發(fā)的事件,需要BHO通過接口與瀏覽器連接。連接點(diǎn)并將函數(shù)表發(fā)送到IDispatch以處理事件。此過程包括調(diào)用IConnectionPoint的Advise()方法。通知瀏覽器BHO將收到有關(guān)該事件的通知。在COM事件處理引擎中,這是BHO,它為瀏覽器提供指向IDispatch接口的指針。瀏覽器調(diào)用IDispatch的Invoke()方法,將事件ID作為第一個(gè)參數(shù)傳遞。一旦給出ID,您就知道事件是什么。最后,您需要注冊(cè)您的BHO。BHO是一個(gè)COM服務(wù)器,它必須同時(shí)向COM服務(wù)器和COM服務(wù)器注冊(cè)。BHOATL模板提供注冊(cè)腳本(RGS)代碼來完成初始注冊(cè)。通過將代碼寫入rgs文件來完成BHO注冊(cè)。IE瀏覽器插件在發(fā)生時(shí)通過BHO記錄IE事件。BeforeNavigate2對(duì)用戶輸入的URL進(jìn)行分析,驗(yàn)證如果URL中包含edu、gov等,則表明該網(wǎng)站不包含惡意信息。并且訪問信息會(huì)直接發(fā)送到頁面的標(biāo)簽文件中進(jìn)行更新。否則會(huì)查詢頁面的標(biāo)簽文件,如果文件中有URL,則需要將頁面的標(biāo)簽與“頁面標(biāo)簽”標(biāo)簽進(jìn)行比較。標(biāo)準(zhǔn)如果它不包含在頁面標(biāo)記文件中。事件發(fā)生時(shí)標(biāo)志設(shè)置為1文檔完成發(fā)生且查詢標(biāo)志為1,提取網(wǎng)頁內(nèi)容并調(diào)用Web服務(wù)以獲取Web側(cè)標(biāo)簽。還執(zhí)行日常比較和標(biāo)簽文件更新。BHO中止。從OnQuit事件發(fā)生時(shí)的瀏覽器。管理程序是獨(dú)立的應(yīng)用程序,主要用于幫助用戶管理瀏覽器插件。年齡設(shè)定并訪問網(wǎng)站數(shù)據(jù)庫管理和其他功能首先管理瀏覽器插件的主要目的是讓用戶更好地控制他們是否使用插件來過濾網(wǎng)站。您可以通過設(shè)置年齡來更改年齡。并且您還可以添加密碼設(shè)置功能。首先管理瀏覽器插件的主要目的是讓用戶更好地控制他們是否使用插件來過濾網(wǎng)站。年齡設(shè)置功能允許用戶設(shè)置或更改用戶的年齡。并相應(yīng)地設(shè)置適當(dāng)?shù)摹伴撝禈?biāo)志”。管理您的網(wǎng)站數(shù)據(jù)庫應(yīng)該允許您搜索和編輯記錄、標(biāo)記記錄以及創(chuàng)建其他信息。對(duì)于最近訪問的網(wǎng)站您必須允許用戶查詢和添加特定網(wǎng)站的記錄(例如通過直接認(rèn)證)。當(dāng)然,該程序還提供密碼管理。因?yàn)槭褂眠@些功能需要密碼認(rèn)證權(quán)限。管理程序的使用是免費(fèi)的。因此,您可以根據(jù)上述功能設(shè)計(jì)附加功能。在本文使用的系統(tǒng)中這個(gè)程序只知道一些功能。并且需要在未來進(jìn)一步改進(jìn)和改進(jìn)。此外,本文檔中設(shè)計(jì)的系統(tǒng)該程序還集成了IE瀏覽器工具欄上的按鈕,讓用戶可以輕松啟動(dòng)系統(tǒng)管理應(yīng)用程序。當(dāng)我按下我單擊的按鈕時(shí),管理程序?qū)⒋蜷_。

第六章圖像檢測(cè)模塊設(shè)計(jì)、實(shí)現(xiàn)與測(cè)試6.1OpenCV概述OpenCV是一個(gè)免費(fèi)的開源計(jì)算機(jī)視覺平臺(tái),用C/C10編寫,由英特爾公司提供支持。這是一個(gè)開源的計(jì)算機(jī)視覺庫許多常用算法用于圖像處理和計(jì)算機(jī)視覺。它涵蓋了廣泛的應(yīng)用,例如對(duì)象檢測(cè)。圖像分割視頻處理人臉識(shí)別人機(jī)交互結(jié)構(gòu)分析運(yùn)動(dòng)分析以及相機(jī)標(biāo)定和目標(biāo)跟蹤。例如,OpenCV可以運(yùn)行在Windows、Linux、Mac和其他操作系統(tǒng)上。OpenCV主要專注于實(shí)時(shí)應(yīng)用程序。因此,它的設(shè)計(jì)目的是盡可能快地運(yùn)行。另外,對(duì)于Intel處理器,您可以購買并安裝IPP(IntegratedPerformancePrimitives)來加速OpenCV,加速的效果很重要。OpenCV用于圖像處理的C算法和函數(shù)非常廣泛。不依賴外部庫正確完成后您通常可以編譯和鏈接以創(chuàng)建可執(zhí)行文件而無需添加外部幫助。ElOpenCV將BSD許可證用于非商業(yè)目的。應(yīng)用程序和商業(yè)應(yīng)用程序都是免費(fèi)的,作為OpenCV算法的一個(gè)端口被廣泛使用。第一個(gè)開源版本于2000年發(fā)布,第一個(gè)正式版本于2006年發(fā)布。隨著OpenCV1.0的最新版本是OpenCV2.20,它是于2010年發(fā)布,但沒有OpenCV的二進(jìn)制版本,也沒有直接源代碼。它與WindowsCE和WindowsMobile一起使用。如果您想在WindowsCE和WindowsMobile上使用OpenCV,您需要重新編譯OpenCV源代碼對(duì)創(chuàng)建二進(jìn)制庫文件進(jìn)行了細(xì)微更改,您可以在WindowsCE和WindowsMobile中使用,以方便調(diào)試和基準(zhǔn)測(cè)試。本文檔首先使用OpenCV2.1安裝Windows上可用的圖像識(shí)別模塊。桌面使用的Windows桌面版本在開發(fā)過程中是WindowsXPSP3。6.2圖像檢測(cè)模塊及其在Windows上的實(shí)現(xiàn)本文檔中的圖像識(shí)別模塊最終會(huì)部署到手機(jī)上。和手機(jī)硬件要求性能(尤其是處理器頻率和內(nèi)存大?。┖茈y與臺(tái)式機(jī)相比,因此圖像識(shí)別模塊的設(shè)計(jì)并不太復(fù)雜。然而,一個(gè)過于簡單的決定會(huì)對(duì)陽性率和假陽性率產(chǎn)生負(fù)面影響。此外,由于OpenCV2提供的功能,本文中的色情識(shí)別主要使用四個(gè)步驟:人臉識(shí)別白平衡校正皮膚識(shí)別和SVM分類、照片和符號(hào),以提高識(shí)別性能。流程圖如圖5所示。圖6.1圖像檢測(cè)模塊的流程圖6.2.1人臉檢測(cè)網(wǎng)上有很多人臉照片。您可以使用人臉檢測(cè)效果來排除人臉面積與圖像總面積之比超過某個(gè)閾值的圖像。并避免僅基于皮膚檢測(cè)的誤報(bào)。如果同時(shí)在圖片中檢測(cè)到人臉人臉區(qū)域可以用來校正圖像的淺色背景,也就是說,白平衡是正確的。穆文使用OpenCV使用的ViolaJones檢測(cè)器,帶有類似頭發(fā)的功能進(jìn)行人臉識(shí)別。雖然檢測(cè)器適用于檢測(cè)前面的人臉。但它不適合輪廓人臉檢測(cè)。由于配置文件的人臉觀察視圖模板變化較多,木問只進(jìn)行人臉識(shí)別。檢測(cè)過程的兩個(gè)主要函數(shù)是cvLoad()和cvHaarDetectObjects(),cvLoad()函數(shù)是加載一個(gè)參數(shù)定義的分類器。以及派生函數(shù)的函數(shù)cvHaarDetect0ects()是使用參數(shù)定義的分類器和檢測(cè)定義的圖像。返回識(shí)別結(jié)果。這兩個(gè)功能是所有圖像模塊乃至整個(gè)軟件中最耗時(shí)的兩個(gè)功能。并且是實(shí)時(shí)限制軟件整體性能的關(guān)鍵。您可以調(diào)整這兩個(gè)函數(shù)的參數(shù),以在性能和實(shí)時(shí)精度之間取得平衡。本文使用的模型文件是經(jīng)過訓(xùn)練的正面檢測(cè)器。選擇這個(gè)模型文件是因?yàn)樗荗penCV最小和最快的人臉分類器。6.2.2皮膚檢測(cè)皮膚檢測(cè)是幾乎所有基于視覺內(nèi)容的色情圖像識(shí)別系統(tǒng)的重要步驟。這是因?yàn)榇竺娣e裸露的皮膚是大多數(shù)色情作品的共同特征。木紋紋理檢測(cè)主要基于膚色和紋理。顏色屬性對(duì)旋轉(zhuǎn)或平移的變化不敏感。所以它非常有效,您可以在色彩空間類別中包含人類膚色。因此,要有效識(shí)別人體皮膚的顏色,就需要使用膚色。多項(xiàng)研究表明,膚色主要由血紅素和黑色素水平?jīng)Q定。白色、黃色和黑色等種族之間的色調(diào)差別不大,差別來自黑色素。由于內(nèi)容的不同而導(dǎo)致的亮度和飽和度的差異下面是一個(gè)簡短的介紹。關(guān)于色彩空間和本文中使用的一些色彩空間概念。顏色空間是一種定量描述顏色的數(shù)學(xué)方法。這通常用3D模型來表示,每種顏色可以用3個(gè)參數(shù)的3D坐標(biāo)來表示,RGB顏色是人類最常用的顏色空間。根據(jù)紅(紅)、綠(綠)、藍(lán)(藍(lán))原理,每一種都可以由不同比例的紅、綠、藍(lán)三種基本顏色組成。CIE紅、綠、藍(lán)單色光的波長為3D坐標(biāo)中分別為700nm、X46.1nm和435.8nm。RGB顏色是立方的,如圖6所示。RGB是與顯示器和相機(jī)中經(jīng)常使用的設(shè)備相關(guān)的顏色空間。圖6.2RGB顏色空間模型對(duì)于人類來說,色調(diào)、飽和度和亮度通常用于定義顏色。因此,顏色在HSB顏色空間中,取決于可見光波長的陰影是區(qū)分顏色最容易的屬性。從長波長到短波長一系列自然色調(diào)的紅色、橙色、黃色、綠色、藍(lán)色、靛藍(lán)和紫色形成了色輪。陰影與顏色的明暗無關(guān)。飽和度是指顏色的純度。完全飽和的顏色,沒有白光。更多的輕元素多少流入油漆飽和度越低,顏色越低。亮度是指人眼對(duì)可見物體發(fā)出或反射多少光的感知,例如,點(diǎn)燃的蠟燭在較暗的地方比白熾燈更亮。亮度與輻射功率有關(guān)。在3D坐標(biāo)中,HSB顏色空間是一個(gè)六邊形金字塔。YCbCr色彩空間一般用于JPEG圖像壓縮、MPEG視頻壓縮、DVD、攝像機(jī)、數(shù)字電視等。Y代表Luminance。(光度或亮度),它是由以這種方式反射的光譜靈敏度函數(shù)加權(quán)計(jì)算的輻射功率。如您所見,從人類的視覺來看,它更輕。上述亮度和光度的概念是密切相關(guān)的,而且Cb和Cr是代表色差的兩種顏色元素,Cb指的是藍(lán)色分量的偏移量,Cr表示偏移量。紅色的分量集,計(jì)算機(jī)的YCbCr和RGB分量,用8位二進(jìn)制格式表示,它們的取值范圍是0到255。可以使用膚色模型得到一個(gè)二值遮罩圖(本文稱為binImg),一個(gè)binlmg是一個(gè)單通道8位圖像,高寬與原圖相同,binImg像素面標(biāo)注為255,并且像素表面被命名為255。但是,在捕獲過程中為0。由于光線不均勻等外部條件的干擾,人體皮膚可能會(huì)出現(xiàn)在物體的背景中。顏色類似于一個(gè)小場景。所以背景應(yīng)該是第一位的,噪聲、人體空間、粗糙的邊緣等,如果采用特定的方法來消除這些因素的干擾。皮膚檢測(cè)的準(zhǔn)確性大大提高,本文在圖像形態(tài)學(xué)中選擇了排除侵蝕、腫脹、開閉的方法。和之前得到的binImg的二值掩模圖像來分隔小區(qū)域的連續(xù)區(qū)域,以避免特定的干擾。所謂侵蝕調(diào)色板是指確定任何形狀和大小的核心。之前和帶有參考點(diǎn)(錨點(diǎn))(通常一個(gè)軸是一個(gè)以幾何中心為參考點(diǎn)的小實(shí)心正方形)或一個(gè)小的填充圓。內(nèi)核的內(nèi)核是滾動(dòng)圖像全部或部分的掩碼或模板。當(dāng)前內(nèi)核所覆蓋的具有最低像素值的區(qū)域被用作相關(guān)圖像的每個(gè)像素的值。參考腐蝕操作可以在二值和灰度圖像上執(zhí)行。這個(gè)過程被稱為侵蝕,因?yàn)樗趫D像中向內(nèi)切割對(duì)象的邊緣。在OpenCV中,可以通過函數(shù)來完成自定義內(nèi)核生成。cvCreateStructurinElementEx()和腐蝕操作可以通過cvErode()函數(shù)執(zhí)行。它使用當(dāng)前內(nèi)核覆蓋區(qū)域中的最大像素值作為參考點(diǎn)處相應(yīng)圖像像素的值。這種操作稱為填充,因?yàn)樗趫D像中將對(duì)象的邊緣向外擴(kuò)展。在OpenCV中,可以使用cvDilate()函數(shù)執(zhí)行高級(jí)操作。6.3圖像檢測(cè)模塊及其在Windows上的測(cè)試之前開發(fā)的圖像識(shí)別模塊在筆記本電腦上用筆測(cè)試了性能。測(cè)試平臺(tái)配置如下:IntelPentium雙核T2330處理器,主頻1.66GHz,1條GDDR2內(nèi)存;硬盤1206SATA;WindowsXP操作系統(tǒng)服務(wù)包3本文檔選取200張淫穢圖片和400張色情以外的圖像是猜測(cè)。平均圖像分辨率為465(寬)x434(高)像素,整幅圖像的寬高超過100像素,每張圖像的平均檢測(cè)時(shí)間為0.19s,檢測(cè)時(shí)間包括圖像文件讀出時(shí)間。人臉檢測(cè)時(shí)間。白平衡校正時(shí)間皮膚檢測(cè)時(shí)間SVM分類時(shí)間,但是是人臉分類器和SVM分類器的加載時(shí)間和分類器加載時(shí)間。每張圖像的平均檢測(cè)時(shí)間為0.24s,正檢出率為88%,誤報(bào)率為9%,正誤率定義如下。陽性檢測(cè)率2正確分類的色情內(nèi)容數(shù)量/(錯(cuò)誤分類的色情內(nèi)容數(shù)量,包括錯(cuò)誤分類的色情內(nèi)容)誤報(bào)率=圖片數(shù)量。正確分類的非色情內(nèi)容/正確分類的非色情圖片數(shù)量一些色情圖片與非色情照片混淆的主要原因是:照片中的裸體人體占照片總面積的比例非常小,例如一張裸體人體的遠(yuǎn)程照片。A.照片中的人在做愛時(shí)穿了很多衣服。一些非色情圖片被誤認(rèn)為色情的主要原因是因?yàn)樵撊说囊路伾c其膚色相似,并且表面光滑。圖像的大背景區(qū)域與膚色相似,具有光滑的質(zhì)感。

第七章瀏覽器過濾軟件的設(shè)計(jì)7.1LSP技術(shù)相關(guān)模塊向WindowsMobile移植LSP技術(shù)不僅在桌面Windows上受支持,而且在WindowsMobile上也受支持。但是,在WindowsMobile上使用LSP技術(shù)與在桌面Windows上使用它有點(diǎn)不同,因此您需要對(duì)桌面Windows上的等效代碼進(jìn)行微小的更改才能使其在WindowsMobile上運(yùn)行。(1)WSCWriteProviderOrder()函數(shù)在LSP安裝在可執(zhí)行程序中時(shí)使用,該程序?yàn)樽烂鎃indows上的用戶啟用或禁用過濾功能,但在WindowsCE和WindowsMobile上使用但不支持此函數(shù)。該函數(shù)的作用是對(duì)Winsock目錄G中可用的傳輸服務(wù)提供者(包括BSP和“P”)進(jìn)行排序。如果使用WSCInstallProvider()函數(shù)在winsock目錄下安裝一個(gè)新的LSP,然后使用WSCEnumProtocols()函數(shù)枚舉,這個(gè)LSP默認(rèn)會(huì)出現(xiàn)在winsock目錄的末尾。在Winsock目錄中實(shí)現(xiàn)LSP的DLL的位置決定了它是直接從Ws232.411(WindowsCE和WindowsMobile上的Ws2.d11)加載還是從另一個(gè)LSP加載。如果LSP在winsock目錄的頂部,或者如果LSP不在winsock目錄的頂部但上面沒有其他LSP,則直接從Ws2_32.411或Ws2.d11加載。否則,安裝的LSP默認(rèn)情況下可能不會(huì)被調(diào)用,因?yàn)樗怯筛窵SP加載的。您可以使用WSCWriteProviderOrder()函數(shù)在Winsock目錄的頂部顯示新安裝的LSP,以便您可以直接從Ws232.411或Ws2訪問它。加載d11。WindowsMobile不支持WSCWriteProviderOrder()函數(shù),因此在移植到WindowsMobile時(shí),請(qǐng)從可執(zhí)行文件中刪除Winsock目錄重新排序的相關(guān)部分,該部分為用戶提供啟用和禁用過濾功能。對(duì)于運(yùn)行WindowsMobile6的手機(jī)按照上面的步驟,大多數(shù)情況下LSP安裝后就可以過濾掉,而無需重新排列winsock目錄。WindowsMobile也有一個(gè)優(yōu)勢(shì),解決這個(gè)問題的方法就是放棄啟用或禁用用戶的能力。過濾函數(shù)的可執(zhí)行程序可以在LSP動(dòng)態(tài)鏈接庫上電時(shí)自行加載。具體程序如下。在LSP動(dòng)態(tài)鏈接庫中添加一個(gè)名為D11RegisterServer()的函數(shù),將其導(dǎo)出并在D11ReisterServer()函數(shù)中實(shí)現(xiàn)LS。由P安裝。您還需要向注冊(cè)表添加一個(gè)子項(xiàng)。將HKEYLOCALMACHINE\COMM\WS2\LSP鍵和DII、Order、Entry等條目添加到此子鍵(條目)。這是這個(gè)LSP動(dòng)態(tài)鏈接庫I。順序條目可以指定這個(gè)LSP的加載順序。也就是說,winsock目錄中的LSP錯(cuò)誤,其行為類似于WSCInstallProvider()函數(shù)。輸入欄i是install函數(shù)的入口點(diǎn),默認(rèn)h是D11RegisterServer。當(dāng)設(shè)備以這種方式以11"啟動(dòng)時(shí),LSP會(huì)自動(dòng)將設(shè)備加載到Winsock目錄中的指定位置。在WindowsMobile上,您應(yīng)該避免在中間加載或卸載LSP,因?yàn)槟赡軙?huì)遇到意外錯(cuò)誤。如果要打開和關(guān)閉提供過濾功能的可執(zhí)行程序,請(qǐng)將可執(zhí)行程序放在\\Windows\Autostart文件夾中,當(dāng)系統(tǒng)開始加載LSP時(shí),可執(zhí)行程序會(huì)自動(dòng)運(yùn)行。桌面Windows在LSP安裝期間使用UuidCreate()函數(shù)來生成全局A標(biāo)識(shí)符(GUID),該標(biāo)識(shí)符可以實(shí)現(xiàn)與WindowsMobile相同的功能,并由帶有CoCreateGuid的WindowsMobile支持。()中不支持。應(yīng)改為使用。功能。使用WindowsMobileWSPStartup()函數(shù)加載基本服務(wù)提供者時(shí),不能使用WSCGetProviderPath()函數(shù)獲取基本服務(wù)提供者DLL的路徑,必須直接在此處指定基本服務(wù)提供者DLL的絕對(duì)路徑。LoadLibrary()函數(shù)(通常是\Windows\wspm.dll)。這是因?yàn)閃indowsMobile不支持WSCGetProviderPath()函數(shù)。7.2WindowsMobile手機(jī)瀏覽器不良圖片過濾軟件的測(cè)試與改進(jìn)這個(gè)針對(duì)手機(jī)瀏覽器的爛端口圖片過濾軟件已經(jīng)在真實(shí)WindowsMobile上測(cè)試過了,選用的WindowsMobile手機(jī)配置如下:處理器為高通(Qualcomm)MSM7201A,架構(gòu)為ARM11+ARM9DualCore。頻率為X28MHz,內(nèi)存為288MBRAM+26MBROM+4GB存儲(chǔ)卡,“”,203MB程序內(nèi)存,64MB工作內(nèi)存,VGA屏幕分辨率480x640像素。操作系統(tǒng)為WindowsMobile6.1Professional并且測(cè)試的瀏覽器是IEMobile。一是過濾速度慢。當(dāng)圖像識(shí)別引擎的檢測(cè)過程使用皮膚檢測(cè)時(shí)人臉檢測(cè)和SVM分類,從查看色情網(wǎng)頁到顯示警告對(duì)話框的平均時(shí)間接近5秒,這當(dāng)然是由于移動(dòng)設(shè)備的硬件要求有限。其次,軟件不夠穩(wěn)定,加載LSP后,瀏覽器可能無法訪問網(wǎng)頁。確切原因尚不清楚。這可能與Winsock目錄中LSP的安裝順序有關(guān),或者可以假設(shè)LSP的動(dòng)態(tài)鏈接庫需要特權(quán)數(shù)字簽名。加快色情過濾。圖像檢測(cè)過程只能檢測(cè)皮膚而不使用人臉檢測(cè),這樣從查看色情網(wǎng)頁到查看警告對(duì)話框平均不到2秒。面部識(shí)別大大增加了誤報(bào)率。

第八章總結(jié)本白皮書認(rèn)真推動(dòng)了良好的網(wǎng)絡(luò)環(huán)境。注意網(wǎng)頁內(nèi)容的分類和過濾。并敦促社會(huì)保護(hù)兒童免受互聯(lián)網(wǎng)上有害內(nèi)容的侵害。該創(chuàng)新是基于國籍、誠信、國籍的“中國教育內(nèi)容評(píng)估標(biāo)準(zhǔn)”,提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論