已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
, q , , , , t c l a s s i f i e di n d e x :0 2 2 4 u d c :5 1 7 9 8 d i s s e r t a t i o nf o rt h em a s t e r d e g r e e r o u g hs e tm od e la n d i t s a p p l i c a t i o n g so nm e a s u r a b l e s p a c e c a n d i d a t e : s u p e r v i s o r : a c a d e m i c d e g r e ea p p l i e df o r : s p e c i a l i t y : d a t eo fs u b m i s s i o n : d a t eo f0 r a le x a m i n a t i o n : u n i v e r s i t y : a nl i n a p r o f l if a c h a o m a s t e ro fs c i e n c e a p p l i e dm a t h e m a t i c s n o v e m b e r , 2 0 0 9 d e c e m b e r , 2 0 0 9 h e b e iu n i v e r s i t yo fs c i e n c ea n d t e c h n o l o g y ,1 河北科技大學(xué)學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留 并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本 人授權(quán)河北科技大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢 索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。 口保密,在一年解密后適用本授權(quán)書。 本學(xué)位論文屬于 酥保密。 ( 請在以上方框內(nèi)打“4 ) 指導(dǎo)教師簽名: n 靜即 1 吖年月,多日 。l : 摘要 摘要 波蘭數(shù)學(xué)家z p a w l a k 于1 9 8 2 年提出的粗糙集理論是一種刻畫不完整性和不 定性的數(shù)學(xué)工具,它能有效分析和處理模糊、不一致和不完整等各種不完備信息, 從中發(fā)現(xiàn)隱含的知識揭示潛在的規(guī)律。目前,粗糙集理論巳成功應(yīng)用于機器學(xué)習(xí) 決策分析、過程控制、模式識別與數(shù)據(jù)挖掘等領(lǐng)域。在過去的2 0 多年中,許多學(xué) 結(jié)合不同的實際背景,從不同的層面研究和討論了粗糙集的理論和應(yīng)用問題。 模糊性是現(xiàn)實世界中廣泛存在的現(xiàn)象,是眾多實際領(lǐng)域不可回避的問題。1 9 年,美國控制論專家z a 4 e h 提出了模糊集合的概念并創(chuàng)立了模糊集理論,為不確 信息的描述與處理莫定了基礎(chǔ)。 許多學(xué)者豐富了p a w l a k 粗糙集理論,并且在許多具體領(lǐng)域取得了成功的應(yīng)用, 但這些理論均不能有效地處理具有模糊性特征的數(shù)據(jù)約簡和知識發(fā)現(xiàn)問題。本文針 對具有模糊性特征的數(shù)據(jù)約簡和知識發(fā)現(xiàn)問題,建立了基于可能性測度的粗糙集模 型和基于模糊測度的粗糙集模型。 首先針對具有可能性特征的知識約簡的問題,建立了基于可能性測度粗糙集模 型,并討論了上下近似算子的性質(zhì),結(jié)合具體實例探討了基于可能性測度粗糙集模 型的應(yīng)用問題。結(jié)果表明,該模型不僅包容t p a w l a k 粗糙集模型,而且具有良好的分 析性質(zhì),可以有效的解決具有可能性特征的信息處理問題。 其次,針對具有模糊特征的數(shù)據(jù)約簡問題建立了基于模糊測度的粗糙集模型,并 在模糊近似空間上討論了上下近似算子和a 一模糊測度滿足的一些性質(zhì),最后給出了 該模型的簡單應(yīng)用。 關(guān)鍵詞粗糙集;屬性約簡;可能性測度;模糊測度:名一模糊測度;模糊積分 一 葉 ,a b s t r a c t r o u g hs e tt h e o r y , w h i c hw a sp u t 如r w a r db yap o l i s hm a t h e m a t i c i a n n a m e dz p a w l a ki n19 8 2 ,i s ap o w e r f u lt o o lf o rp r o c e s s i n gi m p e r f e c t i o na n du n c e r t a i n t yk n o w l e d g e hc a ne f f e c t i v e l ya n a l y z ev a g u e n e s s ,i n c o m p l e t e ,i n c o n s i s t e n t , a n dav a r i e t yo fi n c o m p l e t e i n f o r m a t i o n ,a n dr e v d i ih el a wo ft h ep o t e n t i a lt h r o u g hd i s c o v e r i n gt h eh i d d e nk n o w l e d g e c u r r e n t l y , r o u g hs e tt h e o r yh a sb e e na l r e a d ya p p l i e ds u c c e s s f u l l yi ns o m ea r e a s ,s u c ha s m a c h i n el e a r n i n g ,d e c i s i o na n a l y z i n g ,p r o c e d u r ec o n t r o l l i n g ,p a t t e r nr e c o g n i t i o na n d d a t em i n i n ge t c i nt h ep a s t2 0y e a r s ,m a n ys c h o l a r sh a v ed i s c u s s e dt h er o u g hs e tt h e o r y a n di t sa p p l i c a t i o n sf r o md i f f e r e n tl e v e l sa c c o r d i n gt od i f f e r e n ta c t u a lb a c k g r o u n d v a g u e n e s si saw i d e s p r e a dp h e n o m e n o ni nt h ew o r l da n da nu n a v o i d a b l ep r o b l e mi n m a n yp r a c t i c a la r e a s z a 。h e dp u tf o r w a r dt h ec o n c e p to ff u z z ys e t sa n de s t a b l i s h e dt h e f u z z ys e tt h e o r y , w h i c hb u i l taf o u n d a t i o nf o rd e s c r i b i n ga n dd e a l i n gw i t hu n d e f i n e d k n o w l e d g e m a n ys c h o l a r sh a v ee n r i c h e d t h ep a w l a kr o u g hs e tm o d e l ,a n dh a v em a d es o m e s u c c e s s f u la p p l i c m i o n s ,b u tt h e s et h e o r i e sc a l ln o te f f e c t i v e l yd e a lw i t ht h ed a t ar e d u c t i o n a n dk n o w l e d g ed i s c o v e r yw i t hf u z z yc h a r a c t e r i s t i c i nt h i sp a p e r , w ee s t a b l i s ht h er o u g h s e t m o d e lb a s e do np o s s i b i l i t ym e a s u r ea n dt h er o u g hs e tm o d e lb a s e do nf u z z ym e a s u r ef o rd a t a r e d u c t i o na n dk n o w l e d g e d i s c o v e r yp r o b l e m sw i t hf u z z yc h a r a c t e r i s t i c s f i r s t l y , f o rd a t ar e d u c t i o np r o b l e m sw i t hp o s s i b i l i t yc h a r a c t e r i s t i c s ,w es e tu p t h er o u g h s e tm o d e lb a s e do np o s s i b i l i t ym e a s u r ea n dd i s c u s st h ep r o p e r t i e so ft h eu p p e ra n dl o w e r a p p r o x i m a t i o no p e r a t o r s it h e n ,w ea n a l y z et h ea p p l i c a t i o no f t h er o u g hs e tm o d e lb a s e do n p o s s i b i h t ym e a s u r et h r o u g h a l le x a m p l e a l lt h er e s u l t ss h o wt h a tt h er o u g hs e tm o d e lb a s e d o np o s s i b i ! i t ym e a s u r en o to n l yi n c l u d ep a w l a kr o u g hs e tm o d e l ,b u ta l s oh a sab e t t e r a n a l y s i sp r o p e r t y t h i sm o d e lc a nb eu s e dt os o l v ei n f o r m a t i o np r o c e s s i n gp r o b l e mw i t h p o s s i b i l c h a r a c t e r i s t i c se f f e c t i v e l y - s e c o n d l y ,w es e tu pt h er o u g hs e tm o d e lb a s e do nf u z z ym e a s u r ef o rd a t ar e d u c t i o n p r o b l e m sw i t hf u z z yc h a r a c t e r i s t i c sa n dd i s c u s ss o m ep r o p e r t i e so f t h eu p p e ra n dl o w e r a p p r o x i m a t i o no p e r a t o r sa n da f u z z yo p e r a t o r t h e n ,w eg i v eas i m p l ee x a m p l e k e yw o r d sr o u g hs e t ;a t t r i b u t er e d u c t i o n ;p o s s i b i l i t ym e a s u r g ;f u z z ym e a s u r e ;力一f u z z y m e a s u r e ;f u z z yi n t e g r a l i l 摘要。 a b s t r a c t : 第l 章緒論。 1 1 研究背景 1 2 粗糙集理論研究的現(xiàn)狀與最 1 2 1 擴展模型 1 2 2 粗糙集理論的應(yīng)用 1 3 本課題研究的重點、研究意 第2 章預(yù)備知識 2 1 粗糙集理論的基本知識6 2 1 1 知識與知識庫6 2 1 。2 不精確范疇、近似于粗糙集7 2 1 3 知識約簡:1 0 2 2 模糊測度理論1 0 :叼笆_ 。 2 2 1 模糊測度的概念及其性質(zhì)1 2 2 2 2 幾種特殊的模糊測度及其性質(zhì)1 2 2 3 模糊積分1 3 2 3 1 模糊積分的概念1 3 2 4 本章小結(jié)1 4 第3 章基于可能性測度的粗糙集模型1 5 3 1 主要結(jié)果- 。15 3 1 1基本理論1 5 3 1 2 基于可能性測度的上下近似算子豹性質(zhì)1 6 3 2 實例分析1 8 3 3 本章小結(jié)。2 1 第4 章基于模糊測度的粗糙集模型2 2 4 1 模糊測度空間上的上下近似算子2 2 4 2 基于模糊測度的上下近似算子的性質(zhì)2 3 4 3 實例分析。2 5 4 4 本章小結(jié):2 8 結(jié)論。2 9 t i i 河北科技大學(xué)碩士學(xué)位論文 參考文獻:3 0 攻讀碩士期間所發(fā)表的論文:3 4 致謝j 3 5 i v 第l 章緒論 第1 章緒論 1 1 研究背景 粗糙集理論【培】是一種新型的魅理模糊和不確定知識的數(shù)學(xué)工具。目前已在人工 智能、知識與數(shù)據(jù)發(fā)現(xiàn)模式識別與分類、故障檢測等方面得到了廣泛應(yīng)用。粗糙集( r s ) 理論是一種有效的分析和處理不精確、不一致和不完整等不完備信息的新型數(shù)學(xué)工 具。由于最初關(guān)于粗糙集理論舶研究主要是用波蘭語發(fā)表的,因此當時并沒有引起 國際數(shù)學(xué)界與計算機學(xué)界的重視,研究地域也僅限于東歐國家。從2 0 世紀9 0 年代起 粗糙集理論逐漸成為信息科學(xué)的一大研究熱點,受到越來越多國內(nèi)外學(xué)者的關(guān)注。 1 9 9 2 年,第一屆關(guān)于粗糙集理論的國際學(xué)術(shù)會議在波蘭召開。1 9 9 5 年a c m c o m m u n i c a t i o n 將其列為新浮現(xiàn)的計算機科學(xué)的研究課題。1 9 9 8 年,信息科學(xué)雜志 ( i n f o r m m i o ns c i e n c e s ) 還為粗糙集理論的研究出版了專輯。2 0 多年來,粗糙集理論 的研究越來越深入并且已經(jīng)成功的應(yīng)用到機器學(xué)習(xí)與知識發(fā)現(xiàn),數(shù)據(jù)挖掘,決策支 持與分析等領(lǐng)域【3 8 】,但由于其嚴格的等價關(guān)系限制了粗糙集的發(fā)展和應(yīng)用針對這個 問題,d u b o i s 和p r a d e 9 - 1 0 提出了模糊粗糙集的概念,作為粗糙集的一個模糊推廣。目 前粗糙集理論已成為國內(nèi)外人工智能領(lǐng)域中一個較新的學(xué)術(shù)熱點,引起了越來越多 科研人員的關(guān)注。 模糊集理論【1 1 】首先是由美國控制論專家l a z a d e h 教授于1 9 6 5 年提出的也是 一種處理模糊和不確定方向知識的數(shù)學(xué)工具,它已成功的應(yīng)用于模糊控制、模式識 別、模糊聚類分析模糊決策、模糊評判、系統(tǒng)理論、信息檢索、醫(yī)學(xué)、生物學(xué)等 各個方面。1 9 7 8 年,z a h e d 在模糊集理論的基礎(chǔ)上又提出了可能性理論【i2 | 。 1 1 1 粗糙集理論的特點 1 ) r s 不需要先驗知識。模糊集和概率統(tǒng)計方法是處理不確定信息的常用方法 但這些方法需要一些數(shù)據(jù)的附加信息或先驗知識,如模糊隸屬函數(shù)和概率分布等這 些信息有時并不容易得到。r s 分析方法僅利用數(shù)據(jù)本身提供的信息,無需任何先驗 知識。 2 ) r s 是一個強大的數(shù)據(jù)分析工具。它能表達和處理不完備信息,能在保留關(guān) 鍵信息的前提下對數(shù)據(jù)進行化簡并求得知識的最小表達;能識別并評估數(shù)據(jù)之間的依 賴關(guān)系,揭示出概念簡單的模式,能從經(jīng)驗數(shù)據(jù)中獲取易于證實的規(guī)則知識,特別 適于智能控制。 3 1r s 與模糊集分別刻畫了不完備信息的兩個方面。r s 以不可分辨關(guān)系為基礎(chǔ), 側(cè)重分類,模糊集基于元素對集合隸屬程度的不同,強調(diào)集合本身的含混性。從r s 河北科技大學(xué)碩士學(xué)位論文 的觀點看,粗糙集合不能清晰定義的原因是缺乏足夠的論域知識,但可以用一對清晰 集合逼近。有關(guān)r s 和模糊集內(nèi)在聯(lián)系的闡述及模糊粗糙集的概念,r s 和證據(jù)理論也 有一些相互交疊之處在實際應(yīng)用中可以相互補充。 1 2 粗糙集理論研究的現(xiàn)狀與最新進展 粗糙集以其獨特的優(yōu)勢正在贏得越來越多的研究者關(guān)注,并在各個應(yīng)用領(lǐng)域獲 得了廣泛的應(yīng)用。然而這仍是一個極其年輕并在高速發(fā)展的學(xué)科。在過去的2 0 多年 中,許多學(xué)者結(jié)合不同的實際背景,從不同的層面研究和討論了粗糙集的理論和應(yīng) 用問題。 1 2 1 擴展模型 粗糙集理論應(yīng)用于數(shù)據(jù)分析時,會遇到噪音、數(shù)據(jù)缺失、大數(shù)據(jù)量等一系列經(jīng) 典理論解決不夠理想的問題。因此在近幾年的研究中,出現(xiàn)了許多粗糙集的擴展模 型。其中典型的有可變精度粗糙集模型,相似模型等。 1 ) 可變精度粗糙集的研究 傳統(tǒng)粗糙集理論也存在一定的局限性,如它處理的分類必須是完全正確或肯定 的,所處理的對象是已知的,且從模型中得到的結(jié)論僅適用于這些對象等。這些局 限性都限制了它的應(yīng)用。許多學(xué)者從多方面推廣了這一模型,其中最主要的是z i a r k o 提出的可變精度粗糙集( v p r s ) 模型【1 3 d 4 1 。在這個模型中給定一個閾值,當對象所在 的等價類在某種程度上包含于集厶腫時,就認為這個對象屬于x 。這一推廣在應(yīng)用 中非常重要,因為實際問題中絕對的包含有時是不必要的。目前,很多學(xué)者開始對 v p r s 進行研究,并取得了一定的成績。k a t z b e r g 和z i a r k o 進一步提出了不對稱邊界 的v p r s 模型,即在上下近似的定義中的可以是不相同的,從而使此模型更加一般 化。 2 1 相似模型 經(jīng)典粗糙集模型的基礎(chǔ)一不可區(qū)分關(guān)系一是很強的。在數(shù)據(jù)中存在缺失的屬性 值的時候( 在數(shù)據(jù)庫中很普遍) ,不可區(qū)分關(guān)系或者說是等價關(guān)系無法應(yīng)付這種情形。 為擴展粗糙集的能力,有許多作者提出了用相似關(guān)系來代替不可區(qū)分關(guān)系作為粗糙 集的基礎(chǔ)f 1 5 】。 1 2 2 粗糙集理論的應(yīng)用 可以說,粗糙集理論由于其在數(shù)據(jù)挖掘方面的應(yīng)用而受到廣泛的關(guān)注。最近幾 年,粗糙集理論的應(yīng)用研究得到了長足發(fā)展。這里從幾個方面簡述相關(guān)的應(yīng)用。由 于研究粗糙集理論應(yīng)用的文獻非常多,我們僅列舉其中極少數(shù)有代表性的應(yīng)用。 1 ) 數(shù)據(jù)縮減與規(guī)則生成 2 第1 章緒論 數(shù)據(jù)縮減與規(guī)則生成。k o h a v i 和f r a s c a 等用實驗證明,數(shù)據(jù)庫中最有用的子集 并不一定是粗糙集中的相對核,甚至可能不包括完全的核屬性集b 6 o n i n gs h a n 則討 論了基于r s 的從數(shù)據(jù)中發(fā)現(xiàn)規(guī)則的增量自適應(yīng)算法【l7 1 。提出了一種找到最大泛化的 規(guī)則和約簡的算法和規(guī)則與縮減的增量算法。g r z y m a l a b u s s e 和z o u b i 比較了同時 使用可能規(guī)則及確定規(guī)則和只使用確定規(guī)則的性能,發(fā)現(xiàn)前者產(chǎn)生較小的錯誤率 l l 引。c h o u b e y 和d 9 0 u g n n 等的研究得出了同樣的結(jié)論。他們還在屬性選擇的題目下 研究了近似約簡問題,并給出了幾個啟發(fā)式算法1 1 9 1 。l e n a r c i k 和p i a s t a 研究了在每 個對象的c o s t 不一樣時的粗糙分類器。他們的主要方法是對所有的對象定義一個新 的c o s t 屬性【2 們。m o l l e s t a dt 和k o m o r o w s k ij 提出了在粗糙集框架下缺省規(guī)則生成 的格搜索算法【2 1 1 ,并給出一組啟發(fā)式搜索策略。 2 ) 大數(shù)據(jù)集 卣于粗糙集在數(shù)據(jù)挖掘中具有較大的計算復(fù)雜度,受關(guān)聯(lián)規(guī)則挖掘算法的啟發(fā), 有些作者提出了將關(guān)聯(lián)規(guī)則挖掘技巧應(yīng)用于粗糙集的確定和可能規(guī)則生成中來,以 減小粗糙集方法的計算復(fù)雜度【2 2 】。n g u y e n 和s k o w r o n 等描述了一種決策表分解方 法【2 3 1 。他們首先使用遺傳算法在決策表中尋找代表性的模板( 類似如一條支持度最大 的規(guī)則) ,然后將決策表一分為二。滿足模板的為一個部分,不滿足的為另一部分。 將該過程遞歸進行,直至決策表的大小滿足要求為止,然后再對小決策表生成規(guī)則。 當新對象到來時,從頂部開始匹配,直至葉子的規(guī)則。 3 ) 多方法融合 由于粗糙集在處理數(shù)據(jù)時存在一定的缺點,因此有必要把粗糙集和其他不確定 方法結(jié)合起來。目前比較常用的作法是粗糙集和神經(jīng)網(wǎng)絡(luò)及模糊集的結(jié)合應(yīng)用。 j e l o n e k 等研究了將r s 理論用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的預(yù)處理,主要進行了屬性的縮減 和屬性值域的縮減,上述處理有乖懺提高學(xué)習(xí)效率,并且保持了較低的穩(wěn)定的近似 分類誤差錯率f 堋。由于在泛化過程f p 消除了不必要的屬性值和在縮減過程中去掉了 不相關(guān)的屬性,最后的規(guī)則是很一般的形式并且可用高層次抽象概念表達。h u 等人 提出了一種將基于屬性的歸納概念方法和r s 結(jié)合的方法i z5 | ,l i n g r a s 和d a v i e s 研究 了粗糙集和遺傳算法的集合,提出了一種粗糙遺傳算法【26 。雖然在這方面已經(jīng)取得 了一定的成績,但是還有很多難點并沒有解決,仍需進一步的研究。 4 ) 信息檢索: b e a u b o u e f 等在r s 理論基礎(chǔ)上提出了一種r o u 曲關(guān)系數(shù)據(jù)庫模型【27 1 ,并定義了 各種r o u g h 關(guān)系算子。該模型將r s 的重要性質(zhì)引入到基本關(guān)系模型中,從而使之具 有更好的檢索能力和適應(yīng)性。在此模型中,查詢結(jié)果返回的是基于屬性的r o u g h 關(guān)系, 它不僅包含一個查詢的確定應(yīng)答,還包含可能的應(yīng)答,例如上近似所包含的元組 在盤 。c ro 3 河北科技大學(xué)碩士學(xué)位論文 5 ) 粗糙邏輯 不少邏輯學(xué)家和理論計算機科學(xué)家試圖通過r s 建立r o u g h 邏輯。p a w l a k 等在 c a c m1 9 9 5 年1 1 期上發(fā)表綜述,認為研究粗糙邏輯一基于r s 的不精確推理邏輯一 是粗糙集應(yīng)用研究中最重要的課題之一。l i n 和l i u 等基于拓撲學(xué)觀念定義了r o u d a 下近似算子l 和r o u g h 上近似算子尉2 引,y a 0 和l i n 通過研究粗糙集和模態(tài)邏輯的關(guān) 系,提出并研究了一系列擴展粗糙集的性質(zhì)【2 9 1 。通過使用不同的二元關(guān)系作為粗糙 集的基礎(chǔ),可以導(dǎo)出不同的粗糙集代數(shù)模型i 相應(yīng)為不同的模態(tài)邏輯。 6 ) 在決策評價中應(yīng)用 利用粗糙集理論還可以進行決策評價,以給決策者提供正確的決策意見。文 3 0 ,3 1 介紹了有關(guān)綠色評價的理論。文 3 2 中應(yīng)用粗糙集原理,提出了粗糙集綜合 綠色度評價法,以提高零件制造工藝綠色度評價的客觀性,并闡述了該方法的原理 及運用該方法進行綜合評價的步驟。 7 ) 高效的約簡算法 約簡的求解是一個n p 困難問題,導(dǎo)致n p 問題的主要原因是屬性的組合爆炸。高 效的約簡算法是粗糙集應(yīng)用于知識發(fā)現(xiàn)的基礎(chǔ),要在令人可接受的時間內(nèi)獲得約簡 的通常做法是基于啟發(fā)式知識的約簡方法,國內(nèi)外學(xué)者在這方面做了大量的研究, 現(xiàn)在尚不存在一種非常有效的方法,因此尋求快速的約簡算法,及其增量版本這一 問題仍是粗糙集理論的研究熱點之一。 總之,粗糙集理論己成為信息科學(xué)最為活躍的研究領(lǐng)域之一。同時,該理論還 在醫(yī)學(xué)、化學(xué)、材料學(xué)、地理學(xué)、管理科學(xué)和金融學(xué)等其他學(xué)科得到了成功地應(yīng)用。 近年來,粗糙集理論的研究成果主要在于,粗糙集理論用確定的方法處理不完備和 不確定的信息和數(shù)據(jù),不需要先驗知識,可從數(shù)據(jù)中得到知識,生成決策規(guī)貝1 j 1 3 3 - 3 5 】; 圍繞粗糙集理論與應(yīng)用研究,開發(fā)出了相應(yīng)的軟件支撐系統(tǒng),在實際應(yīng)用中涌現(xiàn)出 了很多成功的范例。 1 3本課題的研究重點、研究意義以及論文結(jié)構(gòu) 如何在模糊測度空間里建立粗糙集模型是本課題研究的重點。當我們遇到的是 具有模糊性特征的數(shù)據(jù)約簡和知識發(fā)現(xiàn)問題時,如何利用模糊測度,以及如何利用 粗糙集理論,而該問題的瓶頸在于不確定信息的處理策略。因而,本課題所研究的 基本內(nèi)容應(yīng)包括以下幾個方面: 1 ) 在測度空間上建立粗糙集模型t 2 ) 與其他模型進行比較; 3 ) 討論新建模型的一些性質(zhì); 4 ) 討論模型在屬性約減、數(shù)據(jù)挖掘、模式識別等方面的一些應(yīng)用。 4 息系 決具 挖掘 論文的結(jié)構(gòu)大體安排如下: 第1 章為緒論部分,分別對研究背景、研究內(nèi)容、當前的研究現(xiàn)狀、有待解決 的問題以及文章結(jié)構(gòu)進行簡單介紹; 第2 章是預(yù)備知識給出了后續(xù)章節(jié)的一些預(yù)備知識,介紹了經(jīng)典粗糙集的基本 知識,討論了一些基本性質(zhì);介紹了模糊測度的定義,并且給出了幾個常用模糊測 度的定義;介紹了模糊積分的基本概念。 第3 章針對具有可能性特征的數(shù)據(jù)約簡和知識發(fā)現(xiàn)問題,提出了基于可能性測 度的粗糙集模型,將粗糙集理論引入到可能性測度空間中,并給出了基于可能性測 度的粗糙集模型的上下近似算子,討論了它們的一些性質(zhì),最后給出了該模型在綜。蠢。 合評判中應(yīng)用的例子。 第4 章針對具有模糊特征的不確定信息處理問題,給出了基于模糊測度的模糊 近似空間的概念,在此基礎(chǔ)上建立了模糊近似空間上的基于模糊測度的粗糙集模型, 討論了該模型粗糙近似算子的一些性質(zhì),最后給出了該模型的簡單應(yīng)用。 文章最后為結(jié)論,總結(jié)全文并提出了研究前景展望。 5 河北科技大學(xué)碩士學(xué)位論文 第2 章預(yù)備知識 粗糙集理論是一種新的處理模糊和不確定性知識的數(shù)學(xué)工具,其主要思想就是 在保持分類能力不變的前提下,通過知識約簡,導(dǎo)出問題的決策或分類規(guī)則。目前 粗糙集理論已被成功的應(yīng)用于機器學(xué)習(xí)、決策分析、過程控制:模式識別與數(shù)據(jù)挖 掘等領(lǐng)域。本章主要介紹一些有關(guān)經(jīng)典粗糙集理論的基本知識,為后面的討論提供 理論基礎(chǔ), 2 1 粗糙集理論的基本知識 2 1 1 知識與知識庫 設(shè)u 痧是我們感興趣的的對象構(gòu)成的有限集合,稱為論域。任何子集x u , 稱為u 中的一個概念或范疇。u 中的任何概念族稱為關(guān)于u 的抽象知識,簡稱知識。 一個劃分z 定義為z = 置,x 2 ,k ) ;x j 三u ,置西,對于 刀 f ,f ,j f = 1 ,2 ,甩;u 墨= u 。u 上的一族劃分稱為關(guān)于u 的一個知識庫。假設(shè)u 為 i = 1 非空等價論域,尺是定義在u 上的一個等價關(guān)系, x 】尺表示包含元素x u 的r 等價 類。u r 表示所有等價類的集合。 定義2 1若尸r ,且尸多,則n 尸( p 中所有等價關(guān)系的交集) 也是一個等 價關(guān)系,稱為尸上的不可區(qū)分關(guān)系,記為i n d ( p ) ,且有 x k = n x 】異。 定義2 2 對于當k = ( u ,r ) 為一個知識庫,則i n d ( k ) 定義為k 中所有等價關(guān)系 族,記作i n d ( k ) = i n d ( p ) i 痧p r ) 。 例2 1 給定一個玩具積木的集合u = 五,x 2 ,) ,并且假設(shè)這些積木有不同 的顏色( 紅、黃、藍) ,形狀( 方、圓、三角) ,體積( 小、大) 。因此,這些積 木都可以用顏色、形狀、體積這些知識來描述。例如一塊積木可以是紅色的、小而 圓的,或黃色、大而方的等。如果我們根據(jù)某一屬性描述這些積木的情況,就可以 按顏色、形狀、體積分類。 按顏色分類: x l ,x 3 ,工7 紅: x 2 _ 藍: 毛,旄,黃。 按形狀分類: 而,黽圓: 6 第2 章預(yù)備知 x 2 ,x 6 方; 黽,x 4 ,x 7 ,三角。 按體積分類: x 2x 7 ,石8 大; 一, x l ,x 3 ,x 5 ,x 6 刀、。 換言之,我們定義三個等價關(guān)系( 即屬性) 這些等價關(guān)系,可以得到下面三個等價類: u r l = x 2 ,x 4 ) , x l ,x 3 ,x 7 , x 5 ,x 6x 8 ) ) , u r 2 = x l ,x 5 ) , x 2 ,x 6 ) , x 3 ,x 4 ,z 7 ,x 8 ) ) , u r 3 = x 2 ,x 7 ,x 8 ) , x 1 ,x 3x 4 ,x 5x 6 ) ) 。 這些等價類是由知識庫k = ( ( , 足,r :,r ,) ) 中的初等概念( 初等范疇) 構(gòu)成的。 基本范疇是初等范疇的交集構(gòu)成的,例如下列集合: 而,x 3 ,x 7 n x 3 ,x 4 ,x 7 ,x 8 ) = x 3 ,而) , 而,矗) n 砭,x 6 ) = x d , 。 x 5 ,x 6 ,x s n x 3 ,x 4 ,x 7 ,x 8 ) = x 8 ) 。 它們分別為 蜀,r :) 的基本范疇,即:紅色三角形,藍色方形,黃色三角形。 下列集合: : 一以o “,黽,x 7 n x 3 ,x 7 ,x 8 n x 2 ,x 7 ,x 8 ) = 而) , 恐,x 4 ) n x 2 ,x 6 n f 屯,x 7 ,x s ) = 恐) , 鼉,x 6 ,黽) n x 3 ,x 4 ,x 7 ,x 8 n x 2 ,x 7 ,x 8 ) = 。 它們分別為 足r :r , 的基本范疇,即:紅色大三角形,藍色大方形,黃色大 三角形。 注意:有些范疇在這個知識庫中是無法得到的,例如集合: x 2 , n 五,x 5 ) = 多, x z ,x 3 ,x 7 n x 2 ,x 6 ) = 痧, 為空集,也就是說,在我們這個知識庫中是不存在藍色圓形和紅色方形的范疇, 即為空范疇。 。 2 1 2 不精確范疇,近似與粗糙集 。 令x u ,r 是u 上的一個等價關(guān)系,當x 能表達成某些尺基本范疇的并時,稱 x 是r 可定義的;否則稱x 是尺不可定義的。r 可定義集是論域的子集,它可在知 識庫r 中精確定義,而尺不可定義集不能在這個知識庫中定義。尺可定義集也稱作月 精確集,而r 不可定義集稱為r 非精確集或r 粗糙集。 當存在等價關(guān)系r i n d ( k ) 且x 為尺精確集時,集合x u 稱為k 中的精確集; 7 河北科技大學(xué)碩士學(xué)位論文 當對于任何的r i n d ( k ) ,x 都為r 粗糙集,則x 稱為k 中的粗糙集。 對于粗糙集可以近似地定義,使用兩個精確集,即粗糙集的上近似和下近似來 描述。 定義2 3 【1 】任意的x 互u ,r 是定義在u 上的等價關(guān)系。二元組( u ,r ) 稱做 p a w l a k 近似空間。下面定義的兩個子集: 星( x ) = u r u rl 】,x ) ,r ( x ) = u f f u ri 】,n x 痧) , 分別稱為x 的r 下近似集合和尺上近似集合。 下近似集合和上近似集合也可以用下面的表達式定義: 星( x ) = x u rb 月x ) ,r ( x ) = x u ri x 舟n x 痧) 集合b n 月( x ) = r ( x ) 一星( x ) 稱作集合x 的r 邊界域;p o s r ( x ) = 星( x ) 稱作集合 x 的r 正域;n e g 凡( x ) = u g ( x ) 稱作集合x 的尺負域,顯然 r ( x ) = p o s 月( x ) u b n 月( x ) 。 星( x ) 或p o s r ( x ) 是根據(jù)等價關(guān)系尺判斷肯定屬于x 的u 中的元素組成的集合; h 骨( x ) 是根據(jù)等價關(guān)系r 既不能判斷屬于x 也不能判斷肯定屬于x 。的u 中的元素 組成的集合;n e g 。( x ) 是根據(jù)等價關(guān)系r 判斷肯定不屬于x 的u 中的元素組成的集 從上下近似算子的定義我們可以得到下面的性質(zhì)。 定理2 1 在p a w l a k 近似空間( 【,r ) 中,對于任意的x ,y u , 1 ) 星( x ) x r ( x ) ; 2 ) 超( x n y ) = 星( x ) n r ( y ) ,r ( x u y ) = r ( x ) u r ( y ) ; 3 ) 彳yj 尺( x ) r ( x ) ,堡( x ) 堡( x ) ; 4 ) r ( x ) = ( 星( ) ) 。,墨( 。) = ( r ( x ) ) 。 定義2 , 4 在p a w l a k 近似空間( u ,月) 中,x 互u 如果墨( x ) = r ( x ) ,則稱集合x 為 可定義集;如果r ( x ) r ( x ) 則稱集合x 為不可定義集,或者是粗糙集。 定義2 5 【1 】 在p a w l a k 近似空間( u ,r ) 中,對于任意的x 互u ,由等價關(guān)系r 定 義的集合x 的近似精度為: 口。( x ) :c a r d ( r ( x ) ) , 一 c a r d ( r ( x ) ) 其中x 西,c a r d ( x ) 表示集合x 的基數(shù)。 集合x 的粗糙度定義為: 休( x ) = l c z r ( x ) 集合的近似精度用來反映我們對于了解集合x 的知識的完全程度:集合的粗糙 度與近似精度恰恰相反,它反映的是我們對于了解集合彳的知識的不完全程度。 集合并的近似精度口尺( x ) 和粗糙度p r ( x ) 具有下面的性質(zhì): 8 第2 章預(yù)備知識 定理2 2 0 , u r 3 = x 1 ,x 5 , z 2 ,x 7 ,x 8 , x 6 ) , x 3 ,x 4 ) ) 關(guān)系i n d ( r ) 有下列等價類: u i n d ( r ) = “五,x s , x 2 , , 恐) , 訖) , 暢) 而) ) , 關(guān)系r ,為r 中必要的。因為 u i n d ( r - r j ) = j c l ,鼉) , x 2 ,x 7 ,魂) , 瑪) , 心) , ) u i n d ( r ) 對于關(guān)系b ,我們有 u i n d ( r - 局) = “而,毛 , 屯,黽) , 恐) , 氣) , i ) , 而) ) = u i n d ( r ) , 故關(guān)系r ,是r 中不必要的。 同樣對于關(guān)系尼 u i n d ( r - b ) = “而,墨) , x 2 ,黽) , 而 , 氏) , , 為) ) = u m d ( r ) , 因此關(guān)系r ,也是足中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026中國礦業(yè)大學(xué)沐樂院士領(lǐng)銜城鄉(xiāng)發(fā)展與綠色轉(zhuǎn)型研究中心(URGT)特聘教授招聘1人備考題庫(江蘇)附答案詳解(a卷)
- 2026年聊城市東阿縣南湖行知學(xué)校教師招聘備考題庫(12人)附答案詳解(完整版)
- 2026廣東中山市大涌鎮(zhèn)隆鎮(zhèn)物業(yè)管理有限公司招聘備考題庫含答案詳解(培優(yōu))
- 2026上半年海南事業(yè)單位聯(lián)考三亞市市場監(jiān)督管理局下屬事業(yè)單位招聘3人備考題庫 (第1號)附參考答案詳解(基礎(chǔ)題)
- 2026上半年貴州事業(yè)單位聯(lián)考貴州傳媒職業(yè)學(xué)院招聘12人備考題庫附答案詳解(綜合卷)
- 2026山東大學(xué)齊魯?shù)诙t(yī)院院前急救科醫(yī)師崗位(非事業(yè)編制)招聘2人備考題庫附參考答案詳解(奪分金卷)
- 2026廣東深圳大學(xué)藝術(shù)學(xué)部李象群特聘教授團隊博士后招聘1人備考題庫含答案詳解(奪分金卷)
- 2026上海市盲童學(xué)校招聘9人備考題庫附參考答案詳解(預(yù)熱題)
- 2026四川德陽城市軌道交通職業(yè)學(xué)院春季學(xué)期招聘140人備考題庫附參考答案詳解(研優(yōu)卷)
- 2026年1月廣東深圳市第七高級中學(xué)招聘專任教師4人備考題庫及答案詳解一套
- 抽水蓄能電站項目建議書(參考范文)
- 名著導(dǎo)讀傅雷家書
- 鉆探施工安全培訓(xùn)
- 博士組合物使用指南
- 高校輔導(dǎo)員隊伍建設(shè)基本情況報告
- 《相變儲熱供暖工程技術(shù)標準》
- 安裝防雨棚合同協(xié)議書
- DL∕T 1917-2018 電力用戶業(yè)擴報裝技術(shù)規(guī)范
- 光伏維修維保合同
- CJJ 82-2012 園林綠化工程施工及驗收規(guī)范
- 黑龍江商業(yè)職業(yè)學(xué)院單招《語文》考試復(fù)習(xí)題庫(含答案)
評論
0/150
提交評論