基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究_第1頁(yè)
基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究_第2頁(yè)
基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究_第3頁(yè)
基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究_第4頁(yè)
基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究一、本文概述在數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的領(lǐng)域中,數(shù)據(jù)約簡(jiǎn)和模型擴(kuò)展是兩個(gè)至關(guān)重要的研究方向。它們不僅關(guān)乎到數(shù)據(jù)處理的高效性,也直接關(guān)系到機(jī)器學(xué)習(xí)模型的性能和準(zhǔn)確性。本文將對(duì)基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型進(jìn)行深入研究,旨在探討其理論框架、應(yīng)用方法以及在實(shí)際問(wèn)題中的效能。我們將對(duì)粗糙集理論進(jìn)行簡(jiǎn)要介紹,闡述其在數(shù)據(jù)約簡(jiǎn)中的基本原理和方法。粗糙集理論是一種處理不精確、不確定和模糊數(shù)據(jù)的數(shù)學(xué)工具,它通過(guò)定義上近似和下近似等概念,實(shí)現(xiàn)對(duì)數(shù)據(jù)的有效約簡(jiǎn),同時(shí)保留關(guān)鍵信息。接著,我們將重點(diǎn)關(guān)注基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法。在這一部分,我們將詳細(xì)討論如何利用粗糙集理論進(jìn)行數(shù)據(jù)約簡(jiǎn),包括屬性約簡(jiǎn)和決策規(guī)則約簡(jiǎn)等,并分析其在實(shí)際應(yīng)用中的優(yōu)勢(shì)和挑戰(zhàn)。本文還將探討粗糙集擴(kuò)展模型的研究。我們將介紹幾種常見(jiàn)的粗糙集擴(kuò)展模型,如模糊粗糙集、動(dòng)態(tài)粗糙集和量子粗糙集等,并分析它們?cè)谔幚韽?fù)雜數(shù)據(jù)問(wèn)題時(shí)的優(yōu)勢(shì)和潛力。我們將通過(guò)具體案例和實(shí)驗(yàn)驗(yàn)證,對(duì)基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型進(jìn)行實(shí)證研究。我們將分析這些模型在不同數(shù)據(jù)集上的表現(xiàn),評(píng)估其在實(shí)際問(wèn)題中的效能,并提出改進(jìn)和優(yōu)化建議。通過(guò)本文的研究,我們期望能夠?yàn)閿?shù)據(jù)約簡(jiǎn)和模型擴(kuò)展領(lǐng)域提供新的理論支撐和實(shí)踐指導(dǎo),推動(dòng)相關(guān)技術(shù)的進(jìn)一步發(fā)展和應(yīng)用。二、粗糙集基本理論粗糙集(RoughSet)理論,作為一種處理不確定性和模糊性的新型數(shù)學(xué)工具,自其提出以來(lái)就在數(shù)據(jù)挖掘、模式識(shí)別、機(jī)器學(xué)習(xí)、決策支持等領(lǐng)域得到了廣泛的應(yīng)用。粗糙集理論的核心思想是通過(guò)等價(jià)關(guān)系或近似關(guān)系對(duì)論域進(jìn)行劃分,進(jìn)而研究各個(gè)子集的性質(zhì),從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的潛在信息。等價(jià)關(guān)系與劃分:在粗糙集理論中,等價(jià)關(guān)系是一種特殊的二元關(guān)系,具有自反性、對(duì)稱(chēng)性和傳遞性。通過(guò)等價(jià)關(guān)系,我們可以將論域劃分為若干個(gè)子集,每個(gè)子集內(nèi)的元素相互等價(jià)。這種劃分是粗糙集理論進(jìn)行數(shù)據(jù)約簡(jiǎn)和特征提取的基礎(chǔ)。上近似與下近似:對(duì)于給定的論域和子集,粗糙集理論引入了上近似和下近似的概念。上近似表示可能屬于某個(gè)子集的元素集合,而下近似則表示確定屬于某個(gè)子集的元素集合。通過(guò)上近似和下近似的運(yùn)算,我們可以進(jìn)一步揭示數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和特征。粗糙度與精度:為了衡量一個(gè)子集的粗糙程度,粗糙集理論引入了粗糙度和精度的概念。粗糙度用于描述一個(gè)子集的不確定性程度,而精度則用于描述一個(gè)子集的確定性程度。這兩個(gè)指標(biāo)為我們提供了評(píng)價(jià)數(shù)據(jù)約簡(jiǎn)效果的重要依據(jù)。知識(shí)約簡(jiǎn):知識(shí)約簡(jiǎn)是粗糙集理論的核心任務(wù)之一。通過(guò)刪除冗余屬性和冗余數(shù)據(jù),我們可以實(shí)現(xiàn)對(duì)知識(shí)的有效約簡(jiǎn),從而提高數(shù)據(jù)處理的效率和質(zhì)量。知識(shí)約簡(jiǎn)的方法主要包括屬性約簡(jiǎn)和值約簡(jiǎn)兩種。擴(kuò)展模型:為了克服傳統(tǒng)粗糙集理論在處理連續(xù)屬性和噪聲數(shù)據(jù)時(shí)的局限性,研究者們提出了多種粗糙集的擴(kuò)展模型。這些模型包括基于模糊集的粗糙集模型、基于概率的粗糙集模型、基于變精度的粗糙集模型等。這些擴(kuò)展模型為處理更復(fù)雜的數(shù)據(jù)提供了有力的工具。粗糙集理論作為一種新型的數(shù)學(xué)工具,為我們提供了一種全新的視角來(lái)處理和分析數(shù)據(jù)。通過(guò)深入研究粗糙集的基本理論和方法,我們可以更好地理解和利用數(shù)據(jù)的內(nèi)在規(guī)律和特征,為數(shù)據(jù)挖掘、模式識(shí)別等領(lǐng)域的發(fā)展提供有力的支持。三、基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法數(shù)據(jù)約簡(jiǎn)是粗糙集理論中的一個(gè)重要組成部分,其主要目的是在保持原始數(shù)據(jù)分類(lèi)能力的前提下,通過(guò)刪除冗余或不相關(guān)信息,簡(jiǎn)化決策系統(tǒng)。基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法主要包括屬性約簡(jiǎn)和屬性值約簡(jiǎn)兩個(gè)層次。屬性約簡(jiǎn)是粗糙集中最核心的概念之一。它指的是從決策系統(tǒng)的屬性集合中找出一個(gè)最小屬性子集,這個(gè)子集能夠保持決策系統(tǒng)的分類(lèi)能力。換句話(huà)說(shuō),通過(guò)屬性約簡(jiǎn),我們可以找到一個(gè)較小的屬性集合,它能夠代表原始數(shù)據(jù)中的所有重要信息,同時(shí)去除不必要或冗余的信息。(1)基于可辨識(shí)矩陣的方法:可辨識(shí)矩陣是一種用于表示決策表中對(duì)象之間區(qū)分關(guān)系的矩陣。通過(guò)分析可辨識(shí)矩陣,可以找到?jīng)Q策表中最重要的屬性,進(jìn)而實(shí)現(xiàn)屬性約簡(jiǎn)。(2)基于信息熵的方法:信息熵是衡量信息不確定性的一個(gè)重要指標(biāo)。通過(guò)計(jì)算屬性的信息熵,可以評(píng)估每個(gè)屬性的重要性,從而實(shí)現(xiàn)屬性約簡(jiǎn)。(3)基于粗糙集的啟發(fā)式算法:?jiǎn)l(fā)式算法是一種基于特定啟發(fā)規(guī)則的搜索算法。在粗糙集的背景下,啟發(fā)式算法通過(guò)迭代地選擇最重要的屬性,逐步構(gòu)建屬性約簡(jiǎn)。屬性值約簡(jiǎn)是在屬性約簡(jiǎn)的基礎(chǔ)上,進(jìn)一步對(duì)屬性的取值進(jìn)行簡(jiǎn)化。其主要目的是去除屬性值中的冗余或不相關(guān)信息,從而提高決策系統(tǒng)的效率和可解釋性。(1)基于等價(jià)類(lèi)的約簡(jiǎn):等價(jià)類(lèi)是粗糙集理論中的一個(gè)基本概念,它指的是在決策系統(tǒng)中,由具有相同決策標(biāo)簽的對(duì)象組成的集合。通過(guò)分析等價(jià)類(lèi),可以找到屬性值的最小表示,實(shí)現(xiàn)屬性值約簡(jiǎn)。(2)基于邏輯推理的方法:邏輯推理是一種基于邏輯規(guī)則的推理方法。在粗糙集的背景下,邏輯推理通過(guò)構(gòu)建邏輯表達(dá)式,對(duì)屬性值進(jìn)行約簡(jiǎn)。(3)基于粗糙集的屬性值約簡(jiǎn)算法:粗糙集的屬性值約簡(jiǎn)算法通過(guò)分析決策表中的屬性值,找出能夠保持決策系統(tǒng)分類(lèi)能力的最小屬性值集合??偨Y(jié)來(lái)說(shuō),基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法是一種有效的數(shù)據(jù)預(yù)處理技術(shù),它可以幫助我們?nèi)コ哂嗷虿幌嚓P(guān)信息,提高決策系統(tǒng)的效率和可解釋性。在實(shí)際應(yīng)用中,可以根據(jù)具體問(wèn)題的需求,選擇合適的約簡(jiǎn)方法,以實(shí)現(xiàn)數(shù)據(jù)的有效處理。四、粗糙集擴(kuò)展模型在粗糙集理論中,擴(kuò)展模型是對(duì)該理論進(jìn)行進(jìn)一步發(fā)展和完善的重要手段。通過(guò)擴(kuò)展模型,我們可以更好地處理不確定性和不完整性問(wèn)題,提高數(shù)據(jù)處理的能力和效率。粗糙集擴(kuò)展模型主要包括以下幾個(gè)方面:屬性約簡(jiǎn)的深入研究:傳統(tǒng)的粗糙集模型主要關(guān)注于屬性的約簡(jiǎn),即在保持?jǐn)?shù)據(jù)分類(lèi)能力的前提下,減少?zèng)Q策系統(tǒng)中的屬性數(shù)量。在擴(kuò)展模型中,我們進(jìn)一步研究屬性之間的依賴(lài)關(guān)系和屬性的冗余性,以實(shí)現(xiàn)更為精確和有效的屬性約簡(jiǎn)。不確定性和不完整性的處理:在現(xiàn)實(shí)世界的數(shù)據(jù)中,往往存在不確定性和不完整性。粗糙集擴(kuò)展模型通過(guò)引入概率粗糙集、模糊粗糙集等概念,來(lái)處理這些不確定性因素,使得模型能夠適應(yīng)更加復(fù)雜的數(shù)據(jù)環(huán)境。變精度粗糙集模型:在某些情況下,數(shù)據(jù)的分類(lèi)邊界并不是非常清晰,這就需要一種能夠根據(jù)精度要求動(dòng)態(tài)調(diào)整的模型。變精度粗糙集模型通過(guò)調(diào)整邊界的容忍度,來(lái)適應(yīng)不同程度的分類(lèi)模糊性。多尺度粗糙集模型:為了更好地捕捉數(shù)據(jù)的層次結(jié)構(gòu)和局部特征,多尺度粗糙集模型在不同的粒度級(jí)別上分析數(shù)據(jù),從而提供更為豐富的數(shù)據(jù)表示和更細(xì)致的決策支持?;诟采w的粗糙集模型:在某些應(yīng)用場(chǎng)景中,數(shù)據(jù)可能以覆蓋的形式存在,例如在機(jī)器學(xué)習(xí)中的集成方法?;诟采w的粗糙集模型通過(guò)分析覆蓋的重疊和互補(bǔ)性,來(lái)提高數(shù)據(jù)挖掘和分類(lèi)的性能。通過(guò)這些擴(kuò)展模型的研究和應(yīng)用,粗糙集理論在數(shù)據(jù)挖掘、模式識(shí)別、決策支持等領(lǐng)域得到了更廣泛的應(yīng)用。未來(lái)的研究將進(jìn)一步探索粗糙集理論的深層次結(jié)構(gòu)和潛在應(yīng)用,以推動(dòng)該領(lǐng)域的持續(xù)發(fā)展。五、基于粗糙集擴(kuò)展模型的數(shù)據(jù)約簡(jiǎn)方法粗糙集理論是一種用來(lái)處理不確定性和不完備性信息的數(shù)學(xué)工具。它通過(guò)上近似和下近似來(lái)近似地描述一個(gè)集合,從而在保持?jǐn)?shù)據(jù)核心信息的同時(shí),對(duì)數(shù)據(jù)進(jìn)行約簡(jiǎn)。數(shù)據(jù)約簡(jiǎn)旨在減少數(shù)據(jù)的規(guī)模,同時(shí)保留對(duì)問(wèn)題求解至關(guān)重要的信息。這有助于提高數(shù)據(jù)處理的效率和準(zhǔn)確性,尤其是在處理大規(guī)模數(shù)據(jù)集時(shí)。粗糙集擴(kuò)展模型是對(duì)傳統(tǒng)粗糙集理論的改進(jìn)和擴(kuò)展。它通過(guò)引入新的理論概念和算法,使得粗糙集能夠更好地處理復(fù)雜數(shù)據(jù)集和現(xiàn)實(shí)世界問(wèn)題。屬性約簡(jiǎn):通過(guò)分析屬性之間的依賴(lài)關(guān)系,移除不重要或冗余的屬性。規(guī)則約簡(jiǎn):利用粗糙集理論生成決策規(guī)則,并通過(guò)約簡(jiǎn)算法減少規(guī)則的數(shù)量,同時(shí)保持規(guī)則的決策能力。核約簡(jiǎn):確定數(shù)據(jù)的核心屬性,構(gòu)建最核心的數(shù)據(jù)表示,即核。核是數(shù)據(jù)中最重要的部分,它包含了進(jìn)行決策所需的最小信息。基于粗糙集擴(kuò)展模型的數(shù)據(jù)約簡(jiǎn)方法在許多領(lǐng)域都有應(yīng)用,例如模式識(shí)別、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等。通過(guò)這種方法,可以在不損失決策能力的前提下,有效減少數(shù)據(jù)的復(fù)雜性和處理成本。六、實(shí)驗(yàn)驗(yàn)證與結(jié)果分析為了驗(yàn)證本文提出的基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法及其擴(kuò)展模型的有效性,我們?cè)O(shè)計(jì)了一系列實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了詳細(xì)的分析。我們選用了幾個(gè)公開(kāi)的、具有不同特征數(shù)量和樣本數(shù)量的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),包括Iris數(shù)據(jù)集、Wine數(shù)據(jù)集和BreastCancerWisconsin(Diagnostic)數(shù)據(jù)集。這些數(shù)據(jù)集涵蓋了不同的領(lǐng)域,具有一定的代表性。在實(shí)驗(yàn)中,我們將提出的基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法應(yīng)用于這些數(shù)據(jù)集,并與傳統(tǒng)的數(shù)據(jù)約簡(jiǎn)方法進(jìn)行比較。同時(shí),我們還對(duì)提出的粗糙集擴(kuò)展模型進(jìn)行了驗(yàn)證,以評(píng)估其在實(shí)際應(yīng)用中的性能。(1)基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法在各個(gè)數(shù)據(jù)集上都取得了較好的約簡(jiǎn)效果。與傳統(tǒng)的數(shù)據(jù)約簡(jiǎn)方法相比,該方法在保持分類(lèi)性能的同時(shí),顯著降低了特征數(shù)量,從而提高了數(shù)據(jù)處理的效率。這一結(jié)果表明,粗糙集理論在數(shù)據(jù)約簡(jiǎn)方面具有較大的潛力。(2)提出的粗糙集擴(kuò)展模型在實(shí)驗(yàn)中表現(xiàn)出了良好的分類(lèi)性能。與基準(zhǔn)模型相比,該模型在準(zhǔn)確率、召回率和F1得分等評(píng)價(jià)指標(biāo)上均有所提升。這一結(jié)果表明,通過(guò)引入粗糙集理論,我們可以有效地改進(jìn)分類(lèi)模型的性能,提高分類(lèi)結(jié)果的魯棒性。(3)通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的分析,我們還發(fā)現(xiàn),基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法和擴(kuò)展模型在處理高維數(shù)據(jù)和不平衡數(shù)據(jù)方面具有較好的表現(xiàn)。這進(jìn)一步驗(yàn)證了本文方法的有效性和實(shí)用性。通過(guò)實(shí)驗(yàn)結(jié)果的分析,我們驗(yàn)證了基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法及其擴(kuò)展模型的有效性。這些方法不僅可以提高數(shù)據(jù)處理的效率,還可以改進(jìn)分類(lèi)模型的性能,為實(shí)際應(yīng)用中的數(shù)據(jù)分析和挖掘提供了有力的支持。七、結(jié)論與展望本文對(duì)基于粗糙集的數(shù)據(jù)約簡(jiǎn)方法及其擴(kuò)展模型進(jìn)行了深入研究。我們回顧了粗糙集理論的基本概念,并詳細(xì)討論了數(shù)據(jù)約簡(jiǎn)在特征選擇和知識(shí)發(fā)現(xiàn)中的重要性。通過(guò)對(duì)經(jīng)典粗糙集算法的分析,我們揭示了其在處理大規(guī)模、高維度數(shù)據(jù)時(shí)的局限性。在此基礎(chǔ)上,本文重點(diǎn)研究了粗糙集的幾種擴(kuò)展模型。這些模型包括基于信息熵的粗糙集擴(kuò)展、基于模糊集的粗糙集擴(kuò)展,以及基于粒度計(jì)算的粗糙集擴(kuò)展。通過(guò)實(shí)例分析和仿真實(shí)驗(yàn),我們發(fā)現(xiàn)這些擴(kuò)展模型在處理不完整和不確定數(shù)據(jù)方面展現(xiàn)出顯著的優(yōu)越性。特別是,基于信息熵的粗糙集擴(kuò)展在保持分類(lèi)準(zhǔn)確性的同時(shí),有效減少了計(jì)算復(fù)雜度。盡管粗糙集及其擴(kuò)展模型在數(shù)據(jù)分析和處理中取得了顯著成效,但仍存在一些挑戰(zhàn)和未來(lái)的研究方向。當(dāng)前模型在處理動(dòng)態(tài)變化數(shù)據(jù)集時(shí)的適應(yīng)性仍需提高。未來(lái)的研究可以探索更加靈活的模型,以適應(yīng)數(shù)據(jù)的動(dòng)態(tài)變化。粗糙集與其他機(jī)器學(xué)習(xí)方法的結(jié)合也是一個(gè)重要的研究方向。例如,結(jié)合深度學(xué)習(xí)技術(shù),可以進(jìn)一步提高模型的預(yù)測(cè)能力和泛化能力。粗糙集理論在實(shí)際應(yīng)用中的可解釋性也是一個(gè)值得關(guān)注的問(wèn)題。未來(lái)的研究可以在保證模型性能的同時(shí),提高其可解釋性,使其在諸如醫(yī)療診斷、金融分析等領(lǐng)域得到更廣泛的應(yīng)用。粗糙集理論及其擴(kuò)展模型為數(shù)據(jù)分析和處理提供了有力的工具。通過(guò)不斷的模型優(yōu)化和應(yīng)用探索,粗糙集理論有望在更多領(lǐng)域發(fā)揮其獨(dú)特的優(yōu)勢(shì)。參考資料:隨著大數(shù)據(jù)時(shí)代的來(lái)臨,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為處理海量數(shù)據(jù)、提取有用信息的重要手段?;诖植诩臄?shù)據(jù)挖掘算法以其獨(dú)特的優(yōu)勢(shì),在數(shù)據(jù)挖掘領(lǐng)域中占據(jù)了重要的地位。粗糙集理論是一種處理不確定、不精確知識(shí)的數(shù)學(xué)工具,其基本思想是通過(guò)上下近似集的方式對(duì)數(shù)據(jù)進(jìn)行分類(lèi)和概括,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)律。在數(shù)據(jù)挖掘中,粗糙集算法可以用于特征選擇、分類(lèi)、聚類(lèi)等多個(gè)方面,具有很強(qiáng)的實(shí)用價(jià)值。特征選擇是數(shù)據(jù)挖掘的重要步驟,能夠有效地降低數(shù)據(jù)維度,提取關(guān)鍵特征,提高分類(lèi)器的性能?;诖植诩奶卣鬟x擇算法利用粗糙集的上近似和下近似屬性,評(píng)估每個(gè)屬性的重要性,從而選擇出對(duì)分類(lèi)貢獻(xiàn)最大的特征。這種算法能夠處理高維數(shù)據(jù),有效地去除冗余特征,提高分類(lèi)精度。分類(lèi)是數(shù)據(jù)挖掘的主要任務(wù)之一,而基于粗糙集的分類(lèi)算法利用粗糙集理論對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。該算法首先利用粗糙集的上下近似集對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后根據(jù)預(yù)處理后的數(shù)據(jù)構(gòu)建分類(lèi)器。與傳統(tǒng)的分類(lèi)算法相比,基于粗糙集的分類(lèi)算法能夠更好地處理不確定、不精確的數(shù)據(jù),提高分類(lèi)的準(zhǔn)確性和穩(wěn)定性。聚類(lèi)是將數(shù)據(jù)按照某種相似性度量分成若干個(gè)組的過(guò)程,聚類(lèi)結(jié)果要求同一組內(nèi)的數(shù)據(jù)盡可能相似,不同組的數(shù)據(jù)盡可能不同。基于粗糙集的聚類(lèi)算法利用粗糙集的上近似和下近似屬性,定義了數(shù)據(jù)的相似性和差異性度量,從而實(shí)現(xiàn)了數(shù)據(jù)的聚類(lèi)。該算法能夠處理復(fù)雜的、非線(xiàn)性的數(shù)據(jù)分布,發(fā)現(xiàn)任意形狀的聚類(lèi)結(jié)果??偨Y(jié)起來(lái),基于粗糙集的數(shù)據(jù)挖掘算法在特征選擇、分類(lèi)和聚類(lèi)等方面都表現(xiàn)出了良好的性能。隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,基于粗糙集的數(shù)據(jù)挖掘算法將會(huì)得到更廣泛的應(yīng)用和發(fā)展。粗糙集理論,是繼概率論、模糊集、證據(jù)理論之后的又一個(gè)處理不確定性的數(shù)學(xué)工具。作為一種較新的軟計(jì)算方法,粗糙集近年來(lái)越來(lái)越受到重視,其有效性已在許多科學(xué)與工程領(lǐng)域的成功應(yīng)用中得到證實(shí),是當(dāng)前國(guó)際上人工智能理論及其應(yīng)用領(lǐng)域中的研究熱點(diǎn)之一。1982年,波蘭數(shù)學(xué)家Z.Pawlak發(fā)表了經(jīng)典論文RoughSets,意味著粗糙集理論的誕生。在自然科學(xué)、社會(huì)科學(xué)和工程技術(shù)的很多領(lǐng)域中,都不同程度地涉及到對(duì)不確定因素和對(duì)不完備信息的處理。從實(shí)際系統(tǒng)中采集到的數(shù)據(jù)常常包含著噪聲,不夠精確甚至不完整。采用純數(shù)學(xué)上的假設(shè)來(lái)消除或回避這種不確定性,效果往往不理想。反之,如果正視它對(duì)這些信息進(jìn)行合適地處理,常常有助于相關(guān)實(shí)際系統(tǒng)問(wèn)題的解決。多年來(lái),研究人員一直在努力尋找科學(xué)地處理不完整性和不確定性的有效途徑。模糊集和基于概率方法的證據(jù)理論是處理不確定信息的兩種方法,已應(yīng)用于一些實(shí)際領(lǐng)域。但這些方法有時(shí)需要一些數(shù)據(jù)的附加信息或先驗(yàn)知識(shí),如模糊隸屬函數(shù)、基本概率指派函數(shù)和有關(guān)統(tǒng)計(jì)概率分布等,而這些信息有時(shí)并不容易得到。1982年波蘭學(xué)者Z.Pawlak提出了粗糙集理論——它是一種刻畫(huà)不完整性和不確定性的數(shù)學(xué)工具,能有效地分析不精確,不一致(inconsistent)、不完整(incomplete)等各種不完備的信息,還可以對(duì)數(shù)據(jù)進(jìn)行分析和推理,從中發(fā)現(xiàn)隱含的知識(shí),揭示潛在的規(guī)律。粗糙集理論是建立在分類(lèi)機(jī)制的基礎(chǔ)上的,它將分類(lèi)理解為在特定空間上的等價(jià)關(guān)系,而等價(jià)關(guān)系構(gòu)成了對(duì)該空間的劃分。粗糙集理論將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,每一被劃分的集合稱(chēng)為概念。粗糙集理論的主要思想是利用已知的知識(shí)庫(kù),將不精確或不確定的知識(shí)用已知的知識(shí)庫(kù)中的知識(shí)來(lái)(近似)刻畫(huà)。該理論與其他處理不確定和不精確問(wèn)題理論的最顯著的區(qū)別是:它無(wú)需提供問(wèn)題所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)信息,所以對(duì)問(wèn)題的不確定性的描述或處理可以說(shuō)是比較客觀的,由于這個(gè)理論未能包含處理不精確或不確定原始數(shù)據(jù)的機(jī)制,所以這個(gè)理論與概率論、模糊數(shù)學(xué)和證據(jù)理論等其他處理不確定或不精確問(wèn)題的理論有很強(qiáng)的互補(bǔ)性.粗糙集是一種較有前途的處理不確定性的方法,相信今后將會(huì)在更多的領(lǐng)域中得到應(yīng)用.粗糙集理論還處在繼續(xù)發(fā)展之中,正如粗糙集理論的創(chuàng)立人Z.Pawlak所指出的那樣,尚有一些理論上的問(wèn)題需要解決,諸如用于不精確推理的粗糙邏輯(Roughlogic)方法,粗糙集理論與非標(biāo)準(zhǔn)分析(Nonstandardanalysis)和非參數(shù)化統(tǒng)計(jì)(Nonparametricstatistics)等之間的關(guān)系等等.將粗糙集與其它軟計(jì)算方法(如模糊集,人工神經(jīng)網(wǎng)絡(luò),遺傳算法等)相綜合,發(fā)揮出各自的優(yōu)點(diǎn),可望設(shè)計(jì)出具有較高的機(jī)器智商(MIQ)的混合智能系統(tǒng)(HybridIntelligentSystem),這是一個(gè)值得努力的方向.在20世紀(jì)70年代,波蘭學(xué)者Z.Pawlak和一些波蘭科學(xué)院,波蘭華沙大學(xué)的邏輯學(xué)家們,一起從事關(guān)于信息系統(tǒng)邏輯特性的研究。粗糙集理論就是在這些研究的基礎(chǔ)上產(chǎn)生的.1982年,Z.Pawlak發(fā)表了經(jīng)典論文RoughSets,宣告了粗糙集理論的誕生.此后,粗糙集理論引起了許多數(shù)學(xué)家,邏輯學(xué)家和計(jì)算機(jī)研究人員的興趣,他們?cè)诖植诩睦碚摵蛻?yīng)用方面作了大量的研究工作.1991年Z.Pawlak的專(zhuān)著和1992年應(yīng)用專(zhuān)集的出版,對(duì)這一段時(shí)期理論和實(shí)踐工作的成果作了較好的總結(jié),同時(shí)促進(jìn)了粗糙集在各個(gè)領(lǐng)域的應(yīng)用.此后召開(kāi)的與粗糙集有關(guān)的國(guó)際會(huì)議進(jìn)一步推動(dòng)了粗糙集的發(fā)展.越來(lái)越多的科技人員開(kāi)始了解并準(zhǔn)備從事該領(lǐng)域的研究.目前,粗糙集已成為人工智能領(lǐng)域中一個(gè)較新的學(xué)術(shù)熱點(diǎn),在機(jī)器學(xué)習(xí),知識(shí)獲取,決策分析,過(guò)程控制等許多領(lǐng)域得到了廣泛的應(yīng)用.“知識(shí)”這個(gè)概念在不同的范疇內(nèi)有多種不同的含義。在粗糙集理論中,“知識(shí)”被認(rèn)為是一種分類(lèi)能力。人們的行為是基于分辨現(xiàn)實(shí)的或抽象的對(duì)象的能力,如在遠(yuǎn)古時(shí)代,人們?yōu)榱松姹仨毮芊直娉鍪裁纯梢允秤茫裁床豢梢允秤?;醫(yī)生給病人診斷,必須辨別出患者得的是哪一種病。這些根據(jù)事物的特征差別將其分門(mén)別類(lèi)的能力均可以看作是某種“知識(shí)”。分類(lèi)過(guò)程中,相差不大的個(gè)體被歸于同一類(lèi),它們的關(guān)系就是不可分辨關(guān)系(indiscernibilityrelation).假定只用兩種黑白顏色把空間中的物體分割兩類(lèi),{黑色物體},{白色物體},那么同為黑色的兩個(gè)物體就是不可分辨的,因?yàn)槊枋鏊鼈兲卣鲗傩缘男畔⑾嗤际呛谏?如果再引入方,圓的屬性,又可以將物體進(jìn)一步分割為四類(lèi):{黑色方物體},{黑色圓物體},{白色方物體},{白色圓物體}.這時(shí),如果兩個(gè)同為黑色方物體,則它們還是不可分辨的.不可分辨關(guān)系是一種等效關(guān)系(equivalencerelationship),兩個(gè)白色圓物體間的不可分辨關(guān)系可以理解為它們?cè)诎?,圓兩種屬性下存在等效關(guān)系.基本集(elementaryset)定義為由論域中相互間不可分辨的對(duì)象組成的集合,是組成論域知識(shí)的顆粒.不可分辨關(guān)系這一概念在粗糙集理論中十分重要,它深刻地揭示出知識(shí)的顆粒狀結(jié)構(gòu),是定義其它概念的基礎(chǔ).知識(shí)可認(rèn)為是一族等效關(guān)系,它將論域分割成一系列的等效類(lèi)。粗糙集理論延拓了經(jīng)典的集合論,把用于分類(lèi)的知識(shí)嵌入集合內(nèi),作為集合組成的一部分.一個(gè)對(duì)象a是否屬于集合需根據(jù)現(xiàn)有的知識(shí)來(lái)判斷,可分為三種情況:集合的劃分密切依賴(lài)于我們所掌握的關(guān)于論域的知識(shí),是相對(duì)的而不是絕對(duì)的.給定一個(gè)有限的非空集合U稱(chēng)為論域,I為U中的一族等效關(guān)系,即關(guān)于U的知識(shí),則二元對(duì)K=(U,I)稱(chēng)為一個(gè)近似空間(approximationspace).設(shè)x為U中的一個(gè)對(duì)象,為U的一個(gè)子集,I(x)表示所有與x不可分辨的對(duì)象所組成的集合,換句話(huà)說(shuō),是由x決定的等效類(lèi),即I(x)中的每個(gè)對(duì)象都與x有相同的特征屬性(attribute)。下面用一個(gè)具體的實(shí)例說(shuō)明粗糙集的概念.在粗糙集中使用信息表(informationtable)描述論域中的數(shù)據(jù)集合.根據(jù)學(xué)科領(lǐng)域的不同,它們可能代表醫(yī)療,金融,軍事,過(guò)程控制等方面的數(shù)據(jù).信息表的形式和大家所熟悉的關(guān)系數(shù)據(jù)庫(kù)中的關(guān)系數(shù)據(jù)模型很相似,是一張二維表格,如下表所示:表格的數(shù)據(jù)描述了一些人的教育程度以及是否找到了較好工作,旨在說(shuō)明兩者之間的關(guān)系.其中王治,馬麗,趙凱等稱(chēng)為對(duì)象(objects),一行描述一個(gè)對(duì)象.表中的列描述對(duì)象的屬性.粗糙集理論中有兩種屬性:條件屬性(conditionattribute)和決策屬性(decisionattribute).本例中"教育程度"為條件屬性;"是否找到了好工作"為決策屬性。設(shè)O表示找到了好工作的人的集合,則O={馬麗,劉保,趙凱},設(shè)I表示屬性"教育程度"所構(gòu)成的一個(gè)等效關(guān)系,根據(jù)教育程度的不同,該論域被分割為四個(gè)等效類(lèi):{王治,馬麗},{李得},{劉保},{趙凱}.王治和馬麗在同一個(gè)等效類(lèi)中,他們都為高中文化程度,是不可分辨的.則:集合O的下逼近(即正區(qū))為I*(O)=POS(O)={劉保,趙凱}集合O的上逼近為I3(O)=POS(O)+BND(O)={劉保,趙凱,王治,馬麗}根據(jù)表1,可以歸納出下面幾條規(guī)則,揭示了教育程度與是否能找到好工作之間的關(guān)系.RULE1:IF(教育程度=大學(xué))OR(教育程度=博士)THEN(可以找到好工作)RULE2:IF(教育程度=小學(xué))THEN(找不到好工作)RULE3:IF(教育程度=高中)THEN(可能找到好工作)從這個(gè)簡(jiǎn)單的例子中,我們還可以體會(huì)到粗糙集理論在數(shù)據(jù)分析,尋找規(guī)律方面的作用.粗糙集方法的簡(jiǎn)單實(shí)用性是令人驚奇的,它能在創(chuàng)立后的不長(zhǎng)時(shí)間內(nèi)得到迅速應(yīng)用是因?yàn)榫哂幸韵绿攸c(diǎn):(1)它能處理各種數(shù)據(jù),包括不完整(incomplete)的數(shù)據(jù)以及擁有眾多變量的數(shù)據(jù);(2)它能處理數(shù)據(jù)的不精確性和模棱兩可(ambiguity),包括確定性和非確定性的情況;(3)它能求得知識(shí)的最小表達(dá)(reduct)和知識(shí)的各種不同顆粒(granularity)層次;(4)它能從數(shù)據(jù)中揭示出概念簡(jiǎn)單,易于操作的模式(pattern);(5)它能產(chǎn)生精確而又易于檢查和證實(shí)的規(guī)則,特別適于智能控制中規(guī)則的自動(dòng)生成。粗糙集理論是一門(mén)實(shí)用性很強(qiáng)的學(xué)科,從誕生到現(xiàn)在雖然只有十幾年的時(shí)間,但已經(jīng)在不少領(lǐng)域取得了豐碩的成果,如近似推理,數(shù)字邏輯分析和化簡(jiǎn),建立預(yù)測(cè)模型,決策支持,控制算法獲取,機(jī)器學(xué)習(xí)算法和模式識(shí)別等等。粗糙集能有效地處理下列問(wèn)題:人工神經(jīng)網(wǎng)絡(luò)具有并行處理,高度容錯(cuò)和泛化能力強(qiáng)的特點(diǎn),適合應(yīng)用在預(yù)測(cè),復(fù)雜對(duì)象建模和控制等場(chǎng)合.但是當(dāng)神經(jīng)網(wǎng)絡(luò)規(guī)模較大,樣本較多時(shí),訓(xùn)練時(shí)間過(guò)于漫長(zhǎng),這個(gè)固有缺點(diǎn)是制約神經(jīng)網(wǎng)絡(luò)進(jìn)一步實(shí)用化的一個(gè)主要因素.雖然各種提高訓(xùn)練速度的算法不斷出現(xiàn),問(wèn)題遠(yuǎn)未徹底解決。化簡(jiǎn)訓(xùn)練樣本集,消除冗余數(shù)據(jù)是另一條提高訓(xùn)練速度的途徑。實(shí)際系統(tǒng)中有很多復(fù)雜對(duì)象難于建立嚴(yán)格的數(shù)學(xué)模型,這樣傳統(tǒng)的基于數(shù)學(xué)模型的控制方法就難以奏效.模糊控制模擬人的模糊推理和決策過(guò)程,將操作人員的控制經(jīng)驗(yàn)總結(jié)為一系列語(yǔ)言控制規(guī)則,具有魯棒性和簡(jiǎn)單性的特點(diǎn),在工業(yè)控制等領(lǐng)域發(fā)展較快.但是有些復(fù)雜對(duì)象的控制規(guī)則難以人工提取,這樣就在一定程度上限制了模糊控制的應(yīng)用.粗糙集能夠自動(dòng)抽取控制規(guī)則的特點(diǎn)為解決這一難題提供了新的手段.一種新的控制策略—模糊-粗糙控制(fuzzy-roughcontrol)正悄然興起,成為一個(gè)有吸引力的發(fā)展方向.有學(xué)者應(yīng)用這種控制方法研究了"小車(chē)—倒立擺系統(tǒng)"這一經(jīng)典控制問(wèn)題和水泥窯爐的過(guò)程控制問(wèn)題,均取得了較好的控制效果.應(yīng)用粗糙集進(jìn)行控制的基本思路是:把控制過(guò)程的一些有代表性的狀態(tài)以及操作人員在這些狀態(tài)下所采取的控制策略都記錄下來(lái),然后利用粗糙集理論處理這些數(shù)據(jù),分析操作人員在何種條件下采取何種控制策略,總結(jié)出一系列控制規(guī)則:規(guī)則1IFCondition1滿(mǎn)足THEN采取decision1規(guī)則2IFCondition2滿(mǎn)足THEN采取decision2規(guī)則3IFCondition3滿(mǎn)足THEN采取decision3這種根據(jù)觀測(cè)數(shù)據(jù)獲得控制策略的方法通常被稱(chēng)為從范例中學(xué)習(xí)(learningfromexamples).粗糙控制(roughcontrol)與模糊控制都是基于知識(shí),基于規(guī)則的控制,但粗糙控制更加簡(jiǎn)單迅速,實(shí)現(xiàn)容易(因?yàn)榇植诳刂朴袝r(shí)可省卻模糊化及去模糊化步驟);另一個(gè)優(yōu)點(diǎn)在于控制算法可以完全來(lái)自數(shù)據(jù)本身,所以從軟件工程的角度看,其決策和推理過(guò)程與模糊(或神經(jīng)網(wǎng)絡(luò))控制相比可以很容易被檢驗(yàn)和證實(shí)(validate).有研究指出在特別要求控制器結(jié)構(gòu)與算法簡(jiǎn)單的場(chǎng)合,更適合采取粗糙控制。面對(duì)大量的信息以及各種不確定因素,要作出科學(xué),合理的決策是非常困難的.決策支持系統(tǒng)是一組協(xié)助制定決策的工具,其重要特征就是能夠執(zhí)行IFTHEN規(guī)則進(jìn)行判斷分析.粗糙集理論可以在分析以往大量經(jīng)驗(yàn)數(shù)據(jù)的基礎(chǔ)上找到這些規(guī)則,基于粗糙集的決策支持系統(tǒng)在這方面彌補(bǔ)了常規(guī)決策方法的不足,允許決策對(duì)象中存在一些不太明確,不太完整的屬性,并經(jīng)過(guò)推理得出基本上肯定的結(jié)論。下面舉一個(gè)例子,說(shuō)明粗糙集理論可以根據(jù)以往的病例歸納出診斷規(guī)則,幫助醫(yī)生作出判斷。下表描述了八個(gè)病人的癥狀.從下表中可以歸納出以下幾條確定的規(guī)則:病人5和病人7,病人6和病人8,癥狀相同,但是一個(gè)感冒另一個(gè)卻沒(méi)感冒,這種情況稱(chēng)為不一致(inconsistent).粗糙集就是靠這種IFTHEN規(guī)則的形式表示數(shù)據(jù)中蘊(yùn)含的知識(shí).希臘工業(yè)發(fā)展銀行ETEVA用粗糙集理論協(xié)助制訂信貸政策,從大量實(shí)例中抽取出的規(guī)則條理清晰,得到了金融專(zhuān)家的好評(píng).現(xiàn)代社會(huì)中,隨著信息產(chǎn)業(yè)的迅速發(fā)展,大量來(lái)自金融,醫(yī)療,科研等不同領(lǐng)域的信息被存儲(chǔ)在數(shù)據(jù)庫(kù)中.這些浩如煙海的數(shù)據(jù)間隱含著許多有價(jià)值的但鮮為人知的相關(guān)性,例如股票的價(jià)格和一些經(jīng)濟(jì)指數(shù)有什么關(guān)系;手術(shù)前病人的病理指標(biāo)可能與手術(shù)是否成功存在某種聯(lián)系;滿(mǎn)足何種條件的夜空會(huì)出現(xiàn)彗星等天文現(xiàn)象等等.由于數(shù)據(jù)庫(kù)的龐大,人工處理這些數(shù)據(jù)幾乎是不可能的,于是出現(xiàn)了一個(gè)新的研究方向—數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabases,KDD),也叫做數(shù)據(jù)庫(kù)(信息)發(fā)掘(Mining),它是目前國(guó)際上人工智能領(lǐng)域中研究較為活躍的分支.粗糙集是其中的一種重要的研究方法,它采用的信息表與關(guān)系數(shù)據(jù)庫(kù)中的關(guān)系數(shù)據(jù)模型很相似,這樣就便于將基于粗糙集的算法嵌入數(shù)據(jù)庫(kù)管理系統(tǒng)中.粗糙集引入核(core),化簡(jiǎn)(reduct)等有力的概念與方法,從數(shù)據(jù)中導(dǎo)出用IFTHEN規(guī)則形式描述的知識(shí),這些精練的知識(shí)更便于存儲(chǔ)和使用。相繼召開(kāi)的以粗糙集理論為主題的國(guó)際會(huì)議,促進(jìn)了粗糙集理論的推廣.這些會(huì)議發(fā)表了大量的具有一定學(xué)術(shù)和應(yīng)用價(jià)值的論文,方便了學(xué)術(shù)交流,推動(dòng)了粗糙集在各個(gè)科學(xué)領(lǐng)域的拓展和應(yīng)用.下面列出了近年召開(kāi)的一些會(huì)議:1992年第一屆國(guó)際研討會(huì)(RoughSets:StateoftheArtandPerspectives)在波蘭Kiekrz召開(kāi);1993年第二屆國(guó)際研討會(huì)(TheSecondInternationalWorkshoponRoughSetsandKnowledgeDiscovery,RSKD'93)在加拿大Banff召開(kāi);1994年第三屆國(guó)際研討會(huì)(TheThirdInternationalWorkshoponRoughSetsandSoftComputing,RSSC'94)在美國(guó)SanJose召開(kāi);1995年在美國(guó)NorthCarolina召開(kāi)了題為"RoughSetTheory,RST'95"的國(guó)際會(huì)議;1996年第四屆國(guó)際研討會(huì)(TheFourthInternationalWorkshoponRoughSets,FuzzySets,andMachineDiscovery,RSFD'96)在日本東京召開(kāi);1997年3月在美國(guó)NorthCarolina召開(kāi)了第五屆國(guó)際研討會(huì)(TheFifthInternationalWorkshoponRoughSetsandSoftComputing,RSSC'97)。目前,國(guó)際上研究粗糙集的機(jī)構(gòu)和個(gè)人開(kāi)發(fā)了一些應(yīng)用粗糙集的實(shí)用化軟件,也出現(xiàn)了商業(yè)化的軟件.加拿大ReductSystemInc.公司開(kāi)發(fā)的用于數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)的軟件DataLogicR是用C語(yǔ)言開(kāi)發(fā)的,可安裝在個(gè)人計(jì)算機(jī)上,為科研領(lǐng)域和工業(yè)界服務(wù).美國(guó)肯薩斯大學(xué)開(kāi)發(fā)了一套基于粗糙集的經(jīng)驗(yàn)學(xué)習(xí)系統(tǒng),名為L(zhǎng)ERS(LearningfromExamplesbasedonRoughSets),它能從大量經(jīng)驗(yàn)數(shù)據(jù)中抽取出規(guī)則.LERS已被美國(guó)國(guó)家航空航天管理局(NASA)的約翰遜(Johnson)空間中心采用,作為專(zhuān)家系統(tǒng)開(kāi)發(fā)工具,為"自由號(hào)"(Freedom)空間站上的醫(yī)療決策服務(wù).美國(guó)環(huán)境保護(hù)署(USEnvironmentalProtectionAgency)資助的一個(gè)項(xiàng)目中也采用了LERS.波蘭波茲南工業(yè)大學(xué)(PoznanUniversityofTechnology)開(kāi)發(fā)的軟件RoughDAS和加拿大Regina大學(xué)開(kāi)發(fā)的KDD-R是用C編寫(xiě)的,在UNⅨ環(huán)境下運(yùn)行,KDD-R基于變精度粗糙集模型(VariablePrecisionRoughSet,VPRS),通過(guò)改變粗糙程度而使數(shù)據(jù)中隱含的模式更清楚的顯示出來(lái).粗糙集和粗糙函數(shù)模型是處理不確定性和模糊性的重要工具,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自動(dòng)控制等領(lǐng)域具有廣泛的應(yīng)用前景。本文將介紹粗糙集和粗糙函數(shù)模型的基本概念、特點(diǎn)、應(yīng)用現(xiàn)狀,以及建立模型的方法。同時(shí),將闡述這些模型在各個(gè)領(lǐng)域的應(yīng)用場(chǎng)景,并總結(jié)研究現(xiàn)狀和未來(lái)研究方向。粗糙集(RoughSet)是由波蘭數(shù)學(xué)家ZdzislawPawlak在1982年提出的一種處理不確定性的數(shù)學(xué)方法。粗糙集理論通過(guò)對(duì)數(shù)據(jù)的屬性進(jìn)行分類(lèi),將數(shù)據(jù)集合劃分為不同的近似子集,從而實(shí)現(xiàn)對(duì)不確定性的處理。粗糙函數(shù)模型是粗糙集理論在函數(shù)逼近中的應(yīng)用,通過(guò)建立粗糙函數(shù)來(lái)描述輸入數(shù)據(jù)與輸出結(jié)果之間的關(guān)系,具有處理不確定性和模糊性的能力。粗糙集和粗糙函數(shù)模型在處理不確定性和模糊性方面具有一定的優(yōu)勢(shì),但目前仍存在一些問(wèn)題和亟須解決的難點(diǎn)。粗糙集的近似精度和計(jì)算效率需要進(jìn)一步提高,以滿(mǎn)足實(shí)際應(yīng)用的需求。粗糙函數(shù)模型的建立和優(yōu)化需要更加魯棒和有效的算法和工具,以處理大規(guī)模數(shù)據(jù)集和復(fù)雜問(wèn)題。粗糙集和粗糙函數(shù)模型在處理連續(xù)數(shù)據(jù)和時(shí)序數(shù)據(jù)方面還有待深入研究。數(shù)據(jù)采集:收集相關(guān)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和清洗,以消除噪聲和異常值。屬性約簡(jiǎn):利用粗糙集的屬性約簡(jiǎn)算法,對(duì)數(shù)據(jù)的屬性進(jìn)行約簡(jiǎn),得到最小的屬性集,以實(shí)現(xiàn)對(duì)數(shù)據(jù)的簡(jiǎn)化。近似集構(gòu)造:根據(jù)屬性約簡(jiǎn)的結(jié)果,建立粗糙集的近似集,將數(shù)據(jù)集合劃分為不同的近似子集。粗糙函數(shù)訓(xùn)練:利用訓(xùn)練數(shù)據(jù),訓(xùn)練粗糙函數(shù)模型,得到輸入與輸出之間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論