基于連續(xù)型條件屬性的模糊規(guī)則約簡算法
摘 要:針對(duì)粗糙集對(duì)于連續(xù)域?qū)傩詻Q策表的處理能力差與不容易獲得模糊集之間關(guān)系等問題,提出一種將模糊集與粗糙集結(jié)合起來的連續(xù)型條件屬性模糊規(guī)則約簡算法。該算法首先引入三角從屬度函數(shù)將連續(xù)屬性值轉(zhuǎn)換為模糊值,并運(yùn)用離散模糊神經(jīng)網(wǎng)絡(luò)方法獲得數(shù)據(jù)集之間關(guān)系。實(shí)例驗(yàn)證表明,采用該算法,用戶可以根據(jù)實(shí)際決策需求和領(lǐng)域知識(shí)更改閾值,從而獲得滿意的模糊規(guī)則結(jié)果。
關(guān)鍵詞:條件屬性;連續(xù)型;隸屬度函數(shù);模糊規(guī)則
Attribute reduction algorithms of fuzzy rules based on?continuous domain condition attributes
CUI Meng-tian?1,ZHU Hao-dong?2,ZHONG Yong?2?(1.School of Computer Science & Technology, Southwest University for Nationalities, Chengdu 610041, China;2.Chengdu Institute of ?Computer Applications, Chinese Academy of Sciences, Chengdu610041, China)
Abstract:To solve the problems of low adaptability for continuous domain reduction and the disadvantage of failing to obtain eventual relationship among the fuzzy sets,this paper proposed a new method of attribute reduction algorithms of decision table based on combining fuzzy set with rough set. First,transformed continuous attribute value into fuzzy value with triangular membership function,then provided algorithms of hard C-means(HCM) clustering to obtain relationship among the fuzzy sets.In the end,simulation results show the effectiveness of the proposed method through an illustrative example.
Key words:condition attributes; continuous; membership function; fuzzy rules
0 引言
粗糙集理論[1]是一種研究不精確、不確定性知識(shí)的數(shù)學(xué)工具,其主要思想和優(yōu)點(diǎn)就是在保持分類能力不變的前提下,能夠通過知識(shí)約簡導(dǎo)出問題的決策或分類規(guī)則。屬性約簡就是該理論中一個(gè)非常重要的概念,它反映了一個(gè)決策表的本質(zhì)信息,現(xiàn)已得到廣泛的應(yīng)用[2]。
在實(shí)際情況中,大多數(shù)數(shù)據(jù)集的屬性值是連續(xù)型的。這些連續(xù)型數(shù)據(jù)大多具有較強(qiáng)的模糊性,概念之間的界限并不十分明確。由于傳統(tǒng)粗糙集理論十分適合處理離散域?qū)傩詻Q策表,對(duì)于連續(xù)域?qū)傩詻Q策表的處理能力非常有限,這就大大限制了它的應(yīng)用。如果把粗糙集理論應(yīng)用于連續(xù)性屬性,那么在使用該理論之前就必須對(duì)連續(xù)屬性進(jìn)行離散化。然而,離散化后的屬性值沒有保留屬性值在實(shí)數(shù)值上存在的差異,這將導(dǎo)致某種程度的信息損失。所以,粗糙集理論需要與其他能夠處理不精確或不確定問題的理論結(jié)合起來,以擴(kuò)展其應(yīng)用范圍。
模糊集理論也是一種用于在建模中針對(duì)一些實(shí)驗(yàn)數(shù)據(jù)中不確定性和模糊性問題的有力工具。其優(yōu)點(diǎn)在于:模糊集理論提供了系統(tǒng)的、以語言表示這類信息的計(jì)算工具,通過使用由隸屬函數(shù)表示的語言變量,它還可以進(jìn)行數(shù)值計(jì)算。合理選擇模糊規(guī)則是模糊推理系統(tǒng)的關(guān)鍵因素,它可以有效地對(duì)特定應(yīng)用領(lǐng)域中的人類專門知識(shí)進(jìn)行建模。Pawlak指出粗糙集理論和模糊集理論不是互相排斥的,而是可以相互補(bǔ)充的[3];Dubois等人[4]又進(jìn)一步指出它們是處理不確定知識(shí)的兩種數(shù)學(xué)方法,是具有互補(bǔ)性質(zhì)的。為此,本文提出了一種將粗糙集和模糊集結(jié)合起來的連續(xù)型條件屬性的模糊規(guī)則約簡算法。
1 相關(guān)定義
為了較好地描述本文算法,先給出下面的一些定義作?鋪墊。
定義1 連續(xù)域決策表S=〈U,C,D,V,f〉。其中:U是非空有限對(duì)象集合U={u?1,u?2,…,u?n};C={c?1,c?2,…,c?m}是條件屬性集合,每個(gè)屬性都是連續(xù)型屬性;D=7x8ya214v是決策屬性。
對(duì)于?c?j∈C(j=1,2,…,m),都可以使用隸屬度函數(shù)將它的連續(xù)型屬性值轉(zhuǎn)換為模糊值。用I?j?k表示連續(xù)屬性c?j的第k個(gè)模糊區(qū)間,m?j表示c?j的模糊區(qū)間個(gè)數(shù),μ?kij表示對(duì)象u?i(i=1,2,…,n)在模糊區(qū)間I?j?k的隸屬度,vij表示u?i在c?j的屬性值,則vij可表示如下:
vij=μ?1ij/I?j?1+μ?2ij/I?j?2+…+μ??m??j?ij/I??m??j??j(1)
定義2 對(duì)于連續(xù)域決策表S=〈U,C,D,V,f〉,對(duì)象u?i和u?s在連續(xù)型屬性c?j的相似度定義如下:
μc??j(u?i,u?s)=1-1m?j?m?jt=1|μ?tij-μ?1sj|(2)
定義3 對(duì)于連續(xù)域決策表S=〈U,C,D,V,f〉,對(duì)象u?i在連續(xù)型屬性c?j上的相似類可以定義如下:
sim?βc??j(u?i)={u?t|μc??j(u?i,u?t)≥β,t=1,2,…,n}(3)
其中:β為所給的相似度閾值。
定義4 對(duì)于連續(xù)域決策表S=〈U,C,D,V,f〉,連續(xù)型屬性c?j在U上劃分所形成的相似類集組成的向量定義如下:
simClassVector(c?j)=(sim?βc??j (u?i)|i=1,2,…,n)(4)
2 數(shù)字特征向量及其相似矩陣
在決策表中,每個(gè)屬性可以找到一個(gè)表示其特性的向量,這個(gè)向量可以稱為屬性的`數(shù)字特征向量。
定義5 對(duì)于連續(xù)域決策表S=〈U,C,D,V,f〉,假設(shè)連續(xù)型屬性c?i在U上劃分所形成的相似類集組成的向量定義為simClassVector(c?j)=(sim?βc??j (u?i)|i=1,2,…,n),則連續(xù)屬性c?i的數(shù)字特征向量可定義為
DCV(c?i)=(λit|λit=card(sim?βc??i(u?t)),t=1,2,…,n)(5)
模糊集理論的基礎(chǔ)是模糊關(guān)系,最簡單的表現(xiàn)方法就是相似關(guān)系。相似關(guān)系是指滿足自反性和對(duì)稱性的二元模糊關(guān)系。眾多相似關(guān)系可以構(gòu)造成相似矩陣,相似矩陣的傳遞閉包是模糊等價(jià)關(guān)系,其每個(gè)λ截集都是通常意義下的等價(jià)關(guān)系。
定義6 對(duì)于連續(xù)域決策表S=〈U,C,D,V,f〉,連續(xù)屬性c?i(i=1,2,…,m)的數(shù)字特征向量DCV(c?i),連續(xù)屬性間的相似矩陣定義為[R]=(rij)m×n。其中[R]中每個(gè)元素定義為
rij=1-δ×?nk=1|λik-λjk|(6)
其中:i, j=1,2,…,m;0<δ<1為一個(gè)常數(shù);m為條件屬性的總個(gè)數(shù)。
3 新的屬性約簡算法
本文所提出的新的屬性約簡算法適用于條件屬性是連續(xù)型的決策表,其描述如下:
輸入:連續(xù)域決策表S=〈U,C,D,V,f〉、相似度閾值β、相似矩陣元素常量系數(shù)δ、模糊等價(jià)矩陣的截集閾值λ。
輸出:滿意的主觀條件屬性約簡集和模糊規(guī)則集。
a)將決策表中每個(gè)屬性的連續(xù)值使用三角隸屬度函數(shù)轉(zhuǎn)換為模糊值;
b)根據(jù)β以及式(1)~(4)計(jì)算各個(gè)條件屬性的數(shù)字特征向量;
c)通過 HCM聚類方法獲得數(shù)據(jù)集之間的關(guān)系;
d)用遺傳算法實(shí)現(xiàn)全局搜索;
e)選取適當(dāng)?shù)?a target="_blank" title="閾">閾值λ,從而獲得滿意的主觀條件屬性約?簡集;
f)根據(jù)該主觀條件屬性約簡集,導(dǎo)出相應(yīng)的模糊規(guī)則集,算法結(jié)束。
4 實(shí)例
本文以柴油機(jī)的供油系統(tǒng)故障診斷為例,表1是由數(shù)據(jù)形成的故障診斷決策表[3,5]。其中:u?1,u?2,…,u?6分別表示系統(tǒng)的六種狀態(tài);c?1、c?2、c?3為條件屬性,分別表示穩(wěn)定修復(fù)精度、操作修復(fù)精度、魯棒度;d為決策屬性,表示修復(fù)效果。
表1 柴油機(jī)的供油系統(tǒng)故障診斷系統(tǒng)的連續(xù)域決策表
Uc?1c?2c?3d
u?115021
u?216100
u?315212
u?416211
u?515102
u?64020
根據(jù)文獻(xiàn)[6,7]提供的條件屬性分割方法以及文獻(xiàn)[8,9]所提供的三角隸屬度函數(shù),每個(gè)連續(xù)屬性分成五個(gè)模糊區(qū)間,其中屬性不出現(xiàn)的那些模糊區(qū)間就不在模糊表中表示出來了,最終得到該系統(tǒng)的模糊決策表。
這里取β=0.8計(jì)算每個(gè)條件屬性下的各個(gè)相似類。
經(jīng)計(jì)算c?1下的各個(gè)相似類為
sim??0.8c??1(u?1)={u?1}
sim??0.8c??1(u?2)={u?2,u?4,u?5}
sim??0.8c??1(u?3)={u?3,u?5,u?6}
sim??0.8c??1(u?4)={u?2,u?4}
sim??0.8c??1(u?5)={u?2,u?3,u?5,u?6}
sim??0.8c??1(u?2)={u?3,u?5,u?6}
所以,DCV(c?1)=(3,4,2,4,,3,1)。同理可得DCV(c?2)=(1,3,2,3,4,3),DCV(c?3)=(2,3,3,3,3,2)。
由各個(gè)條件屬性的數(shù)字特征向量,取δ=0.02,使用模糊矩陣閉包運(yùn)算方法[9,10]可以求得
[t(R)]=10.560.56?0.5610.56?0.560.561
取λ=0.8可得
[t(R)]?λ=1 0 0?0 1 0?0 0 1
在模糊等價(jià)矩陣的截集閾值λ=0.8的條件下,各連續(xù)條件屬性是不相關(guān)的。因此表1的主觀約簡集為{c?1,c?2,c?3},這個(gè)結(jié)果與文獻(xiàn)[8]所得的結(jié)果完全一致。
通過這個(gè)實(shí)例說明,利用本文算法不僅能夠解決連續(xù)域決策表屬性約簡問題,而且還可以根據(jù)需要獲得主觀的屬性約簡集和一組模糊規(guī)則集,這說明本算法是可行的。
5 結(jié)束語
本文針對(duì)粗糙集對(duì)于連續(xù)域?qū)傩詻Q策表的處理能力差以及不容易獲得模糊集之間關(guān)系等問題,提出一種把模糊集和粗糙集結(jié)合起來的連續(xù)型條件屬性模糊規(guī)則約簡算法。實(shí)例驗(yàn)證表明,采用該算法,用戶可以根據(jù)實(shí)際決策需要和領(lǐng)域知識(shí)更改閾值,從而獲得滿意的模糊規(guī)則結(jié)果。
參考文獻(xiàn):
[1]
PAWLAK Z.AI and intelligent industrial applications:the rough set perspective[J].International Journal of Cybernetics and Systems,2003,31(4):227-252.
[2]PAWLAK Z,SKOWRON A.Rudiments of rough sets[J].Information Sciences,2007,177(1): 3-27.
[3]PAWLAK Z.Rough sets:theoretical aspects of reasoning about data[M].San Francisco:Kluwer Academic Publishers,1992.
[4]DUBOIS D,PRADE H.Rough fuzzy sets and fuzzy rough sets[J].International Journal of General Systems,1990,28(3):191-208.
[5]CHANG T H,WANG T C.Using the fuzzy multi-criteria decision making approach for measuring the possibility of successful knowledge management[J].Information Sciences,2009,179(4):355-370.
[6]何亞群,胡壽松.一種基于粗糙—模糊集集成模型的決策分析方法[J].控制與決策,2004,19(3):315-318.
[7] 錢進(jìn),葉飛躍,孟祥萍,等.一種基于新的條件信息量的屬性約簡算法[J].系統(tǒng)工程與電子技術(shù),2007,29(12):54-57.
[8]LIU Wen-jun,XIAO Qi-mei.Fuzzy decision algorithm based on rough sets[J].Fuzzy Systems and Mathematics,2006,26(2):127-132.
[9]胡軍,王國胤.覆蓋粗糙集的模糊度[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2009,21(4):112-115.
[10]趙峰.一般模糊矩陣傳遞閉包的計(jì)算、簡化與應(yīng)用[D].青島:青島海洋大學(xué),2003.
【基于連續(xù)型條件屬性的模糊規(guī)則約簡算法】相關(guān)文章:
3.基于貨物當(dāng)前狀態(tài)全程跟蹤的調(diào)度算法
5.基于3GPP LTE 系統(tǒng)的HARQ 算法探究
7.基于模糊評(píng)價(jià)方法的企業(yè)生命周期研究論文