- 相關推薦
發(fā)表:一類基于分級聚類的可解釋性模糊建模方法的研究(一)
摘 要 提出了一種基于兩級聚類算法的可解釋性模糊建模方法。首先指出模糊模型可解釋性的重要地位,分析影響可解釋性的主要因素;然后利用減法聚類和加權模糊C均值聚類算法辨識初始模糊模型,緊密/分離性函數(shù)確定最優(yōu)劃分和模糊集合的相似性融合約簡初始模糊模型,從而提高其可解釋性;最后采用約束優(yōu)化算法整體優(yōu)化模型,提高其精度。通過對Box-Jenkins火爐數(shù)據(jù)的模糊建模,驗證了該方法的有效性。
關鍵詞 模糊建模,可解釋性,減法聚類,加權模糊C均值聚類
Key words fuzzy modeling, interpretability, subtraction clustering, weighted fuzzy c-means algorithm
引言
近些年來,基于規(guī)則的模糊建模以其眾多優(yōu)點成為一個活躍研究的領域,并在仿真、分類、數(shù)據(jù)挖掘、模式識別、預測及控制等方面得到廣泛的應用。與神經(jīng)網(wǎng)絡等模型不同,模糊模型的知識表達形式和推理機制符合人的思維習慣,可為人們所理解,成為模糊模型最顯著的特征。
在模糊建模中,一般要求所建立的模型既要有較好的擬合精度,又要有較簡單的模糊結構。目前,眾多聚類算法在模糊邏輯系統(tǒng)的結構辨識中得到了廣泛的應用,據(jù)此而得到的模糊結構往往以擬合精度作為指標,從而得到的模糊模型含有大量的冗余信息,泛化能力差,不具備可解釋性。
為了提高模糊模型的可解釋性,諸多學者進行了相關研究.文獻[7-11]給出了模糊模型可解釋性的一些必要條件。文獻[12-18]給出了提高模糊模型可解釋性的一些具體方法,包括模糊集合的相似性度量、正交變換和遺傳算法的規(guī)則約簡,全局與局部學習算法等。文獻[6]利用模糊聚類辨識含有冗余的模型,然后利用模糊集合相似性度量和相似性獎勵遺傳算法對模型進行迭代簡化,最后利用相似性懲罰遺傳算法整體優(yōu)化模型。文獻[19]提出了一種新分級聚類算法,利用最近領域聚類算法和加權模糊C均值聚類算法辨識出較少的模糊規(guī)則,但沒有考慮模糊集合的相似性融合,同時最近領域聚類算法對于高維系統(tǒng)易產(chǎn)生維數(shù)災難。
本文提出了一種基于兩級聚類的可解釋性模糊建模方法。首先利用減法聚類算法對輸入輸出數(shù)據(jù)進行預處理;然后將一次聚類的聚類中心作為二次FCM聚類的樣本,并由緊密/分離性函數(shù)(XB)確定最優(yōu)劃分,模糊集合的相似性融合約簡所得的初始模糊模型;提高其可解釋性;最后采用梯度下降算法整體優(yōu)化模型。Box-Jenkins火爐數(shù)據(jù)的模糊建模,驗證了該方法的有效性。
預備知識
TS模型
Takagi和Sugeno[22]于1985 年提出了著名的TS模糊模型,是一種被廣泛使用的模糊模型,其典型規(guī)則形式如下:
(1)
其中Ri表示第i條模糊規(guī)則,xj為輸入變量,Aij為定義在輸入論域中的隸屬函數(shù),可以取三角形、高斯型、梯形或者鐘型等.本文采用高斯型隸屬函數(shù):
(2)
其中分別代表函數(shù)的中心和方差.
TS模型的輸出為所有規(guī)則輸出的加權平均:
(3)
其中pi是第i條規(guī)則的激勵強度:
(4)
對于數(shù)據(jù){xk, yk | k=1, …, N},式(3)可以寫為線性回歸方程:
(5)
其中為規(guī)則后件參數(shù)矩陣,e為誤差矩陣.
TS模糊模型規(guī)則前件是模糊變量,而規(guī)則后件是輸入輸出線性函數(shù),它以局部線性化為基礎,通過模糊建模實現(xiàn)了全局的非線性,能克服以往模糊模型的高維問題,已經(jīng)成為一種被廣泛使用的模糊模型.
模糊模型的可解釋性
模糊模型的可解釋性問題在九十年代末期,開始得到部分研究學者的重視[7-21]。2000年4月,在ERUDIT“關于模糊系統(tǒng)與技術的未來”專題學術討論會上,Babuska R等人建議將模糊建模研究的焦點由精確性轉(zhuǎn)移到可解釋性上,標志著模糊模型可解釋性研究的重要里程碑[24]。
模糊模型的可解釋性是指模型的輸入輸出接口形式、模型結構形式、數(shù)據(jù)處理形式等符合人的思維,可以直接或者通過簡單分析來表達和洞察系統(tǒng)內(nèi)部的運行機理,從而獲得對系統(tǒng)深入的認識。
一般認為,模糊模型的可解釋性,與模型結構、輸入變量和模糊規(guī)則數(shù)目、隸屬函數(shù)特性等密切相關,現(xiàn)將主要因素陳述如下[7-11]:
1) 輸入變量數(shù)目:人們很難通過高維模糊模型來分析系統(tǒng)行為,因此模糊模型應該采用盡可能少的輸入變量.
2) 模糊規(guī)則數(shù)目:模型的規(guī)則數(shù)目越多,其可解釋性越低.經(jīng)驗認為,可解釋的模糊模型,其規(guī)則數(shù)目不超過10個,這是由人在理解、推理時的思維能力所決定的.
3) 模糊規(guī)則庫的完整性、一致性和精簡性:模糊規(guī)則要完整覆蓋輸入論域,對每一有效的輸入變量組合,至少有一條模糊規(guī)則被激勵,即完整性。模糊規(guī)則之間必須相容而不能有任何兩條規(guī)則相互矛盾,即一致性。在規(guī)則數(shù)目盡可能小的前提下,不能包含冗余規(guī)則,如某規(guī)則的前件是另一規(guī)則的子集等,即精簡性。
4) 隸屬函數(shù)的特性:隸屬函數(shù)必須是凸和正規(guī)的,常用的三角函數(shù)、高斯函數(shù)等都滿足這兩個要求。隸屬函數(shù)劃分必須是完備的,即對于任何的輸入變量,在其論域內(nèi)的任何值,至少有一個隸屬函數(shù)相對應,在形式上表現(xiàn)為隸屬函數(shù)之間存在位置的交叉隸屬函數(shù)劃分必須是可區(qū)分的,即對于同一變量,隸屬函數(shù)之間存在明顯的位置區(qū)別,以便賦予一定的語義項。
可解釋性模糊建模
一次聚類
本文提出了一種基于兩級聚類的可解釋性模糊建模方法。首先利用減法聚類算法對輸入輸出數(shù)據(jù)進行預處理,起到精簡樣本,濾去樣本中重復信息的作用,減少了二次聚類算法中的迭代次數(shù);然后將一次聚類的聚類中心作為二次加權FCM聚類的樣本,并由緊密/分離性函數(shù)(XB)確定最優(yōu)劃分,模糊集合的相似性融合約簡所得的初始模糊模型;提高其可解釋性;最后采用梯度下降算法整體優(yōu)化模型。
減法聚類算法思想為:考慮維空間的個數(shù)據(jù)點,不失一般性,假定數(shù)據(jù)點已歸一化到一個超立方體中。每個數(shù)據(jù)點都是聚類中心的候選者,則數(shù)據(jù)點處的密度指標定義為:
(6)
如果一個數(shù)據(jù)點有多個鄰近的數(shù)據(jù)點,則該數(shù)據(jù)點具有高密度值,半徑定義了該點的一個鄰域,半徑以外的數(shù)據(jù)點對該點的密度指標貢獻甚微。在計算每個數(shù)據(jù)點指標后,選擇具有最高密度指標的數(shù)據(jù)點為第一個聚類中心,令為選中的點,為其密度指標。的密度指標可用下式修正:
(7)
顯然,靠近第一個聚類中心的數(shù)據(jù)點的密度指標將明顯減少,從而使這些點不太可能選為下一個聚類中心。修正了每個數(shù)據(jù)點的密度指標后,選定下一個聚類中心,再次修正數(shù)據(jù)點的所有密度指標。當新聚類中心對應的密度指標與相比小于某個給定值時
(8)
則聚類過程結束,提取聚類中心聚相應的密度指標。
二次聚類
使用模糊C均值聚類算法進一步處理由一次聚類產(chǎn)生的聚類中心,因為這些聚類中心是由相應的密度指標所決定,所以在最后的模糊分區(qū)劃分時應考慮到相應樣本的密度指標的不同,為解決這個問題,使用加權模糊C均值聚類算法處理由一次聚類產(chǎn)生的聚類中心,相應的加權模糊C均值的目標函數(shù)為:
(9)
其中為最終的聚類數(shù),為分區(qū)矩陣,是最后的聚類中心矢量,為模糊加權指數(shù),是與初始聚類中心相關的加權量,由下式表示:
(10)
聚類的準則為取的極小值且約束條件為,最后所求的聚類中心和相應的隸屬度函數(shù)可用下式表示:
(11)
(12)
高斯型隸屬函數(shù)的方差可以通過計算模糊協(xié)方差矩陣來獲得:
(13)
(14)
一旦確定了模糊模型前件的參數(shù),即可利用最小二乘法估計模糊模型的后件參數(shù)。
加權FCM算法:
Step1:選擇聚類數(shù),加權指數(shù),和聚類中心的初始值。
Step2:使用公式(12)計算隸屬度函數(shù)值。
Step3:利用公式(11)計算更新聚類中心的值。
Step4:如果,則停止,否則轉(zhuǎn)到Step2。
模糊規(guī)則數(shù)目的確定,即在模糊聚類中確定聚類的數(shù)目,是模糊建模的一個首要問題。聚類有效性分析就是尋找最優(yōu)的聚類數(shù)目,文獻[30]提出的緊密/分離性函數(shù)(XB:Xie-Beni index)利用了隸屬函數(shù)信息和數(shù)據(jù)本身的信息,本文使用加權緊密/分離性函數(shù),其最小值對應最優(yōu)的聚類數(shù)目,對模糊指數(shù)m的魯棒性強,融合了數(shù)據(jù)的幾何結構信息:
(15)
模糊集合的相似性融合
經(jīng)過兩級聚類算法和最小二乘估計得到的初始模糊模型,其隸屬函數(shù)(模糊集合)可能存在冗余,表現(xiàn)為模糊集合間存在過度的交叉或重疊,從而難以賦予相應的語義值,降低了模型的可解釋性,因此需要對每個變量的隸屬函數(shù)進行相似性分析和融合.
模糊模型的隸屬函數(shù)存在三種類型的冗余:第一種是兩個隸屬函數(shù)相似,這是最常見的模糊集合冗余形式;第二種是隸屬函數(shù)以較大值覆蓋整個論域;第三種是隸屬函數(shù)接近于單點集合。
第三種的隸屬函數(shù)冗余,由于其不存在可解釋的實際意義,一般在對應的規(guī)則前件中直接去除即可。對于第二種的隸屬函數(shù)冗余,在去除該規(guī)則后,建模誤差在允許范圍內(nèi),則為了提高可解釋性,可將該規(guī)則刪除,實現(xiàn)規(guī)則約簡,否則保留該規(guī)則。
第一種冗余,本文采用相似性測度來評判兩個隸屬函數(shù)的相似性。對模糊集合A和B,其相似性測度定義如下[34]:
(8)
其中表示集合的基數(shù),和算子分別表示集合的交和并。
對于離散論域X={xk | k=1, …, N},式(22)表述如下:
(9)
其中和分別為最小最大算子。S為定義在[0,1]間的相似性測度,S=1表示兩個集合完全相等,而S=0意味著兩個集合沒有交叉或重疊.
如果兩個模糊集合A和B的相似性測度大于預先設定的閾值,那么集合A和B可以融合為新的集合C.對于不同形式的隸屬函數(shù),確定集合C的具體方法不同,但其共同遵循的原則是集合C的支集是集合A與B的并集,集合C的核是集合A與B核的加減聚合.如對于梯形隸屬函數(shù)A(a1,a2,a3,a4)和B(b1,b2,b3,b4),融合生成的新的模糊集合為C(c1,c2,c3,c4):c1=min(a1,b1),c2=0.5(a2+b2),c3=0.5(a3+b3),c4=max(a4+b4) .
對于本文所采用的高斯型隸屬函數(shù),由集合A和B融合生成的新集合C的參數(shù)如下:
(10)
閾值的大小直接影響模糊模型的性能,閾值越小,得到的模型的精度越低而可解釋性越高,一般閾值取[0.4 – 0.7],具體可根據(jù)實際系統(tǒng)的要求選擇。
模糊集合融合過程需要反復迭代進行.在每一次迭代過程中,對每一個變量的所有模糊集合進行兩兩相似性分析,相似性測度大于閾值的兩個模糊集合融合為新的集合.迭代反復進行,直到?jīng)]有任何兩個模糊集合的形似性測度大于閾值,然后再將第二類和第三類模糊集合刪除,從而完成整個模糊集合的相似性融合過程。
模糊模型的整體優(yōu)化
初始模糊模型集合相似性融合,提高了模型的可解釋性,但同時降低了模型的精確性,因此采用梯度下降優(yōu)化算法,提高模型的精度,為保持模型的可解釋性,對梯度下降優(yōu)化算法施加搜索空間約束。前件參數(shù)的變化范圍為,以保證隸屬函數(shù)的可區(qū)分性,后件參數(shù)變化范圍為,以保證模型的局部可解釋性不變。在優(yōu)化過程中,當模型的參數(shù)大于其最大值(或小于其最小值)時,則將該參數(shù)強迫限定為其最大值(或最小值).參數(shù)變化范圍的確定,根據(jù)經(jīng)驗,一般取4-15%之間。
【發(fā)表:一類基于分級聚類的可解釋性模糊建模方法的研究(一)】相關文章:
基于解釋性和精確性的模糊建模方法研究研究的目的與意義(一)03-07
基于網(wǎng)格的聚類方法研究03-13
發(fā)表化學教學類論文的方法12-11
基于內(nèi)容的模糊圖像檢索技術研究03-18
品牌權益綜合模糊測評研究方法探討03-07