- 相關推薦
基于XML的企業(yè)信息集成技術的研究與實現(xiàn)
摘要:為實現(xiàn)企業(yè)異構數(shù)據(jù)庫間信息的共享和集成,對數(shù)據(jù)集成的原理以及主要技術進行了研究。重點分析了XML與關系數(shù)據(jù)庫之間的映射,提出了一種以XML作為中間件的異構數(shù)據(jù)庫集成和轉化方案,并對其中的主要環(huán)節(jié)給出了具體實現(xiàn)。該方案實現(xiàn)了異構數(shù)據(jù)庫的透明訪問和聯(lián)合查詢,為企業(yè)信息系統(tǒng)集成提供了一種技術方法。關鍵詞:異構數(shù)據(jù)庫;XML;中間件;企業(yè);信息集成技術
人類在21世紀的可持續(xù)發(fā)展從戰(zhàn)略意義上看,將會越來越依靠于社會的整體科技創(chuàng)新能力和由此派生而出的知識經(jīng)濟,而以信息技術為特征的全球網(wǎng)絡化及Internet的逐漸普及的影響也毫無例外地沖擊著產(chǎn)品制造產(chǎn)業(yè)。所以,建立一套適合我國國情,支持產(chǎn)品開發(fā)與生產(chǎn)全過程的現(xiàn)代設計方法與系統(tǒng),有效地組織多學科的產(chǎn)品開發(fā)隊伍,充分利用各種計算機輔助工具,綜合應用現(xiàn)代先進的設計方法,有效地考慮產(chǎn)品開發(fā)與生產(chǎn)的全過程,從而縮短產(chǎn)品開發(fā)周期,降低本錢,進步質量,快速響應用戶需求,這導致了:
從制造產(chǎn)品所需的企業(yè)治理與組織結構方面看,具備全球化、并行化與靈敏化特征的企業(yè)集成技術將成為新一代企業(yè)生存的決定性因素。
本文針對現(xiàn)代企業(yè)信息化的需求,提出了建立基于XML的企業(yè)信息集成框架的基本思路,闡述了XML技術在現(xiàn)代企業(yè)信息交互中的作用,并對XML與指定格式文本的轉化方法進行了研究。
1體系結構
在大型企業(yè)中,由于生產(chǎn)自動化進程的階段性,一般都存在基于多種數(shù)據(jù)庫治理系統(tǒng)(DBMS)的應用程序系統(tǒng),如基于Microsoft Access的底層生產(chǎn)過程控制系統(tǒng)、基于Oracle或者Sql Server的高層企業(yè)資源計劃系統(tǒng)(ERP)等等,這些系統(tǒng)的數(shù)據(jù)庫一般都只在本系統(tǒng)內部存取,而不能被其他系統(tǒng)訪問。這種狀況導致企業(yè)不同層次信息孤島的出現(xiàn),嚴重影響信息傳遞的實時性、加大信息維護的本錢。
XML企業(yè)信息集成系統(tǒng)構建在數(shù)據(jù)庫系統(tǒng)之上,目的是集成異構數(shù)據(jù)源信息,為數(shù)據(jù)共享、發(fā)布和應用提供支持,并負責XML向其他格式文本的轉換。
本系統(tǒng)采用客戶/服務器三層架構,如圖1所示。各個異構數(shù)據(jù)庫資源構成了系統(tǒng)數(shù)據(jù)層;本系統(tǒng)完成的主要任務,即異構數(shù)據(jù)集成和查詢的功能被封裝構成業(yè)務層,并使用XSL將XML轉換成指定格式的文本;用戶的應用構成系統(tǒng)的表示層。
2異構數(shù)據(jù)源集成方法
對于異構數(shù)據(jù)庫集成,目前主要研究和采用的技術有以下三種:
2.1 數(shù)據(jù)庫遷移和轉換
將原有的數(shù)據(jù)遷移到新的數(shù)據(jù)治理系統(tǒng)中來,為了集成不同類型的數(shù)據(jù),必須將一些非傳統(tǒng)的數(shù)據(jù)類型轉化成新的數(shù)據(jù)類型。利用數(shù)據(jù)轉化程序,對數(shù)據(jù)格式進行轉換,從而能被其它的DBMS接收。這種方法處理簡單經(jīng)濟,運行時效率高,已為大多數(shù)用戶理解和接受。它適合于對數(shù)據(jù)的實時性要求不高的場合。
2.2 多數(shù)據(jù)庫系統(tǒng)
它是一種能夠接受和容納多個異構數(shù)據(jù)庫的系統(tǒng),對外呈現(xiàn)出一種集成結構,而對內又答應各個異構數(shù)據(jù)庫的“自治性”。多數(shù)據(jù)庫系同一般分為兩類:
有全局同一模式的多數(shù)據(jù)庫系統(tǒng),每個參與集成的數(shù)據(jù)庫有自己的局部概念模式,用戶可以通過建立在局部概念模式上的局部外模式訪問本地庫。在所有局部概念模式的基礎上建立了全局概念模式,用戶通過建立在全局概念模式上的全局外模式訪問集成系統(tǒng)中的其他數(shù)據(jù)庫。
聯(lián)邦式數(shù)據(jù)庫系統(tǒng),各個異構的局部數(shù)據(jù)庫之間僅存在著疏松的聯(lián)邦式耦合關系,沒有全局同一模式,各局部數(shù)據(jù)庫通過定義輸進、輸出模式進行彼此之間的數(shù)據(jù)訪問。各局部數(shù)據(jù)庫能對自己的完整性和安全性等進行控制。 2.3 XML中間件技術
目前,網(wǎng)上有很多信息格式是半結構化或非結構化的,其來源極端異構。利用XML作為中間件對這些信息進行元數(shù)據(jù)搜索,提供一個同一界面的檢索系統(tǒng)是一個較好的應用方案。XML(Extensible Markup Language,可擴展標記語言)是由W3C(World Wide Web Consortium)組織于1998年2月制定的一種通用語言規(guī)范,它是專門為Web應用程序而設計的SGML的簡化子集。XML的好處是數(shù)據(jù)的可交換性(portable),同時在數(shù)據(jù)應用方面還具有如下優(yōu)點:(1)XML文件為純文本文件,不受操縱系統(tǒng)、軟件平臺的限制;(2)XML具有基于Schema自描述語義的功能,輕易描述數(shù)據(jù)的語義,這種描述能為計算機理解和自動處理;(3)XML不僅可以描述結構化數(shù)據(jù),還可有效描述半結構化,甚至非結構化數(shù)據(jù)。
中間件(Middleware)是位于異構數(shù)據(jù)庫系統(tǒng)(數(shù)據(jù)層)和應用程序(應用層)之間,向下協(xié)調各數(shù)據(jù)庫系統(tǒng),向上為訪問集成數(shù)據(jù)的應用提供同一數(shù)據(jù)模式和數(shù)據(jù)訪問的通用接口,是異構系統(tǒng)集成所需的粘接劑。功能完善的數(shù)據(jù)庫中間件,可以對用戶屏蔽數(shù)據(jù)的分布地點、DBMS平臺、SQL方言/擴展、特殊本地API等差異。解決了異構數(shù)據(jù)庫的互操縱性題目。與第一種方法相比,它也解決了同步題目,而且利用中間件集成異構數(shù)據(jù)庫,并不需要改變原始數(shù)據(jù)的存儲和治理方式。各數(shù)據(jù)庫的應用仍然完成他們的任務,中間件系統(tǒng)則主要集中為異構數(shù)據(jù)源提供一個高層次檢索服務。顯然,中間件系統(tǒng)模式是實現(xiàn)異構數(shù)據(jù)集成較理想的解決方案。
3異構數(shù)據(jù)庫的中間件的設計方法
本文設計了三層的結構,分別實現(xiàn)與源數(shù)據(jù)庫、中間數(shù)據(jù)庫(XML文檔)、目的數(shù)據(jù)庫的連接,并實現(xiàn)數(shù)據(jù)在這三個數(shù)據(jù)源中的轉換及傳輸,同時屏蔽掉各層次的異構特性,只需要通過簡便的操縱就能進行數(shù)據(jù)轉換和結果匯總。
3.1 異構數(shù)據(jù)庫間數(shù)據(jù)的傳送中間件的結構
該中間件主要涉及三個部分:源數(shù)據(jù)庫、實現(xiàn)數(shù)據(jù)轉換的中間數(shù)據(jù)庫、目的數(shù)據(jù)庫。我們就把中間件分為三層:源數(shù)據(jù)控制層、中間數(shù)據(jù)層和目的數(shù)據(jù)控制層。
(1)源數(shù)據(jù)控制層
它負責建立與源數(shù)據(jù)庫的連接,從源數(shù)據(jù)庫中讀出源數(shù)據(jù)表的描述信息、表的列名、列的數(shù)目、各列的數(shù)據(jù)類型、列的長度等。
(2)中間數(shù)據(jù)層
它讀取源數(shù)據(jù)庫與中間數(shù)據(jù)庫的數(shù)據(jù)類型映射表,確定源數(shù)據(jù)在中間數(shù)據(jù)庫中的數(shù)據(jù)類型,建立中間數(shù)據(jù)文檔的Schema (描述引用它的XML文件中的元素和屬性的結構和類型)。從源數(shù)據(jù)庫表中讀出數(shù)據(jù),根據(jù)中間數(shù)據(jù)文檔的Schema,將源數(shù)據(jù)轉換為中間數(shù)據(jù)格式并存儲在中間數(shù)據(jù)文件中。
(3)目的數(shù)據(jù)控制層
它負責建立與中間數(shù)據(jù)的連接,根據(jù)目的數(shù)據(jù)庫與中間數(shù)據(jù)的數(shù)據(jù)類型映射表確立中間數(shù)據(jù)在目的數(shù)據(jù)庫中的數(shù)據(jù)類型;確定對中間數(shù)據(jù)的操縱方式(插進、刪除等),建立與目的數(shù)據(jù)庫的連接。根據(jù)對中間數(shù)據(jù)的處理方案和中間數(shù)據(jù)所對應的目的數(shù)據(jù)類型,將中間數(shù)據(jù)傳送到目的數(shù)據(jù)庫表中。
3.2 XML在設計中的應用
在這個階段的任務是建立XML文檔的Schema文件和向XML文檔中寫數(shù)據(jù)。Schema文件和XML文檔都要根據(jù)源數(shù)據(jù)的字段個數(shù)和各字段的數(shù)據(jù)類型在程序中天生。本文用XML Schema來定義XML文檔,采用基于樹的解析(DOM)器和基于事件的解析器(SAX)相結合使用的方法來進行對XML文檔的操縱。利用DOM的簡易性來建立XML文檔,并向其中添加數(shù)據(jù),以實現(xiàn)由源數(shù)據(jù)庫向中間數(shù)據(jù)庫一XML文檔中寫數(shù)據(jù)。利用SAX基于事件的解析器的邊解析邊處理的高效率來讀取XML文檔中的數(shù)據(jù),實現(xiàn)從XML文檔向目的數(shù)據(jù)庫傳送數(shù)據(jù)。
利用XML作為企業(yè)信息系統(tǒng)信息源集成的中介, 既保持了各數(shù)據(jù)庫相對獨立性和安全性, 進步數(shù)據(jù)保存和分析處理的能力,又使企業(yè)系統(tǒng)中的各種信息實現(xiàn)了集成,代表了企業(yè)信息集成技術發(fā)展的方向。
4結束語
利用XML作為中間轉換中介可以實現(xiàn)異構數(shù)據(jù)庫的集成,在將各異構數(shù)據(jù)源轉換為同一的XML格式后,利用XSL實現(xiàn)對全部數(shù)據(jù)的格式轉換,以滿足用戶的不同需求。從而有效地避免了異構數(shù)據(jù)對我們訪問的影響,這在各大企業(yè)和科研部分中都有很重要的作用和現(xiàn)實意義。
參考文獻:
[1]鐵猛.企業(yè)信息治理集成技術研究[D].碩士學位論文.長春理工大學.2005.
[2]謝鴻強,董逸生.異構數(shù)據(jù)源的集成技術[J].產(chǎn)業(yè)控制計算機,2001,(6):1-6.
[3]王彥新,楊奎河.基于XML的異構數(shù)據(jù)庫集成方法研究與實現(xiàn)[J].福建電腦,2006,(4):90-91.
[4]胡松濤.基于XMl的異構數(shù)據(jù)集成研究[D].碩士學位論文.哈爾濱工程大學,2005.
[5]Youngju Son,Hasan Jamil,Farshad Fotouhi. Exploiting Types for Improved Schema Mapping. ACM.2007
【基于XML的企業(yè)信息集成技術的研究與實現(xiàn)】相關文章:
企業(yè)信息化安全技術研究01-08
基于minigui的網(wǎng)真機界面的實現(xiàn)08-05
基于戰(zhàn)略治理的企業(yè)環(huán)境風險研究08-28
制造產(chǎn)品智能集成報價系統(tǒng)研究08-26
基于工業(yè)機器人的自動化生產(chǎn)技術研究論文04-14
基于web的異地并行設計與制造系統(tǒng)研究06-02