本站小編為你精心準備了企業信息集成技術參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:為實現企業異構數據庫間信息的共享和集成,對數據集成的原理以及主要技術進行了研究。重點分析了XML與關系數據庫之間的映射,提出了一種以XML作為中間件的異構數據庫集成和轉化方案,并對其中的主要環節給出了具體實現。該方案實現了異構數據庫的透明訪問和聯合查詢,為企業信息系統集成提供了一種技術方法。
關鍵詞:異構數據庫;XML;中間件;企業;信息集成技術
人類在21世紀的可持續發展從戰略意義上看,將會越來越依賴于社會的整體科技創新能力和由此派生而出的知識經濟,而以信息技術為特征的全球網絡化及Internet的逐漸普及的影響也毫無例外地沖擊著產品制造工業。所以,建立一套適合我國國情,支持產品開發與生產全過程的現代設計方法與系統,有效地組織多學科的產品開發隊伍,充分利用各種計算機輔助工具,綜合應用現代先進的設計方法,有效地考慮產品開發與生產的全過程,從而縮短產品開發周期,降低成本,提高質量,快速響應用戶需求,這導致了:
從制造產品所需的企業管理與組織結構方面看,具備全球化、并行化與敏捷化特征的企業集成技術將成為新一代企業生存的決定性因素。
本文針對現代企業信息化的需求,提出了建立基于XML的企業信息集成框架的基本思路,闡述了XML技術在現代企業信息交互中的作用,并對XML與指定格式文本的轉化方法進行了研究。
1體系結構
在大型企業中,由于生產自動化進程的階段性,一般都存在基于多種數據庫管理系統(DBMS)的應用程序系統,如基于MicrosoftAccess的底層生產過程控制系統、基于Oracle或者SqlServer的高層企業資源計劃系統(ERP)等等,這些系統的數據庫一般都只在本系統內部存取,而不能被其他系統訪問。這種狀況導致企業不同層次信息孤島的出現,嚴重影響信息傳遞的實時性、加大信息維護的成本。
XML企業信息集成系統構建在數據庫系統之上,目的是集成異構數據源信息,為數據共享、和應用提供支持,并負責XML向其他格式文本的轉換。
本系統采用客戶/服務器三層架構,如圖1所示。各個異構數據庫資源構成了系統數據層;本系統完成的主要任務,即異構數據集成和查詢的功能被封裝構成業務層,并使用XSL將XML轉換成指定格式的文本;用戶的應用構成系統的表示層。
2異構數據源集成方法
對于異構數據庫集成,目前主要研究和采用的技術有以下三種:
2.1數據庫遷移和轉換
將原有的數據遷移到新的數據管理系統中來,為了集成不同類型的數據,必須將一些非傳統的數據類型轉化成新的數據類型。利用數據轉化程序,對數據格式進行轉換,從而能被其它的DBMS接收。這種方法處理簡單經濟,運行時效率高,已為大多數用戶理解和接受。它適合于對數據的實時性要求不高的場合。
2.2多數據庫系統
它是一種能夠接受和容納多個異構數據庫的系統,對外呈現出一種集成結構,而對內又允許各個異構數據庫的“自治性”。多數據庫系統一般分為兩類:
有全局統一模式的多數據庫系統,每個參與集成的數據庫有自己的局部概念模式,用戶可以通過建立在局部概念模式上的局部外模式訪問本地庫。在所有局部概念模式的基礎上建立了全局概念模式,用戶通過建立在全局概念模式上的全局外模式訪問集成系統中的其他數據庫。
聯邦式數據庫系統,各個異構的局部數據庫之間僅存在著松散的聯邦式耦合關系,沒有全局統一模式,各局部數據庫通過定義輸入、輸出模式進行彼此之間的數據訪問。各局部數據庫能對自己的完整性和安全性等進行控制。2.3XML中間件技術
目前,網上有很多信息格式是半結構化或非結構化的,其來源極端異構。利用XML作為中間件對這些信息進行元數據搜索,提供一個統一界面的檢索系統是一個較好的應用方案。XML(ExtensibleMarkupLanguage,可擴展標記語言)是由W3C(WorldWideWebConsortium)組織于1998年2月制定的一種通用語言規范,它是專門為Web應用程序而設計的SGML的簡化子集。XML的好處是數據的可交換性(porbr),同時在數據應用方面還具有如下優點:(1)XML文件為純文本文件,不受操作系統、軟件平臺的限制;(2)XML具有基于Schema自描述語義的功能,容易描述數據的語義,這種描述能為計算機理解和自動處理;(3)XML不僅可以描述結構化數據,還可有效描述半結構化,甚至非結構化數據。
中間件(Middleware)是位于異構數據庫系統(數據層)和應用程序(應用層)之間,向下協調各數據庫系統,向上為訪問集成數據的應用提供統一數據模式和數據訪問的通用接口,是異構系統集成所需的粘接劑。功能完善的數據庫中間件,可以對用戶屏蔽數據的分布地點、DBMS平臺、SQL方言/擴展、特殊本地API等差異。解決了異構數據庫的互操作性問題。與第一種方法相比,它也解決了同步問題,而且利用中間件集成異構數據庫,并不需要改變原始數據的存儲和管理方式。各數據庫的應用仍然完成他們的任務,中間件系統則主要集中為異構數據源提供一個高層次檢索服務。顯然,中間件系統模式是實現異構數據集成較理想的解決方案。
3異構數據庫的中間件的設計方法
本文設計了三層的結構,分別實現與源數據庫、中間數據庫(XML文檔)、目的數據庫的連接,并實現數據在這三個數據源中的轉換及傳輸,同時屏蔽掉各層次的異構特性,只需要通過簡便的操作就能進行數據轉換和結果匯總。
3.1異構數據庫間數據的傳送中間件的結構
該中間件主要涉及三個部分:源數據庫、實現數據轉換的中間數據庫、目的數據庫。我們就把中間件分為三層:源數據控制層、中間數據層和目的數據控制層。
(1)源數據控制層
它負責建立與源數據庫的連接,從源數據庫中讀出源數據表的描述信息、表的列名、列的數目、各列的數據類型、列的長度等。
(2)中間數據層
它讀取源數據庫與中間數據庫的數據類型映射表,確定源數據在中間數據庫中的數據類型,建立中間數據文檔的Schema(描述引用它的XML文件中的元素和屬性的結構和類型)。從源數據庫表中讀出數據,根據中間數據文檔的Schema,將源數據轉換為中間數據格式并存儲在中間數據文件中。
(3)目的數據控制層
它負責建立與中間數據的連接,根據目的數據庫與中間數據的數據類型映射表確立中間數據在目的數據庫中的數據類型;確定對中間數據的操作方式(插入、刪除等),建立與目的數據庫的連接。根據對中間數據的處理方案和中間數據所對應的目的數據類型,將中間數據傳送到目的數據庫表中。
3.2XML在設計中的應用
在這個階段的任務是建立XML文檔的Schema文件和向XML文檔中寫數據。Schema文件和XML文檔都要根據源數據的字段個數和各字段的數據類型在程序中生成。本文用XMLSchema來定義XML文檔,采用基于樹的解析(DOM)器和基于事件的解析器(SAX)相結合使用的方法來進行對XML文檔的操作。利用DOM的簡易性來建立XML文檔,并向其中添加數據,以實現由源數據庫向中間數據庫一XML文檔中寫數據。利用SAX基于事件的解析器的邊解析邊處理的高效率來讀取XML文檔中的數據,實現從XML文檔向目的數據庫傳送數據。
利用XML作為企業信息系統信息源集成的中介,既保持了各數據庫相對獨立性和安全性,提高數據保存和分析處理的能力,又使企業系統中的各種信息實現了集成,代表了企業信息集成技術發展的方向。
4結束語
利用XML作為中間轉換中介可以實現異構數據庫的集成,在將各異構數據源轉換為統一的XML格式后,利用XSL實現對全部數據的格式轉換,以滿足用戶的不同需求。從而有效地避免了異構數據對我們訪問的影響,這在各大企業和科研部門中都有很重要的作用和現實意義。
參考文獻:
[1]鐵猛.企業信息管理集成技術研究[D].碩士學位論文.長春理工大學.2005.
[2]謝鴻強,董逸生.異構數據源的集成技術[J].工業控制計算機,2001,(6):1-6.
[3]王彥新,楊奎河.基于XML的異構數據庫集成方法研究與實現[J].福建電腦,2006,(4):90-91.
[4]胡松濤.基于XMl的異構數據集成研究[D].碩士學位論文.哈爾濱工程大學,2005.
[5]YoungjuSon,HasanJamil,FarshadFotouhi.ExploitingTypesforImprovedSchemaMapping.ACM.2007