- 相關(guān)推薦
淺析GIS多源數(shù)據(jù)集成模式
[摘要] 地理信息系統(tǒng)的迅速發(fā)展和廣泛應(yīng)用導(dǎo)致了空間數(shù)據(jù)多源性的產(chǎn)生,為數(shù)據(jù)綜合利用和數(shù)據(jù)共享帶來不便。本文探討空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn),指出多數(shù)據(jù)格式是多源空間數(shù)據(jù)集成的瓶頸;分析和評價(jià)了多源空間數(shù)據(jù)集成的三種模式,并展望了多源數(shù)據(jù)集成的發(fā)展方向。
一、多數(shù)據(jù)格式是多源空間數(shù)據(jù)集成的瓶頸
1、空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn)
空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn)主要可以概括為以下幾個(gè)層次:
。1)多語義性
地理信息指的是地理系統(tǒng)中各種信息,由于地理系統(tǒng)的研究對象的多種類特點(diǎn)決定了地理信息的多語義性。對于同一個(gè)地理信息單元(feature),在現(xiàn)實(shí)世界中其幾何特征是一致的,但是卻對應(yīng)著多種語義,如地理位置、海拔高度、氣候、地貌、土壤等自然地理特征;同時(shí)也包括經(jīng)濟(jì)社會(huì)信息,如行政區(qū)界限、人口、產(chǎn)量等。一個(gè)GIS研究的決不會(huì)是一個(gè)孤立的地理語義,但不同系統(tǒng)解決問題的側(cè)重點(diǎn)也有所不同,因而會(huì)存在語義分異問題。
(2)多時(shí)空性和多尺度
GIS數(shù)據(jù)具有很強(qiáng)的時(shí)空特性。一個(gè)GIS系統(tǒng)中的數(shù)據(jù)源既有同一時(shí)間不同空間的數(shù)據(jù)系列;也有同一空間不同時(shí)間序列的數(shù)據(jù)。不僅如此,GIS會(huì)根據(jù)系統(tǒng)需要而采用不同尺度對地理空間進(jìn)行表達(dá),不同的觀察尺度具有不同的比例尺和不同的精度。GIS數(shù)據(jù)集成包括不同時(shí)空和不同尺度數(shù)據(jù)源的集成。
。3)獲取手段多源性
獲取地理空間的數(shù)據(jù)的方法有多種多樣,包括來自現(xiàn)有系統(tǒng)、圖表、遙感手段、GPS手段、統(tǒng)計(jì)調(diào)查、實(shí)地勘測等。這些不同手段獲得的數(shù)據(jù)其存儲(chǔ)格式及提取和處理手段都各不相同。
。4)存儲(chǔ)格式多源性
GIS數(shù)據(jù)不僅表達(dá)空間實(shí)體(真實(shí)體或者虛擬實(shí)體)的位置和幾何形狀,同時(shí)也記錄空間實(shí)體對應(yīng)的屬性,這就決定了GIS數(shù)據(jù)源包含有圖形數(shù)據(jù)(又稱空間數(shù)據(jù))和屬性數(shù)據(jù)兩部分。圖形數(shù)據(jù)又可以分為柵格格式和矢量格式兩類。傳統(tǒng)的GIS一般將屬性數(shù)據(jù)放在關(guān)系數(shù)據(jù)庫中,而將圖形數(shù)據(jù)存放在專門的圖形文件中。不同的GIS軟件采取不同的文件存儲(chǔ)格式。
2、多源空間數(shù)據(jù)集成的迫切性
隨著Internet網(wǎng)絡(luò)的飛速發(fā)展和普及,信息共享已經(jīng)成為一種必然的要求。地理信息也不例外,隨著信息技術(shù)以及GIS自身的發(fā)展,GIS已經(jīng)從純粹地學(xué)技術(shù)系統(tǒng)的圈子跳了出來,正和IT行業(yè)完全融合,人們對空間信息的需求也越來越多。GIS要進(jìn)一步發(fā)展,必須完全融入大型MIS(管理信息系統(tǒng))中。1998年美國副總統(tǒng)戈?duì)柼岢鰯?shù)字地球的概念,更是將地理信息技術(shù)推到了最前沿。然而地理信息要真正實(shí)現(xiàn)共享,必須解決地理信息數(shù)據(jù)多格式、多數(shù)據(jù)庫集成等瓶頸問題。隨著技術(shù)發(fā)展,GIS已經(jīng)逐步走向完全以純關(guān)系數(shù)據(jù)存儲(chǔ)和管理空間數(shù)據(jù)的發(fā)展道路,這為GIS完全和MIS無縫集成邁出了重要的一步。但因?yàn)镚IS處理的數(shù)據(jù)對象是空間對象,有很強(qiáng)的時(shí)空特性,獲取數(shù)據(jù)的手段也復(fù)雜多樣,這就形成多種格式的原始數(shù)據(jù),再加上GIS應(yīng)用系統(tǒng)很長一段時(shí)間處于以具體項(xiàng)目為中心孤立發(fā)展?fàn)顟B(tài)中,很多GIS軟件都有自己的數(shù)據(jù)格式,這使得GIS的數(shù)據(jù)共享問題變得尤為突出。
空間數(shù)據(jù)作為數(shù)據(jù)類型的一種,同普通數(shù)據(jù)一樣需要走過從分散到統(tǒng)一的過程。在計(jì)算機(jī)的發(fā)展過程中,先是數(shù)據(jù)去適應(yīng)系統(tǒng),每一個(gè)系統(tǒng)都為傾向于擁有自己的數(shù)據(jù)格式;隨著數(shù)據(jù)量的增多,數(shù)據(jù)庫系統(tǒng)應(yīng)運(yùn)而生;隨著時(shí)代的發(fā)展,信息共享的需求越來越多,不同數(shù)據(jù)庫之間的數(shù)據(jù)交換成了瓶頸;SQL(標(biāo)準(zhǔn)結(jié)構(gòu)化查詢語言)以及ODBC的出現(xiàn)為這一難題提供了比較滿意的解決方案。但是空間數(shù)據(jù)如何引進(jìn)這種思想,或者說將空間數(shù)據(jù)也納進(jìn)標(biāo)準(zhǔn)組織和標(biāo)準(zhǔn)協(xié)議進(jìn)行規(guī)范和管理,從而使空間數(shù)據(jù)共享成為現(xiàn)實(shí)。
二、 GIS多源數(shù)據(jù)集成模式比較
由于地理信息系統(tǒng)的圖形數(shù)據(jù)格式各異,給信息共享帶來了極大的不便,解決多格式數(shù)據(jù)源集成一直是近年來GIS應(yīng)用系統(tǒng)開發(fā)中需要解決的重要問題。目前,實(shí)現(xiàn)多源數(shù)據(jù)集成的方式大致有三種,即:數(shù)據(jù)格式轉(zhuǎn)換模式、數(shù)據(jù)互操作模式、直接數(shù)據(jù)訪問模式。
1 、數(shù)據(jù)格式轉(zhuǎn)換模式
格式轉(zhuǎn)換模式是傳統(tǒng)GIS 數(shù)據(jù)集成方法(圖1)。在這種模式下,其他數(shù)據(jù)格式經(jīng)專門的數(shù)據(jù)轉(zhuǎn)換程序進(jìn)行格式轉(zhuǎn)換后,復(fù)制到當(dāng)前系統(tǒng)中的數(shù)據(jù)庫或文件中。這是目前GIS系統(tǒng)數(shù)據(jù)集成的主要辦法。目前得到公認(rèn)的幾種重要的空間數(shù)據(jù)格式有:ESRI公司的Arc/Info Coverage、ArcShape Files、E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式;Intergraph的dgn格式等等。 數(shù)據(jù)轉(zhuǎn)換模式主要存在的問題是:
。1)由于缺乏對空間對象統(tǒng)一的描述方法,從而使得不同數(shù)據(jù)格式描述空間對象時(shí)采用的數(shù)據(jù)模型不同,因而轉(zhuǎn)換后不能完全準(zhǔn)確表達(dá)源數(shù)據(jù)的信息。
(2)這種模式需要將數(shù)據(jù)統(tǒng)一起來,違背了數(shù)據(jù)分布和獨(dú)立性的原則;如果數(shù)據(jù)來源是多個(gè)代理或企業(yè)單位,這種方法需要所有權(quán)的轉(zhuǎn)讓等問題[1]。 美國國家空間數(shù)據(jù)協(xié)會(huì)制定了統(tǒng)一的空間數(shù)據(jù)格式規(guī)范SDTS(Spatial Data Transformation Standard),包括幾何坐標(biāo)、投影、拓?fù)潢P(guān)系、屬性數(shù)據(jù)、數(shù)據(jù)字典,也包括柵格格式和矢量格式等不同的空間數(shù)據(jù)格式的轉(zhuǎn)換標(biāo)準(zhǔn)。許多軟件利用SDTS提供了標(biāo)準(zhǔn)的空間數(shù)據(jù)交換格式。目前,ESRI在ARC/INFO中提供了SDTSIMPORT以及SDTSEXPORT模塊,Intergraph公司在MGE產(chǎn)品系列中也支持SDTS矢量格式。SDTS在一定程度上解決了不同數(shù)據(jù)格式之間缺乏統(tǒng)一的空間對象描述基礎(chǔ)的問題。但SDTS目前還很不完善,還不能完全概括空間對象的不同描述方法,并且還不能統(tǒng)一為各個(gè)層次以及從不同應(yīng)用領(lǐng)域?yàn)榭臻g數(shù)據(jù)轉(zhuǎn)換提供統(tǒng)一的標(biāo)準(zhǔn);并且SDTS沒有為數(shù)據(jù)的集中和分布式處理提供解決方案,所有的數(shù)據(jù)仍需要經(jīng)過格式轉(zhuǎn)換復(fù)制到系統(tǒng)中,不能自動(dòng)同步更新。
2 、數(shù)據(jù)互操作模式
數(shù)據(jù)互操作模式是OpenGIS consortium (OGC) 制定的規(guī)范。OGC是為了發(fā)展開放式地理數(shù)據(jù)系統(tǒng)、研究地學(xué)空間信息標(biāo)準(zhǔn)化以及處理方法的一個(gè)非盈利組織。GIS互操作是指在異構(gòu)數(shù)據(jù)庫和分布計(jì)算的情況下,GIS用戶在相互理解的基礎(chǔ)上,能透明地獲取所需的信息。OGC為數(shù)據(jù)互操作制定了統(tǒng)一的規(guī)范,從而使得一個(gè)系統(tǒng)同時(shí)支持不同的空間數(shù)據(jù)格式成為可能。根據(jù)OGC頒布的規(guī)范,可以把提供數(shù)據(jù)源的軟件稱為數(shù)據(jù)服務(wù)器(Data Servers),把使用數(shù)據(jù)的軟件稱為數(shù)據(jù)客戶(Data Clients),數(shù)據(jù)客戶使用某種數(shù)據(jù)的過程就是發(fā)出數(shù)據(jù)請求,由數(shù)據(jù)服務(wù)器提供服務(wù)的過程,其最終目的是使數(shù)據(jù)客戶能讀取任意數(shù)據(jù)服務(wù)器提供的空間數(shù)據(jù)。OGC規(guī)范基于OMG的CORBA、Microsoft的OLE/COM以及SQL等,為實(shí)現(xiàn)不同平臺間服務(wù)器和客戶端之間數(shù)據(jù)請求和服務(wù)提供了統(tǒng)一的協(xié)議。
【淺析GIS多源數(shù)據(jù)集成模式】相關(guān)文章:
淺析集成制造系統(tǒng)的技術(shù)構(gòu)成03-17
企業(yè)跨國集成MRO采購模式研究12-08
淺析多DM3數(shù)據(jù)庫體系及其互聯(lián)機(jī)制的策略03-17
淺析漢語綜合課教學(xué)模式11-22
淺析“板塊模式”的理論及應(yīng)用12-10
淺析和諧實(shí)踐教育模式研究03-18
淺析孫子兵法決策模式的特點(diǎn)12-10