您的位置】:知源论文网 > 理工类论文 > 计算机 > 正文阅读资讯:多源空间数据无缝集成(SIMS)技术研究

多源空间数据无缝集成(SIMS)技术研究

[作者:5189lw[来源:论文网]| 打印 | 关闭 ]

[摘要] 地理信息系统的迅速发展和广泛应用积累了大量数据资源,它们分别存储为不同数据格式,为数据综合利用带来不便。多源空间数据无缝集成(SIMS)技术实现了一种特殊的数据访问机制,不仅提供了直接存取多种数据格式的能力,而且使GIS软件软件具有跨数据源复合分析功能。本文阐述了SIMS技术体系结构,并探讨了SIMS技术在GIS软件开发中的应用。

[关键词] 地理信息系统 多源数据 多源空间数据无缝集成 虚拟空间数据引擎

一、概述

经过三十多年的发展,随着地理信息系统(GIS)的广泛应用,积累了大量GIS数据资源。由于使用了不同的GIS软件,这些数据分别存储为不同格式和不同结构。

为了更好地综合利用这些数据,通常的做法是使用GIS软件提供的数据格式转换功能,转换为某种统一格式。众所周知,不同软件数据格式之间的转换往往会造成一定的信息损失,如MapInfo的Tab文件转换到Arc/Info的Coverage会丢失线型、颜色等与显示有关的属性;更为严重的是,Arc/Info采用拓扑数据结构,MapInfo数据则是非拓扑数据结构,转换之后还需要进行拓扑重建等大量处理工作。

另外,数据转换一般通过交换格式进行,转换过程复杂。比如,要转换MapInfo的Tab文件到Arc/Info的Coverage,首先需要使用MapInfo软件把Tab文件输出为E00或DXF文件,然后运行Arc/Info把E00或DXF文件转为Arc/Info Coverage。一些单位同时运行着几个使用不同GIS软件建立的应用系统。如果数据需要不断更新,为保证不同系统之间数据的一致性,需要频繁进行数据格式转换。

为解决数据格式转换带来的种种问题,理想的方案是在一个软件中实现对多种数据格式的直接访问。多源空间数据无缝集成—SIMS(Seamless Integration of Multisource Spatialdata)就是这样一种技术。

二、理解SIMS

SIMS是一种无须数据格式转换,直接访问多种数据格式的高级空间数据集成技术,SIMS技术具有如下特点:

多格式数据直接访问。这是SIMS技术的基本功能,由于避免了数据格式转换,为综合利用不同格式的数据资源带来了方便。
格式无关数据集成。GIS用户在使用数据时,可以不必关心数据存储于何种格式,真正实现格式无关数据集成。
位置无关数据集成。如果使用大型关系数据库(如Oracle和SQL Server)存储空间数据,这些数据可以存放在网络服务器、甚至Web服务器,如果使用文件存储空间数据,这些数据一般是本地的。通过SIMS技术访问数据,不仅不必关心数据的存储格式,也不必关心数据的存放位置。用户可以象操作本地数据一样去操作网络数据。
多源数据复合分析。SIMS技术还允许使用来自不同格式的数据直接进行联合/复合空间分析。例如,用户可以使用一个格式为Arc/Info Coverage的土地利用数据集和一个存储于SDE的行政区划数据集进行叠加
分析,叠加结果可以存储到SQL Server数据库。
经过分析表明,AutoCAD和MicroStation等CAD软件,在打开文件时,把整个文件内容全部读入内存。在这种方式下实现对多种数据格式直接访问的机制比较简单:打开其他格式文件时在内存中进行格式转换,来自无论何种格式的数据源,一律转换为软件自己的格式存储于内存中,所有对数据的修改操作都以自己的格式进行,存盘时再转换为原来的结构。

在以上方式下,数据可以被全部调入内存其操作的前提。一般而言, CAD图件大小有限,有些CAD软件的文件结构本身就限制了数据文件的大小,因此CAD软件可以做到这一点。GIS软件需要处理比CAD图件大得多的地图数据,无法全部读入内存。因此,在GIS软件中实现多源数据直接访问,不能简单地采用内存数据格式转换来解决。

SIMS技术的核心不是分析、破解和转换其他GIS软件的二进制文件格式,SIMS提出了一种内置于GIS软件中的特殊数据访问体系结构。它需要实现不同格式数据的管理、调度、缓存(Cache),并提供不同格式数据之间的互操作能力。

三、SIMS的体系结构

SIMS技术体系是一种紧凑三层结构,包括:数据消费者(Customer)、数据代理(Agency)和数据提供者(Provider)。每一层有明确分工:数据提供者直接访问数据文件或者数据库,并通过数据代理提供给其他模块使用;数据消费者消费和使用数据的模块,通常负责对数据的各种分析、处理和表现;数据代理是维系数据消费者和数据提供者之间的纽带,来自提供者的数据通过代理这个中介传递给消费者,完成一次数据访问(或者数据消费),一次数据消费行为可能产生新的数据(如:迭加分析产生的新图层、缓冲区分析产生的缓冲区多边形等),这些新的数据也是通过代理传递给提供者,由提供者完成存盘动作。

1、数据消费者

数据消费者指GIS软件中使用或者消费数据的部分。它们包括:拓扑处理、地图显示、空间分析、三维表现、专题图制作、数据转换、制图输出等等模块。这些模块使用数据,是数据消费者。

数据消费者不直接与存储数据的文件或者数据库打交道,所有对数据的访问都通过数据代理完成。

2、数据代理

数据代理是联系数据消费者和数据提供者的中介,代理负责把来自提供者的数据传递给消费者使用,并把消费者产生的新数据传递给提供者存储。

SIMS技术中的数据代理是一个虚拟空间数据引擎(Virtual Spatialdata Engine)。该引擎定义了数据访问的框架,但并不实现具体的数据访问功能,因此该引擎是“虚拟”的。

3、数据提供者

数据提供者指直接访问数据文件或者数据库的模块,这些模块获取数据并通过代理提供给消费者使用,并且把传回来的数据存储到文件或数据库。

SIMS提供了访问多种格式数据的能力,对每一种数据格式的访问,最终通过空间数据引擎(Spatialdata Engine)实现。数据提供者由一组空间数据引擎组成,每个引擎负责访问一种数据格式。比如SQL Server引擎访问存储在SQL Server中的空间数据、Oracle引擎访问Oracle Spatial数据库、SDE引擎访问ESRI SDE支持的各种数据库、Arc/Info引擎存取Arc/Info Coverage等等。

为方便引擎的管理和调度,每个引擎具有统一的接口,封装成一个动态连接库—DLL(Dynamic Linking Library)。类似于一些软件的插件(Plug-in或Add-in)机制,引擎DLL存放在特定目录下,程序启动时自动搜索该目录,动态调入并注册。

 

一般而言,空间数据引擎只提供存储、读取、检索、管理数据和对数据的基本处理等功能,不负责进行空间分析和复杂处理。但是基于第三方API(如:Oracle Spatial和ESRI SDE)开发的引擎可以提供更多功能。

一般而言,空间数据引擎动态连接库的实现有三种方式,即:标准API函数DLL、C++类库DLL和OLE 自动化DLL。由于空间数据引擎结构复杂、函数接口多;标准API函数DLL中的函数缺乏层次性,不便使用,而且不符合面向对象程序设计的潮流,不适合空间数据引擎。OLE自动化DLL中可以实现一系列具有标准接口的二进制对象,对象层次清晰,接口标准,适合建立空间数据引擎。

为了达到更高的数据访问速度,本研究采用了C++类库DLL。但是,使用C++类的DLL只能使用编译连接,无法实现DLL的动态载入。

使用C++的虚函数机制可以较好地解决这个问题。虚拟空间数据引擎也是一个单独的动态连接库,这个动态连接库定义了数据访问需要的所有类,比如数据源(DataSource)或工程(Project)、数据集(Dataset)或图层(Layer)、记录集(Recordset)等,这些类的大部分函数定义为纯虚函数,比如打开工程、关闭工程、创建数据集、读写空间数据、读写属性数据、查询、建立空间索引等等。由于有纯虚函数,因此虚拟空间数据引擎中的数据访问类不可实例化。每个数据引擎动态库继承虚拟空间数据引擎中的类,并且实现所有的虚函数(否则无法实例化)。为了实现C++类库的动态挂接,在每个空间数据引擎中还需要实现一个API函数来创建相应的数据源或者工程。假设虚拟空间数据引擎中的数据源类为CDataSource,该类在SQL Server引擎中的继承类为CSqlDataSource,那么这个API函数可以这样实现:

Tags: