地理信息数据录入中的数据质量控制研究
  • 【摘要】

    随着地理信息技术的发展,针对空间数据库的应用越来越广泛,空间数据库中的数据源包括各种异构的可操作的数据库及其他数据.数据源中可能包含地形图数据、管线数据、气象数据、人口数据、噪声数据、重复数据和不一致数据.以上数据的生产过程和质量,常常只是对数据的生产者来说是透明的,而对数据的使用者却不透明,这样必然导致数据生产过程中大量的重复采集数据的工作.为防止造成大量的人力、物力等资源的浪费,关于数据共享的... 展开>>随着地理信息技术的发展,针对空间数据库的应用越来越广泛,空间数据库中的数据源包括各种异构的可操作的数据库及其他数据.数据源中可能包含地形图数据、管线数据、气象数据、人口数据、噪声数据、重复数据和不一致数据.以上数据的生产过程和质量,常常只是对数据的生产者来说是透明的,而对数据的使用者却不透明,这样必然导致数据生产过程中大量的重复采集数据的工作.为防止造成大量的人力、物力等资源的浪费,关于数据共享的研究成为现代GIS技术的热点问题,然而这些地理信息数据要实现在网络上共享,就要解决目前地理信息数据不同格式集成的问题,更进一步说,数据的质量问题是实现集成的根本因素,因此,地理信息数据共享问题的研究与地理信息数据的质量有直接关系.所以实现地理数据集成的首要问题是控制地理信息数据的质量. 论文本着精简实用的原则,设计面向对象约束条件的数据特征模型来对不同格式的原始数据进行质量检查和质量加强.这个面向对象的数据质量检查模型,可以通过对要素关系、行为和有效规则的定义来实现对现实世界系统更好地表达和描述.它必须对任何两个特征之间所具备的联系、每个特征所允许的联系的个数,任何需要的属性数值或者几何约束和特征操作,以及各种有效法则,比如属性域、应用语义关系和拓扑几何关系规则等等.然后利用ESRI公司的Geodatabase这种已有的能够支持特征关系、行为和规则定义的高级特征模型来演示这种面向对象思想的数据检查模型是如何对不同格式的原始地理数据质量进行控制检查和约束加强. 为了实现这种基于对数据属性设定约束条件思想的的表达以及原有的仍然有效的历史地理数据的集成、共享,本论文把数据质量检查模型内部的基本几何元素、属性域、关系类以及拓扑关系类用GML模式进行了编码.这也为能够把海量原始地理空间数据(数据库文件或文档)进一步用编程语言转换成GML文档提供了检验标准.在转换到GML这种能表达各种数据,并且可以在数据库间非常容易进行交换的格式后,海量原始地理信息数据也就实现了最大意义上的地理数据的集成和共享. 收起<<

  • 【作者】

    袁琳 

  • 【学科专业】

    计算机技术 

  • 【授予学位】

    硕士

  • 【授予单位】

    中国海洋大学

  • 【导师姓名】

    董军宇

  • 【学位年度】

    2009

  • 【语种】

    chi

  • 【关键词】

    约束条件%数据质量检查模型%数据集成%共享