数据说明

中国历史地理信息系统项目(CHGIS)于2001年1月8日正式启动,该项目由[罗斯基金会]资助。 CHGIS项目试图建立一套中国历史时期连续变化的基础地理信息库,为研究者GIS数据平台、时间统计以及查寻工具和模型。

正是希望有一套可共享的数字化基础历史地理信息的设想,才促使来自不同国家的学术团体集合在一起,构成CHGIS项目。CHGIS数据的版权归项目管理委员会所有,但同时,每一个提供数据的学术团体,具有以他们认为适当的方式进一步修改他们自己数据的权力。这样做的目的是希望至少有一套可以共享的GIS数据,以便学者和其他有兴趣的团体方便地获得并得到许可,用于教学、研究和成果发表中。

CHGIS数据1.0版的发表标志着CHGIS项目成果的面世,该版本数据主要包括清代1820年的基础地理数据。此后,项目将继续工作,建立连续的时间序列,描述地名、行政建制和其他基础地理要素的随时间的变化。最终目标是建立一套灵活的工具和数据,以便检索和查询中国基础历史地理信息。每一个随时间变化的独立地理要素记录拥有一个唯一的ID号,它可以用作相关数据库中的关联编码,也可以此连接相应的地理要素释文,同时用户也可以用此ID号把自己的数据连接到CHGIS数据中,并利用CHGIS数据,按不同历史时期和不同数据集的方式,查寻、检索和显示用户数据。

用户可以通过管理委员会指定的网站下载CHGIS数据,或通过预制的CD-ROM获得数据。无论是网站还是CD-ROM上均提供有关项目和项目进程的说明、当前数据、用户协议,以及如何使用数据的样例。

项目背景

CHGIS项目深受以下几位学者工作的影响:①谭其骧教授(1911-1992)(复旦大学),《中国历史地图集》(8卷,1982-)的主编,该图集是中国历史地理的经典参考。②葛剑雄教授(复旦大学), 历史地理研究中心主任。③施坚雅教授(加州大学Davis分校),他开发了中国空间结构模型,其包括中国宏观区域经济/社会市场系统的8个层次。④William Lavely教授(华盛顿大学),他推动中国时空计划(CITAS)数据库的研制。⑤Robert Hartwell教授(1932-1996)(宾夕法尼亚大学),他自己建立了从唐至明时期6个时间断面的历史GIS数据。⑥Lawrence Crissman教授(格里菲斯大学),他开发了当代中国县级行政界线(1980-2000年)连续变化GIS数据。

谭其骧教授:复旦大学历史地理研究所前所长,指导了创造性的《中国历史地图集》的编纂工作。在这8卷本图集中,谭教授和他的同事们用现代地图的方式描述了各个朝代疆域、行政建制、聚落、自然地理要素的主要特征。由于该图集重要的学术价值,这部著作也被扫描制成电子版和数字化后形成GIS数据,前者可以有中国地图出版社出版的电子版(1997年),后者有中国社会科学院授权,中研院开发的电子化历史地图集GIS数据,该目前该数据仅限于中研院内部使用。

葛剑雄教授:现任复旦大学历史地理研究中心主任,该研究中心保存有《中国历史地图集》编纂时积累的数据描述、定位和考释资料。目前葛剑雄教授和该中心的一批专家正在编写有关中国历史地理基础信息系统的释文资料,按统一的格式考订秦汉以来聚落、政区等地名的形成和演变关系,并编写相应的数据库和GIS数据。

施坚雅教授:多年以来开发了中国空间结构模型。他的研究对CHGIS项目的目标和方法形成起了很重要的促进作用。他早期的研究中国农村的市场和社会结构(1964-65)展示了区域的时空系统如何受市场的影响,并提出市镇的三个层次结构,以及它们在城市空间关系系统中的地位和作用。他在专著《中华晚期帝国的城市》(1977)构造了中国社会经济景观的结构,这些结构展示了区域内城市和市镇的区位中心作用,以及它们的空间联系关系。施坚雅教授的另一个研究中国历史结构(1985)从理论上阐述了中国社会空间结构之间的关系。1989以来,施坚雅教授一直从事当代中国GIS地图和相关数据库的研究和开发工作,最近已经完成了中国12,000个城镇区位中心的分析工作,并描述了这些区位中心的空间层次和空间隶属关系。

Robert Hartwell教授:1996年谢世。其后,Hartwell太太把教授夫妇共同建立的空间数据(该数据研制得到中国历史服务 公司赞助)捐赠给了哈佛燕京学社。这些数据包括从唐朝至明朝主要朝代标准年代断面的县界GIS数据,这些数据的 编制是基于“协同定位(co-location)”概念,利用了现代县级行政单位界线的GIS数据,根据县级政区的 设置迁废等信息,重建历史时期相同县级政区的界线。尽管此方法确定的县界在某些例子中存在一定 的问题,但这些GIS数据在GIS工具的支持下,已经可以提供查询、检索和重建特定时间断面的县级政区界县的 功能,这些功能是一个历史地理信息系统最基本的功能。Hartwell教授的数据将与CHGIS项目数据 一起发布,作为一种确定历史政区单位的方法和数据编制方法介绍给学者。更详细的讨论和说明,请参见:包弼德教授撰写的 Hartwell教授的GIS数据介绍一文 (WORD文件)。

Hartwell教授的GIS数据为CHGIS项目提供了借鉴方法和数据编制概念,这使得CHGIS项目节约了许多时间。 但CHGIS项目和数据并不是Hartwell教授工作的扩展,而是一个全新的研究项目,与Hartwell教授GIS数据的最大差 别是,CHGIS项目的历史空间数据(包括聚落点和行政界线)建立在复旦大学历史地理研究中心详细研究的原始资料 来源和考订说明的基础上。如前所述,Hartwell教授的GIS数据是利用“协同定位”概念,以当代县界为基础,建立 历史时期的县界。而CHGIS项目在建立县界时除了参考现代的县界外,历史时期县界的确定参考了当时各种文献记 载(包括县治或定位聚落与县界的距离、县界与特定地理参照物的走向关系等记录信息),并以文字解释的方法记 录了这种确定过程和编纂者的考订意见。这种方式的好处是,通过研究提供了一个根据目前了解的信息和理解能力, 能够确定的最佳定位和划界的解释,同时也为用户提供了根据他们自己的资料和认识修改这个解释的空间。有兴趣 的用户完全可以依据他们自己的研究资料和认识,修改空间数据的定位、走向,以及与此有关的属性数据和注记方 式。这种方法充分利用了GIS数据的灵活性,可以不断地改进和修正CHGIS数据,从而使中国历史地理基础信息不断 完善和成熟。可以说这是一种基于传统的中国历史地理基础数据,但又和现代技术紧密结合的技术和方法。

William Lavely教授:工作于华盛顿大学杰克逊国际研究学院和社会学系,对中国人口学有着广泛的研究。Lavely教授是 中国时空计划(CITAS)的主要研究者之一,该项目第一个向用户提供 可供共享的中国县级社会经济GIS数据。此外,在人口学研究中,Lavely教授也开发了一套 中国语言地图集编码方案 (PDF文件),这个编码方案使得CITAS的GIS数据可以用来显示语言分布。

Lawrence Crissman教授:亚洲空间信息和分析网络(ACASIAN),近十年来从事编纂中国、 其他亚洲国家和前苏联的系列GIS数据工作。其中中国数据尤为重要。因为这些数据集成了当代和历史地图、遥感 数据和1980年以来行政单位国家标准编码(国标码)连续序列数据库。其中国标码数据库可以识别省、地区、县 等不同单位,并方便地逐年追溯它们的任何变化。对于相同地域的行政单位,通过时间检索可以同时查获前后变 化的设计,Crissman教授为CHGIS设计的“空间-时间数据库模型”的GIS草案中提出了重要的思想。

数据应用

CHGIS项目设计的目的是为学术研究提供一个GIS数据平台。并充分考虑了数据的灵活性,允许更新版本以及变更数据的特征属性、空间形态、以及有争议的政区实体等。CHGIS试图建立一个可靠的、开放的基础地理信息数据库,而不是仅仅提供一种各要素之间关系封闭的一家之言。CHGIS数据远胜于印刷的纸质地图,它的长处是个地理要素之间的关系可以修改和更新。只要有新的内容,新“版本“只要 发布在互联网上,就可供用户下载使用。CHGIS数据编辑者设计了很好的编辑标准,用于 管理数据库的内容,以及管理和协调正式版本的发布。

用户下载CHGIS数据后,可按中国历史上任何时间检索行政单位和聚落,并创建特定时间和特定地区的用户自己电子地图(参见样图),也可以加入用户自己数 据作空间分析和专题制图,或按自己的兴趣建立特定的统计模型。本数据中也包括历史海岸线、历史主要河流和概括性的地形图像。用户数据与CHGIS数 据集成的方法有以下四个基本步骤:

按需要的时段、区域、与用户数据相关的特性在CHGIS数据中检索数据,把检索的数据输出为一个单独表格(必须包括CHGIS数据各记录原有的ID号)把用户数据(或属性值)连接到这个检索到的表格,连接好的表格再次连接到相应的CHGIS空间数据文件上。用户在把自己的数据与空间对象连接好后,就可以绘制专题地图,或进行其他的空间分析。分析结果可以输出为表格、电子地图、或是其他数据模型的基础数据。

欢迎CHGIS数据用户提供他们自己的数据,让学术界共享。CHGIS可以帮 助用户把数据发布在复旦大学历史地理中心的"禹贡"网站、或哈佛地学空间图书馆(HGL)电子文化地图集行动计划(ECAI),和其他元数据信息交换站。

欢迎用户为CHGIS数据提出修改和更正的建议,建议可以通过电子邮件以及网页上专门的表格传送给编辑者。CHGIS编辑者会认真考虑用户的建议。如果建议被采纳,将在以后正式的CHGIS产品中的相关记录释文中注明。

数据和数据库设计

1. 目标

CHGIS项目的目标是建立中国历史时期基础地理信息系统数据库,这个数据库依据GIS技术,表达这些基础地理 信息空间分布,以及随时间的变化。同时为用户提供最简洁的数据查询、检索、编绘数据地图和连接用户数据的功能。

历史地理信息包罗万象,有自然的,如气候、地貌、灾害动植物等;也有人文的,如政区疆域、聚落、经济、人口、文化社会等。 但其中有一些是最基础的信息。从有关地理内容的表达来看,无非有两个基础的因素,即空间位置和要素内容(当然要素中又可以延 伸出许多相关的类型)。但表达地理信息在地球表面位置的科学方法经纬度系统是近代科学的产物,在中国历史上的大部分时间中还 没有这个系统和完善的概念,实际上历史文献记载中的地理信息是通过另一个系统来表达空间位置的,即众所周知的地名点和区域( 行政的或自然的),如某地发生水灾、某地有多少人口、某地有什么样的社会文化习俗,或某现象在某山某河之阳等等。这个大部分 以人文要素标记的地点和地区实际上起着与经纬度相似的作用,用以标记地理要素所属的空间位置。

当然这个传统上的基础信息其局限和缺陷是显而易见的,如要素位置的相对性、名称会随时间变化等等。但这是一个事实,历史地理 研究依赖的历史文献信息就是这样表述的,我们必须面对这个事实。谭其骧先生主编《中国历史地图集》的出版历史地理意义重大, 如果从信息角度来看,是把历史上传统的空间信息描述方法和内容,转移到以现代地理坐标为基础的现代地图上,大大方便了阅读和 研究历史地理信息,提高了历史地理信息空间位置的准确性。以计算机技术为基础的中国历史地理信息系统从基本目的上来看,是传 承了《中国历史地图集》的主要目的,也是把基础历史地理信息标定到现代空间位置基础上。但CHGIS也提供了纸面历史地图所不具有 的功能:1,历史地理信息的连续变化,CHGIS数据不是描述一个或多个时间截面的空间信息,而是描述这些信息在时间上的连续变化。 2,空间信息分布与文字属性信息的有机结合。3,可以方便地查询和检索用户需要的基础地理信息。显然这样一个系统和数据将为我们 的研究工作带来很大的方便。这是我们从事历史地理信息系统研制工作的第一个目的。

随着数字化时代的到来,很多原先用一般印刷手段保存的信息将转移为数字信息,有关的历史空间信息也将如此。数字化的历史空间信 息有一个重要的前提,即信息的空间可比性。两幅印刷的地图也许看上去一样的,但数字化后在空间位置和投影的基础上能否很好地叠 加可能就有很大的问题。同样,历史地理信息也是如此,如果不同的人用不同的标准编制了各自的专题历史地理信息。在希望用这些不 同来源的信息进行比较时,很可能发现空间数据不能很好地叠加,甚至无从比较。显然,在历史地理信息方面需要有一些技术标准,或 称为数据平台,以便今后各种历史地理的专题信息可以准确地叠加和相互比较。CHGIS项目的另一个重要目的就是希望CHGIS数据成为这样一个 平台,为历史地理信息化的发展打下一个很好的基础。

2. 概况:

现阶段中国政区系统数据是使用国标代码系统表达省、市、 县一级的政区。以6位数字表达的国标代码同时也唯一的确定和表达了在中华人民共和国疆域内各 政区之间的隶属关系。但行政区域是随时间变化的,包括名称变化以及行政区域合并、分置、新 建、撤销等形成的界线变化。CHGIS数据模型的基本功能需要有机地描述这些变化,并允许用户按 他们需要的时间和地区重新组合数据库中的数据。此外,数据也需要具有跟踪一个行政单位地理形 态的前后变化过程和其本身变化对其他部分的影响。能按时间检索行政区域的变化是CHGIS空间- 时间数据库设计的基本概念。

3、方法:CHGIS数据模型发展有三个阶段。

CHGIS数据的模型涉及到时空数据模型的问题,即在原有空间三维数据的基础上,有增加了时间维度,形成四维的空间。由于时间在表达上与空间不一样,给数据管理和数据库结构都提出了新的问题,这个问题目前在GIS学界仍然是比较前沿的课题。CHGIS数据在时间维度上采用比较简单的离散时间表达方式。同时,我们在数据库的设计上采用渐进的方法,分为三个阶段。根据资料数据,以及我们在研究中对数据性质认识的加深,逐步采用不同的数据库表达方式。但这三个阶段的数据库方式是个连续的和有机的衔接,分阶段逐步过渡,最终完成我们的目标。

第一阶段:数据发表在chgis数据集 1.0版。该阶段的研究工作具有试验性质。 按三个区域编制数据:1、太湖周围地区,重新编制县界和按1:100万底图精度下,在县的范围内 编制村镇的点位置,所有记录有相应释文;2,上海地区(历史上的松江府),建立上海地区建 县以来所有府县界线和府县治所及村镇位置的连续时间变化序列,所有记录都有相应的释文。上海地区地区 数据也配置了基于MapInfo的查询工具,用于查询特定年份的政区和聚落变化情况; 3,除上述区域外的清朝1820年疆域的其他地区,资料主要依据谭其骧主编的《中国历史地图集》 (清时期卷)。数据格式具有工作表的形式,每一个行政单位直接列出所有的行政隶属关系。这个阶段的数据库结构将在以后的阶段中仍然保留为基础工作数据库的形式,因为直观和方便是它最大的长处。

第二阶:段将按数据记录的GIS属性编制到相应关系数据库中,利用每个记录 唯一的KEY_ID号与空间数据相联结。此阶段数据模型将加入表达地理要素时间变化的新数据。第 二阶段数据模型中的记录形式与第一阶段数据表中记录基本类似,但把每个行政单位的隶属关系 紧缩到一层,同时用“part-of”指示相应的隶属关系记录,以此达到减少数据冗余量的目的。 第二阶段数据模型的其他表格将包括地理要素的时间序列,以及与GIS空间数据联结关系的表格。

第三阶段:将建立完整的历史地理信息编码系统,并建立关联数据库连接该 项目的研制数据(包括空间数据、属性数据和文本数据),以及其他相关的其他来源数据。并开 发基于互联网载体和基于光盘载体的用户工具,方便用户从任何需要角度,查询CHGIS数据中的任何部分。