
城建档案是规划和自然资源管理的重要依据,以纸质著录扫描、数据独立应用为主要特征的档案利用模式,难以支撑“放管服”改革持续深化和数字政府建设水平持续提升。为此,广州市规划和自然资源局以天河区、海珠区、越秀区为试点范围,按照提取档案图片关键要素信息、建立档案“三全宗”、“三全宗”数据应用三个步骤,推进城建档案数据与政务服务的融合应用。
构建神经网络模型,高效提取档案图片关键要素信息。构建基于CRNN的神经网络模型,智能识别档案图片中关键要素,实现从档案图像输入到关键要素信息输出的自动化。解决传统数据化方式中依靠大量人工操作、成本高、效率低、准确性低等问题,高效完成试点范围170多万张城建档案图片中空间、单位、项目三个关键要素的信息提取,建立档案客体全宗。
图1 基于神经网络模型的关键信息提取流程
基于关键要素信息,建立城建档案“三全宗”。所谓“三全宗”是指空间全宗、单位全宗和项目全宗。空间全宗是通过建立档案空间信息,支持基于空间要素的融合与检索。单位全宗是聚合档案中所有法人单位及其涉及的档案形成的文件数据库,支持基于单位名称或代码的融合与检索。项目全宗是以地块为载体,以“建设用地规划许可证”或“建筑工程规划许可证”为锚点,整合地块涉及的所有城建档案信息形成的文件数据库,支持基于项目信息的融合与检索。截至目前,广州市规划和自然资源局已完成试点范围2000年至2018年规划类档案融合处理,建立51203个空间全宗、26137个单位全宗以及18211个项目全宗。
图2 “三全宗”含义
将“三全宗”纳入空间资源系统,支撑城建档案与政府服务的融合应用。“三全宗”作为一种高可信数据源纳入自然资源领域数据框架,并通过数据要素联结不同资源,通过系统建立关联单位的主体联盟,通过网络实现服务对象的关系联通,从而突破参数链接这一传统的档案利用模式,促进城建档案与规划和自然资源业务的融合应用,提升政府服务的信息化保障水平。
图3 城建档案数据与业务数据叠加