|
数据资源目录是依据规范的元数据描述,对企业数据资产进行逻辑集中管理的一种方式。通过编目形成的数据资源目录中含有各种数据资源的描述信息,便于用户对数据资源的检索、定位和获取,并提供数据资源显性化的应用入口,真正实现数据的可见、可管和可用。 基于数据资源目录的对外服务,主要是面向企业数据的使用方进行企业数据的访问、获取等,包括用户对元数据的统一检索,以及对数据的查询服务等。其数据服务形式包括数据使用者直接登录平台进行数据访问、第三方系统通过接口等方式进行数据获取等。各种访问方式均受平台统一的权限控制,需要进行访问申请。 编制数据资源目录是启动数据资源共享与开放服务的第一项任务,本阶段的工作成果是后续各项工作的基础。总体来看,面向共享与开放服务的数据资源目录编制工作包括以下内容: 1.研究数据资源梳理方法。对当前企业现有数据资源进行分析和梳理,制定共享与开放数据资源梳理的流程和方法,包括梳理目标、梳理范围、梳理原则、组织形式、流程步骤、工作要求等。 2.编制数据资源目录。按照企业制定的相关数据标准,如元数据标准、数据共享与开放管理标准等,开展企业数据资源的梳理,形成用于共享与开放的数据资源目录。 3.分析数据集的元数据。针对每一个数据集,分析相关元数据信息,包括但不限于数据集编号、数据集名称、数据集类型(结构化、非结构化、半结构化)、数据集摘要、数据集关键字、数据领域、主题分类、数据更新频度、数据提供方单位、数据提供方地址、数据提供方联系方式等。 4.确定数据集的数据逻辑模型。数据逻辑模型包括数据项英文名称、数据项中文名称、数据项类型、数据项大小、可否为空、是否主键等。 5.确定数据集的采集方式。要确定每个数据集通过何种方式进行数据采集,例如,从生产系统采集、从数据中心采集、人工采集上传数据等。 【出处】祝守宇,蔡春久 等著.数据治理——工业企业数字化转型之道.电子工业出版社,2020年11月第1版.
|