找回密码
 立即注册
查看: 51|回复: 6

葵花宝典:2021年12月CDGP真题解析

[复制链接]

656

主题

70

回帖

2291

积分

管理员

积分
2291
发表于 2025-11-9 14:21:26 | 显示全部楼层 |阅读模式
1.元宇宙订餐数据建模。(10分)(考点:CDM、LDM、订餐)
2.安全治理活动怎么开展?(10分)(考点:数据安全治理)
3.数据质量问题很多,但是解决困难。问题:1)数据质量问题的常见原因有哪些?2)数据质量问题管理和解决方案;(10分)(考点:DQ、DQ生命周期)
4.元数据管理治理叙述,提到生命周期,要求根据企业特点,综合考虑质量、成本,提供元数据治理方案;(10分)(考点:元数据治理、元数据生命周期)
5.主数据目标?主数据内容?主数据工具??(10分)(考点:主数据、MDM)
6.数仓和BI:3-5;参和主数据,数据架构:0-5;文件和内容管理、数据安全、数据集成和互操作:0-5;1)问当前目标和期望目标是否合理,为什么。2)画图说明要做的工作,关键建设内容,依赖关系,哪些可以并行;(10分)(考点:成熟度评估、主数据、非结构化数据、数据安全、DII、数据湖、数据仓库、BI)

回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-9 14:21:50 | 显示全部楼层
第一题 设计题:(考点:CDM、LDM、订餐)
一、问题简述
元宇宙订餐数据建模。(10分)(逻辑数据建模)。
二、问题解析
1.逻辑模型设计题是必考题,历史上的CDGP考试,每期都考。主题包括:零售、书店、餐厅、电影院和照相馆等。
2.逻辑模型设计题的答题思路是:先找实体和关系,后找属性和外键约束。
3.一般画出10-15个左右的主要实体及其关系即可。
三、参考答案
参考电商零售数据模型:
CDM:略
LDM:略
【另外,说明主要实体之间的关系】
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-9 14:22:03 | 显示全部楼层
第二题 论述题:(考点:数据安全治理)
一、问题简述
安全治理活动怎么开展?(10分)(数据安全治理)
二、问题解析
1.按照DAMA-DMBOK2中的数据安全章节的活动来回答
2.按照《穿越数据迷宫》的数据安全生命周期和活动来回答
三、参考答案
数据安全治理得需要有足够的资金支持,面向系统、企业内保持方案一致,建立安全战略等,主要包括:数据安全分析现状,数据安全活动、以及基于数据生命周期得数据安全管理三个维度。
1.在数据和信息安全实施过程中,首先要评估组织当前的数据状态,确定需要保护的数据范围。该过程包括以下步骤∶
(1)识别和分类敏感数据资产。根据行业和组织的不同,它们可能会有很少或很多的数据资产,而敏感数据范围涵盖身份识别、医疗和财务信息等方面。
(2)定位整个企业的敏感数据。安全要求可能会有所不同,这取决于数据的存储位置。如果敏感信息集中存储在一个地方,那么很有可能会由于单点违规导致所有数据泄露,形成较高风险。
(3)确定各项资产的保护方式。根据数据内容和技术类型,保证资产安全所需的措施因资产不同而不同。
(4)确认信息与业务流程的交互方式。需要对业务流程进行分析,以确定在何种条件下允许哪些人访问数据。
(5)除了对数据本身进行分类,还需要评估外部威胁,如来自黑客和犯罪分子的威胁,以及员工和流程带来的内部风险。大量数据的丢失和泄露都是由员工的无知导致的。员工的无知表现在,没有意识到信息是高度敏感的,或是违反安全规章的。
2.数据安全管理活动包括五个步骤:
(1)识别数据安全需求,包括业务需求和法规需求等;
(2)定义数据安全政策,包括企业安全政策、IT安全政策、数据安全政策等;
(3)定义数据安全标准,包括定义数据保密等级、定义数据法规类别、定义安全角色等;
(4)评估当前安全风险,识别风险的第一步是确定敏感数据的存储位置,以及这些数据需要哪些保护措施。对每个系统进行以下评估:1)存储或传送的数据敏感性。2)保护数据的要求。3)现有的安全保护措施。
(5)实施控制和规程,主要包括:1)分配保密等级,2)分配监管类别,3)管理和维护数据安全,4)管理安全政策合规性等活动。
3.数据安全生命周期和数据生命周期一样也包括如下阶段:
(1)规划:将数据与安全和隐私需求关联
(2)设计&启用:在系统中建立数据保护和安全措施
(3)创建/获取:对新数据进行分类,以便合理保护数据
(4)存储/维护:确保数据存储符合政策法规的要求
(5)使用:管理访问权限,以保证对数据的合理使用,防止滥用
(6)增强:在监管要求和识别新的安全威胁上保持领先
(7)处置:遵循有关政策和法规要求处理数据
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-9 14:22:17 | 显示全部楼层
第三题 论述题:(考点:DQ、DQ生命周期)
一、问题简述
数据质量问题很多,但是解决困难。问题:1)数据质量问题的常见原因有哪些?2)数据质量问题管理和解决方案;(10分)(数据质量、数据治理)
二、问题解析
1.数据质量问题来源5个方面;
2.数据质量和治理、元数据、主数据的相关性;
3.戴明环对数据质量管理的重要性;
4.数据质量生命周期管理。
5.注意:此题的参考答案比较前面,根据问题有针对性的应答即可。
三、参考答案
1.数据质量问题来源5个方面:
(1)缺乏领导力导致的问题
a.领导和员工缺乏意识
b.缺乏治理
c.缺乏领导力和管理能力
d.难以证明改进的合理性
e.测量价值的工具不合适或不起作用
(2)数据输入过程引起的问题
a.数据输入接口问题
b.列表条目放置
c.字段重载
d.培训问题
e.业务流程的变更
f.业务流程执行混乱
(3)数据处理功能引起的问题
a.有关数据源的错误假设
b.过时的业务规则
c.变更的数据结构
(4)系统设计引起的问题
a.未能执行参照完整性
b.未执行唯一性约束
c.编码不准确和分歧
d.数据模型不准确
e.字段重载
f.时间数据不匹配
g.主数据管理薄弱
h.数据复制
(5)解决问题引起的问题
a.手动数据修复
b.未经测试的代码
c.没有备份原始数据
2.数据质量问题的解决方法:
数据质量的好坏基于数据能够多大程度上满足数据消费者的需求。拥有一个完善的数据管理流程,有助于组织对标准和需求进行规范化和文档化,依此来测量数据质量。
(1)元数据定义了数据所代表的含义。数据管理专员和数据建模流程是元数据的重要来源。管理较好的元数据有助于数据质量的提升。元数据存储库可以存储数据质量的测量结果,从而在整个组织中共享,也便于数据质量团队参考并就问题优先级达成一致,促进问题解决。
(2)由于数据管质量理理念经常与数据治理保持一致。同时数据质量问题是开展企业级数据治理的主要原因,因此数据质量项目作为数据治理项目的一部分时,数据治理成效将更加显著。将数据质量工作纳入总体治理工作,可使得数据质量团队与如下这些利益相关方和推动者一起开展工作;
a.风险和安全人员,能够帮助识别与数据相关的组织漏洞。
b.业务流程工程师和培训人员,可以帮助团队实施流程改进,从而提高效率,产生更适合下游使用的数据。
c.业务和数据操作管理员及数据所有者,能够识别关键数据,定义标准和数据质量期望,设定数据问题整改优先级。
(3)组织可以通过如下途径加快数据质量工作的开展∶
a.设定优先级。
b.制定和维护与数据质量有关的标准和策略。
c.建立沟通和知识共享机制。
d.监控、汇报数据质量工作的执行效果和数据质量测量结果。
e.分享数据质量探查结果,以此来树立数据质量意识、发现数据质量提升的机会。
(4)数据质量也负有主数据管理和参考数据管理的责任。值得一提的是,主数据管理和参考数据管理是保证数据质量的两个很好的例子。仅仅将数据标记为"主数据",就意味着对其内容和可靠性有一定的目标要求。
3.数据质量和数据治理一样是一个组织的持续性工作,而非项目。戴明环/休哈特环被认为是解决质量问题的基本方法,即PDCA(计划、执行、检查、行动)循环。
(1)在“计划”阶段,数据质量团队评估已知问题的范围、影响、和优先级,并评估解决方案。该计划应基于对问题的根本原因进行分析的坚实基础。通过了解问题的原因和影响,可以了解成本/收益,确定优先级,并制定解决这些问题的基本计划。
(2)在“执行”阶段,DQ团队负责解决问题的根本原因并计划对数据进行持续监视。对于基于非技术流程的根本原因,DQ团队可以与流程所有者合作实施变更。对于需要技术变更的根本原因,DQ团队应与技术团队合作,以确保正确实施需求,并且技术变更不会引入错误。
(3)“检查”阶段包括主动监视根据需求测试得到的数据质量。只要数据满足定义的质量的阈值,就无需采取其他措施。这些流程将在控制之下并满足业务需求。但是,如果数据低于可接受的质量的阈值,则必须采取其他措施将其提高到可接受的水平。
(4)“行动”阶段的活动旨在处理和解决新出现的数据质量问题。评估问题原因并提出解决方案后,周期重新开始。通过开始新的周期可以实现持续的改进。
4.数据质量工作一般包括:
(1)定义高质量数据
(2)定义数据质量战略
(3)定义初始评估范围
(4)执行初始数据质量评估
(5)识别改进并排列优先级
(6)定义数据质量改进目标
(7)开发和部署数据质量操作等方面
5.数据质量生命周期和数据管理生命周期一致,都包括:创建或获取、存储或维护、处置、使用、增强、规划、设计和启用:
(1)在规划阶段,定义高质量数据的特征;
(2)在设计和启用阶段,定义系统和流程控制来规避数据问题产生,保持数据质量;
(3)在创建和获取阶段,测量或检查数据,确保数据满足质量要求;
(4)在存储和维护阶段,借助系统和流程检测数据,确保数据能够持续的满足期望;
(5)在使用阶段,使用反馈循环机制来持续提升数据的质量;
(6)在增强阶段,就数据质量提升机会采取行动;
(7)在处置阶段,基于数据质量要求正确地识别和提升数据。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-9 14:22:29 | 显示全部楼层
第四题 论述题:(考点:元数据治理、元数据生命周期)
一、问题简述
元数据管理治理叙述,元数据生命周期,要求根据企业特点,综合考虑质量、成本,提供元数据治理方案;(10分)(元数据治理、元数据生命周期)
二、问题解析
1.元数据生命周期;
2.元数据质量;
3.解决方案成本。
三、参考答案
1.元数据管理生命周期和数据管理生命周期一致,都包括:创建或获取、存储或维护、处置、使用、增强、规划、设计和启用:
(1)规划:定义元数据的需求
(2)设计&启用:将创建和管理元数据作为正在进行的数据管理活动的一部分
(3)创建/获取:确保创建元数据并满足质量要求
(4)存储/维护:确保元数据保持当前状态并继续满足需求
(5)使用:使用元数据,从数据中获取价值。启用反馈循环可以提高元数据质量
(6)增强:使用新知识增强现有的元数据,实现新的元数据需求
(7)处置:清除或归档过时的元数据
2.元数据管理的质量要求包括∶
(1)可靠性。认识到元数据通常是通过现有流程(数据建模、SDLC、业务流程定义)生成的,并让流程所有者对元数据的质量负责(在初始创建和维护中)。
(2)标准。对元数据标准进行设置、执行和审核,以简化元数据集成的复杂度,并使元数据具有可用性。
(3)改进。创建反馈机制,以便消费者可以向元数据管理团队报告不正确或过时的元数据。
(4)与其他数据一样,为了提高质量,元数据也可以进行归类和检查。对它的维护应该作为项目工作的可审计部分来安排或完成。
3.元数据治理方案
所有元数据管理解决方案都包含与元数据生命周期相对应的架构层次:
(1)元数据创建和采集。
(2)元数据在一个或多个存储库中存储。
(3)元数据集成。
(4)元数据交付。
(5)元数据使用。
(6)元数据控制和管理。
可以采用不同的架构方法获取、存储、集成和维护元数据,供数据消费者访问元数据。
4.元数据解决方案架构
元数据构架应该为所需的元数据提供一个单一的访问点。元数据构架的设计取决于组织的特定需求。构建通用元数据存储库的4种技术构架方法和数据仓库的设计方法相差不多∶
(1)集中式。集中的元数据构架由一个元数据存储库组成,该存储库包含来自不同源的元数据的副本。拥有有限IT资源的组织,或者那些寻求尽可能自动化的组织,一般不会选择这种架构。在公共元数据存储库中寻求高度一致性的组织,可以从集中式元数据构架中获益。
(2)分布式。一个完全分布式的元数据构架只有单个接入点。元数据检索引擎通过检索源数据来实时响应用户请求;没有现成的元数据的永久存储库。在这个体系构架中,元数据管理环境用以维护必要的源系统目录和查找信息,以有效地处理用户查询和搜索。源系统可以通过公共对象请求代理或者类似的中间件协议软件来访问。
(3)混合式。混合架构结合集中式和分布式体系结构的特性。元数据仍然直接从源系统中抽取并进入集中式存储库。然而,存储库设计只考虑用户添加的元数据、关键标准化项目和手动添加的元数据。
(4)双向式。这是另一种高级架构方法是双向元数据架构,它允许元数据在架构的任何部分(源、数据集成、用户界面)中进行更改,然后将变更从存储库(代理)同步到其原始源以实现反馈。这种方法显然存在各种挑战。该设计强制元数据存储库包含最新版本的元数据源,并强制对源的更改管理,必须系统地捕获变更,然后加以解决;必须构建和维护附加的一系列处理接口,以将存储库的内容回写至元数据源。
5.元数据治理解决方案的四种架构方面考虑成本:
(1)集中式。需要基础设施和基础软件的投入,还需要ETL等开发和维护过程,以及数据转换和集成过程等,成本较高。
(2)分布式。不需要大量的基础设施和基础软件投入,但需要开发一个集中注册门户,没有ETL等开发和维护过程,投入相对较低。
(3)混合式/双向式是高级模式,需要基础设施和基础软件的大量投入,以及ETL和数据同步开发和维护工作,成本更高,不建议一般企业采用此模式。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-9 14:22:40 | 显示全部楼层
第五题 论述题:(考点:主数据、MDM)
一、问题简述
主数据目标?主数据内容?主数据工具??(10分)(主数据)
二、问题解析
1.主数据管理的目标;
2.主数据的类型和举例;
3.主数据管理工具和MDM;
三、参考答案
1.主数据管理的目标包括:
(1)确保组织在各个流程中都拥有完整、一致、最新且权威的参考数据和主数据。
(2)促使企业在各业务单元和各应用系统之间共享参考数据和主数据。
(3)通过采用标准的、通用的数据模型和整合模式,降低数据使用和数据整合的成本及复杂性。
2.主数据管理包括以下几个基本步骤∶
(1)确定提供主数据实体全面视图的候选源信息。
(2)建立精确匹配和合并实体实例的规则。
(3)建立识别和恢复不恰当匹配与合并数据的方法。
(4)建立向整个企业系统分发可信数据的方法。
3.主数据是有关为业务事务和分析提供上下文的业务实体(例如,员工、客户、产品、财务结构、资产、和位置)的数据。实体是现实世界的对象(人、组织、地点、或事物)。实体由实体实例以数据和记录的形式表示。主数据应代表有关关键业务实体的权威的、最准确的数据。如果管理得当,则可以信任主数据值,并且可以放心使用它们。业务规则通常规定主数据值的格式和允许的范围。常见的组织主数据包括有关以下数据:
(1)当事人主数据:由个人和组织及其角色组成,例如客户、公民、患者、销售商、供应商、代理商、业务合作伙伴、竞争对手、员工、或学生
(2)产品和服务主数据:内部和外部的产品和服务
(3)财务结构主数据:例如合同、总分类帐、成本中心、或利润中心
(4)位置主数据:例如地址和GPS坐标
4.主数据分类包括:参与方主数据、财务主数据、法律主数据、产品主数据、位置主数据、行业主数据(参考目录)等。
5.主数据工具包括:MDM(主数据管理)需要专门设计用于启用识别管理的工具。另外可以通过数据集成工具、数据修补工具、运营数据存储(ODS)、数据共享中心(DSH)、或专用MDM应用程序来实现主数据管理。主数据管理平台(MDM的设计:
(1)作为主数据管理平台(MDM)需要全面关注主数据标准、主数据质量、主数据架构、以及用户的消费需求。在建设主数据平台之前,需要先调研组织的数据情况,即盘点组织数据并建立组数据数据的目录。
(2)建立主数据管理平台(MDM),统一管理组织主数据。一般的主数据平台都是采用中心辐射架构,即将组织各部门的业务系统中的主数据全部采集的主数据平台进行管理,也包括主数据目录管理。并对组织的集中主数据执行标准规则校验、清洗、增强、整合等。
(3)主数据管理平台(MDM)还需提供统一的标准的数据访问接口,设置针对角色和用户的权限功能,确保最小够用原则。可以通过建立数据访问试图、DaaS等技术来提高数据安全性。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-9 14:22:56 | 显示全部楼层
第六题 设计题:(考点:成熟度评估、架构、DII)
一、问题简述
数仓和BI,3-5;参考和主数据,数据架构,0-5;文件和内容管理、数据安全、数据集成和互操作,0-5;问题:当前目标和期望目标是否合理,为什么。画图说明要做的工作,关键建设内容,依赖关系,哪些可以并行;(10分)(主数据、非结构化数据、数据安全、DII、数据湖、数据仓库、BI)
二、问题解析
1.目标是否合理主要看依赖关系、当前的基础、以及周期长短等因素;
2.DMBOK中的DW/BI和大数据概念架构图,给出了主要的依赖关系;
3.知识领域之间的关系,艾肯金字塔。
三、参考答案
1.三组六个知识领域的目标合理性说明如下:
(1)数据架构目标(0-5)不合理。数据架构是组织的数据总蓝图,并依赖组织变更和数据治理等。数据架构需要进行总体规划和分步实施,项目中有时为了阶段性目标,难免背负数据/技术债务,数据架构5级目标是个长期持续的过程,不能一蹴而就。综上目标不合理。
(2)数据安全目标(0-5)不合理。领域目标主要在组织内部,但数据安全强烈依赖数据架构,因此在数据架构达到5级之前,数据安全很难达到5级。因此数据安全目标不合理。
(3)数据集成和互操作目标(0-5)合理。领域目标主要在组织内部,虽然该领域也依赖数据架构、数据安全、文档和内容、参考和主数据、DW/BI等,但是都不是强依赖,DII相对独立性较强,因此目标可以实现。
(4)文档和内容管理目标(0-5)合理。领域目标都在组织内部,而且影响范围可控,相对比较独立。虽然该领域也依赖数据架构,但并不是强依赖。但对DII的依赖比较强烈,而DII的目标(0-5)可以达成,因此目标可以实现。
(5)参考和主数据目标(0-5)不合理。参考数据和主数据所依赖的DII可以实现目标,但是RMD受到历史和现状以及外部数据环境的影响比较大,只有全面改变历史和外部数据环境才可能达到5级。因此目标(5级别)不合理。
(6)DW/BI目标(3-5)不合理。领域目标主要在组织内部,而且影响范围可控,同时当前也有一定的基础(3级),目标原本是可以实现的。但本领域对参考数据和主数据,以及数据架构有较强的依赖关系,在上述两个领域达到5级之前,DW/BI不能或者说很难达到5级。
2.关键工作的依赖关系和并行关系图和分析如下:
(1)数据架构和数据安全是组织总体的设计,数据安全强依赖数据架构。因此先有数据架构、后做数据安全。
(2)DII相对比较独立可以与(1)中的工作并行开展。
(3)文档和内容、参考和主数据、DW/BI三者无依赖关系,可并行。但这三者都在一定程度上依赖DII,可以在DII开展一段时间取得一定成果之后,与之并行开展工作。
综上最关键建设内容是数据架构,其次是数据安全和DII。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 06:35 , Processed in 0.101324 second(s), 19 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表