找回密码
 立即注册
查看: 53|回复: 6

葵花宝典:2021年10月CDGP真题解析

[复制链接]

656

主题

70

回帖

2291

积分

管理员

积分
2291
发表于 2025-11-8 11:31:20 | 显示全部楼层 |阅读模式
1.电影院订票系统数据建模。(10分)(考点:CDM、LDM、电影院)
2.对于一个RBAC基于角色的权限控制的系统,请基于SaaS平台,设计一个架构。(10分)(考点:数据存储与操作/数据安全)
3.保险公司需要对事故进行分析,汽车驾驶场景,企业原来是T+1模式,但是现在需求要实时采集数据来判断突然变道还是刹车失灵等。其他第三方外部系统保持不变是T+1。请你设计一个解决方案。(10分)(考点:大数据、Lambda架构)
4.场景:企业元数据管理必要性,需要你设计治理解决方案。(10分)(考点:元数据治理)
5.场景:主数据管理混乱,需要你治理主数据。问题:什么是主数据?主数据的标准体系?你作为项目经理怎么治理主数据解决方案?(10分)(考点:主数据治理、数据标准、MDM)
6.1问:数据质量管理的工作包括哪些?(5分)第2问:数据生命周期包括创建或获取、存储或维护、处置、使用、增强、计划、设计和赋能,就数据生命周期的七个活动,论述数据质量管理工作如何开展。(5分)(考点:DQ、DQ生命周期)

回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-8 11:31:50 | 显示全部楼层
第一题 设计题:(考点:CDM、LDM、电影院)
一、问题简述
电影院订票系统数据建模。
二、问题解析
1.逻辑模型设计题是必考题,历史上的CDGP考试,每期都考。主题包括:零售、书店、餐厅、电影院和照相馆等。
2.逻辑模型设计题的答题思路是:先找实体和关系,后找属性和外键约束。
3.一般画出10-15个左右的主要实体及其关系即可。
三、参考答案
CDM:略
LDM:略
【另外,说明主要实体之间的关系】
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-8 11:32:26 | 显示全部楼层
第二题 论述题:(考点:数据存储与操作)
一、问题简述
对于一个RBAC基于角色的权限控制的系统,请基于SaaS平台,设计一个架构。
二、问题解析
1.RBAC:Role-Based Access Control。基于角色的访问控制(RBAC)是实施面向企业安全策略的一种有效的访问控制方式。
2.SaaS即软件即服务,基于SaaS的架构可以不用考虑基础设施,主要关注于业务功能即可。
三、参考答案
1.RBAC:Role-Based Access Control。基于角色的访问控制(RBAC)是实施面向企业安全策略的一种有效的访问控制方式。
图:略
RBAC架构采用3层架构,如图所示,从左到右包括用户层、角色层和权限层。用户不直接赋予权限,而是通过角色关联权限。各层之间均为多对多关系,即用户可以具有多种角色,角色可以属于多个用户,角色可以具有多个权限,权限可以属于多个角色。通过此方法进行设计,可以减少用户、角色的数量,降低对用户权限赋予、回收的复杂度。
2.基于SaaS的RBAC业务架构设计参考上图。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-8 11:32:44 | 显示全部楼层
第三题 设计题:(考点:大数据、Lambda架构)
一、问题简述
场景:保险公司需要对事故进行分析,汽车驾驶场景,企业原来是T+1模式,但是现在需求要实时采集数据来判断突然变道还是刹车失灵等。其他第三方外部系统保持不变是T+1。请你设计一个解决方案。
二、问题解析
1.Lambda架构。
2.结合大数据技术设计解决方案。
三、参考答案
本场景是典型的Lambda架构,包括数据源、速度层、批处理层、和服务层。架构图如下:
图:略
本架构中,车辆实时数据可以采用flume和kafka等实时数据采集组件获取,并采用flink或者sparkstreaming等实时数据处理框架进行处理;第三方批量数据可以采用Kettle、datax等产品定时获取,并通过hive、impala、sparksql等计算框架进行批量计算;实时和批量数据处理完成后,全部汇总到保险理赔业务系统进行整合,以支撑业务操作。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-8 11:32:54 | 显示全部楼层
第四题 论述题:(考点:元数据治理)
一、问题简述
场景:企业元数据管理必要性,设计元数据治理解决方案。
二、问题解析
1.元数据是数据治理的基础,展开描述;
2.阐述元数据治理架构,在根据场景选择一个合适的架构。
三、参考答案
1.元数据是对数据的技术属性和业务属性进行描述的解释说明的数据,是数据治理的基础和核心。可以说没有元数据,组织将无法开展数据治理和数据质量等相关数据管理工作。没有管理良好的元数据,数据湖将变成数据沼泽。没有科学合理的元数据管理规划实施,数据质量将无从谈起,数据将不具备完整性、可用性、有效性、及时性、唯一性等可度量特征。
2.元数据架构包括:集中式、分布式、混合式、双向式。在集中式中,元数据统一存储和管理,可以对元数据进行必要的修正和增加,以及元数据质量的验证等,读写效率也是最高的。在分布式中,元数据存储在各自的存储库中,通过统一的注册表进行检索和访问控制,分布式的最大优势是元数据的及时性,但数据的一致性、整合、和标准等方面存在缺陷,且元数据质量问题不能得到很好的解决。在混合式中,兼具集中式和分布式的优点和缺点。在双向式中,元数据集中存储,并可以对元数据源进行必要的修改和增强,但架构设计和实现最为复杂,而且还存在一定的权责问题,需要谨慎使用。
注意:【根据场景的描述选择一个合适的架构进行设计。并规定元数据标准和规范等方面。】
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-8 11:33:02 | 显示全部楼层
第五题 论述题:(考点:主数据治理、数据标准、MDM)
一、问题简述
场景:主数据管理混乱,需要你治理主数据。问题:什么是主数据?主数据的标准体系?你作为项目经理怎么治理主数据解决方案?
二、问题解析
1.主数据的定义和分类;
2.主数据需要数据标准;
3.MDM的设计方案。
三、参考答案
1.主数据是一个组织中跨越部门、跨越业务、跨越系统的核心业务实体数据,主数据为业务交易提供上下文,同时也需要参考数据作为上下文。主数据实例包括相关方主数据、财务主数据、法律主数据、产品主数据、位置主数据、行业主数据等分类。
2.主数据是在组织间移动的核心实体数据,需要有统一的数据标准,才能确保数据可以在各业务系统和部门之间交换、共享和共用。可以参考国际、国内、行业等标准指定组织内部的主数据标准,并使用统一的数据标准要求和监控各业务系统的IT建设,实现以数据为中心数据系统开发工作。
3.作为项目经理需要全面关注主数据标准、主数据质量、主数据架构、以及用户的消费需求。
(1)在建设主数据平台之前,需要先调研组织的数据情况,即盘点组织数据并建立组数据数据的目录。
(2)建立主数据管理平台,统一管理组织主数据。一般的主数据平台都是采用中心辐射架构,即将组织各部门的业务系统中的主数据全部采集的主数据平台进行管理,也包括主数据目录管理。并对组织的集中主数据执行标准规则校验、清洗、增强、整合等。
(3)主数据管理平台还需提供统一的标准的数据访问接口,设置针对角色和用户的权限功能,确保最小够用原则。可以通过建立数据访问视图、DaaS等技术来提高数据安全性。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-8 11:33:14 | 显示全部楼层
第六题 论述题:(考点:DQ、DQ生命周期)
一、问题简述
第1问:数据质量管理的工作包括哪些?(5分)第2问:数据生命周期包括创建或获取、存储或维护、处置、使用、增强、规划、设计和启用,就数据生命周期的七个活动,论述数据质量管理工作如何开展。(5分)
二、问题解析
1.戴明环被认为是解决质量问题的基本方法;
2.数据质量生命周期活动描述。
三、参考答案
1.数据质量和数据治理一样是一个组织的持续性工作,而非项目。戴明环/休哈特环被认为是解决质量问题的基本方法,即PDCA(计划、执行、检查、行动)循环。
(1)在“计划”阶段,数据质量团队评估已知问题的范围、影响、和优先级,并评估解决方案。该计划应基于对问题的根本原因进行分析的坚实基础。通过了解问题的原因和影响,可以了解成本/收益,确定优先级,并制定解决这些问题的基本计划。
(2)在“执行”阶段,DQ团队负责解决问题的根本原因并计划对数据进行持续监视。对于基于非技术流程的根本原因,DQ团队可以与流程所有者合作实施变更。对于需要技术变更的根本原因,DQ团队应与技术团队合作,以确保正确实施需求,并且技术变更不会引入错误。
(3)“检查”阶段包括主动监视根据需求测试得到的数据质量。只要数据满足定义的质量的阈值,就无需采取其他措施。这些流程将在控制之下并满足业务需求。但是,如果数据低于可接受的质量的阈值,则必须采取其他措施将其提高到可接受的水平。
(4)“行动”阶段的活动旨在处理和解决新出现的数据质量问题。评估问题原因并提出解决方案后,周期重新开始。通过开始新的周期可以实现持续的改进。
2.数据质量工作一般包括:
(1)定义高质量数据
(2)定义数据质量战略
(3)定义初始评估范围
(4)执行初始数据质量评估
(5)识别改进并排列优先级
(6)定义数据质量改进目标
(7)开发和部署数据质量操作等方面
3.数据质量生命周期和数据管理生命周期一致,都包括:创建或获取、存储或维护、处置、使用、增强、规划、设计和启用:
(1)在规划阶段,定义高质量数据的特征;
(2)在设计和启用阶段,定义系统和流程控制来规避数据问题产生,保持数据质量;
(3)在创建和获取阶段,测量或检查数据,确保数据满足质量要求;
(4)在存储和维护阶段,借助系统和流程检测数据,确保数据能够持续的满足期望;
(5)在使用阶段,使用反馈循环机制来持续提升数据的质量;
(6)在增强阶段,就数据质量提升机会采取行动;
(7)在处置阶段,基于数据质量要求正确地识别和提升数据。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 03:07 , Processed in 0.101177 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表