找回密码
 立即注册
查看: 20|回复: 6

葵花宝典:2022年07月CDGP真题解析

[复制链接]

656

主题

70

回帖

2291

积分

管理员

积分
2291
发表于 5 天前 | 显示全部楼层 |阅读模式
1.建模:照相馆(摄影拍照,影楼,套餐,化妆师,外拍,上门服务等)
2.元数据:(1)元数据管理不善带给企业的影响(风险);(2)结合企业情况设计元数据架构(设计元数据管理系统)
3.主数据:(1)设计主数据管理系统(设计主数据管理系统的功能)(主数据核心功能);(2)主数据管理系统与业务系统的集成的影响(主数据和业务系统的关系)
4.数据质量:提高数据质量的管理措施及过程(数据质量的活动)
5.DW&BI: 数据仓库/商务智能和大数据概念架构图
6.数据安全:(1)企业应该具备什么样的数据安全能力;(2)哪些个人隐私数据需要脱敏处理;(3)数据脱敏的常用方法

回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 5 天前 | 显示全部楼层
第一题 设计题:(考点:CDM、LDM、照相馆)
一、问题简述
建模:照相馆建模(摄影拍照,影楼,套餐,化妆师,外拍,上门服务等)评价(10分)(逻辑数据建模)
二、问题解析
1.逻辑模型设计题是必考题,历史上的CDGP考试,每期都考。主题包括:零售、书店、餐厅、电影院和照相馆等。
2.逻辑模型设计题的答题思路是:先找实体和关系,后找属性和外键约束。
3.一般画出10-15个左右的主要实体及其关系即可。
三、参考答案
CDM:略
LDM:略
【另外,说明主要实体之间的关系】
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 5 天前 | 显示全部楼层
第二题 论述题:(考点:元数据、元数据架构)
一、问题简述
元数据:(1)元数据管理不善带给企业的影响(风险);(2)结合企业情况设计元数据架构(设计元数据管理系统)
二、问题解析
1.元数据是数据治理的基础,展开描述;
2.阐述元数据治理架构,在根据场景选择一个合适的架构。
三、参考答案
1.元数据是对数据的技术属性和业务属性进行描述的解释说明的数据,是数据治理的基础和核心。可以说没有元数据,组织将无法开展数据治理和数据质量等相关数据管理工作。没有管理良好的元数据,数据湖将变成数据沼泽。没有科学合理的元数据管理规划实施,数据质量将无从谈起,数据将不具备完整性、可用性、有效性、及时性、唯一性等可度量特征。
2.元数据架构包括:集中式、分布式、混合式、双向式。在集中式中,元数据统一存储和管理,可以对元数据进行必要的修正和增加,以及元数据质量的验证等,读写效率也是最高的。在分布式中,元数据存储在各自的存储库中,通过统一的注册表进行检索和访问控制,分布式的最大优势是元数据的及时性,但数据的一致性、整合、和标准等方面存在缺陷,且元数据质量问题不能得到很好的解决。在混合式中,兼具集中式和分布式的优点和缺点。在双向式中,元数据集中存储,并可以对元数据源进行必要的修改和增强,但架构设计和实现最为复杂,而且还存在一定的权责问题,需要谨慎使用。
注意:【根据场景的描述选择一个合适的架构进行设计。并规定元数据标准和规范等方面。】
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 5 天前 | 显示全部楼层
第三题 论述题:(考点:主数据、和业务系统的关系)
一、问题简述:
主数据:(1)设计主数据管理系统(设计主数据管理系统的功能)(主数据核心功能);(2)主数据管理系统与业务系统的集成的影响(主数据和业务系统的关系)
二、问题解析:
1.主数据是共享数据;
2.主数据系统是中心化的权威的参考系统。
三、参考答案:
1.主数据是一个组织中跨越部门、跨越业务、跨越系统的核心业务实体数据,主数据为业务交易提供上下文,同时也需要参考数据作为上下文。主数据实例包括相关方主数据、财务主数据、法律主数据、产品主数据、位置主数据、行业主数据等分类。
主数据是在组织间移动的核心实体数据,需要有统一的数据标准,才能确保数据可以在各业务系统和部门之间交换、共享和共用。可以参考国际、国内、行业等标准指定组织内部的主数据标准,并使用统一的数据标准要求和监控各业务系统的IT建设,实现以数据为中心数据系统开发工作。
2.主数据系统是一个可信单一数据源系统,作为权威参考系统为业务系统提供可靠数据,同时主数据系统还将业务系统作为数据源,获取及时、最新的主数据,并通过主数据解析过程整合主数据。
主数据与参考数据一样,也是共享资源。主数据是有关业务实体(如雇员、客户、产品、供应商、财务结构、资产和位置)的数据,这些实体为业务交易和分析提供关联环境。实体是现实世界的对象(如人、组织、地点或事物)。实体以数据/记录的形式表示。主数据应是代表关键业务实体权威的、最准确的可用数据。管理良好的主数据的值是可信的。可以放心使用。
主数据管理(Master Data Management,MDM)需要控制主数据值和标识符,以便在整个系统中对有关基本业务实体的最准确和及时的数据进行一致的使用。这些目标包括确保提供准确的当前值,同时减少出现模棱两可的标识符的风险。
3.主数据管理平台(MDM)的设计:
(1)作为主数据管理平台(MDM)需要全面关注主数据标准、主数据质量、主数据架构、以及用户的消费需求。在建设主数据平台之前,需要先调研组织的数据情况,即盘点组织数据并建立组数据数据的目录。
(2)建立主数据管理平台(MDM),统一管理组织主数据。一般的主数据平台都是采用中心辐射架构,即将组织各部门的业务系统中的主数据全部采集的主数据平台进行管理,也包括主数据目录管理。并对组织的集中主数据执行标准规则校验、清洗、增强、整合等。
主数据管理平台(MDM)还需提供统一的标准的数据访问接口,设置针对角色和用户的权限功能,确保最小够用原则。可以通过建立数据访问试图、DaaS等技术来提高数据安全性。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 5 天前 | 显示全部楼层
第四题 论述题:(考点:DQ、活动、生命周期)
一、问题简述:
数据质量:提高数据质量的管理措施及过程(数据质量的活动)
二、问题解析:
1.数据质量活动或者数据质量生命周期活动
三、参考答案:
1.数据质量管理活动包括如下7个步骤:
(1)定期高质量数据
(2)定义数据质量战略
(3)识别关键数据和业务规则,包括:
①识别关键数据
②识别已有规则和模式
(4)执行初始数据质量评估,包括:
①确定问题并排定优先顺序
②执行问题根本原因分析
(5)确定改进方向并排定优先顺序,包括:
①根据业务影响确定行动的优先级
②制定预防和纠正措施
③确认计划的行动
(6)定义数据质量改进目标
(7)开发和部署数据质量操作
①开发数据质量操作规程
②修正数据质量缺陷
③度量和监控数据质量
④报告数据质量水平和调查结果
2.数据质量生命周期活动包括:
(1)规划:定义高质量数据的特征
(2)设计&启用:定义系统和流程控制来规避数据问题产生,保持数据质量
(3)创建/获取:测量或检查数据,确保数据满足质量要求
(4)存储/维护:借助系统和流程检测数据,确保数据能够持续的满足期望
(5)使用:使用反馈循环机制来持续提升数据的质量
(6)增强:就数据质量提升机会采取行动
(7)处置:基于数据质量要求正确地识别和提升数据
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 5 天前 | 显示全部楼层
第五题 设计题:(考点:DW、BI、大数据)
一、问题简述:
DW&BI:数据仓库/商务智能和大数据概念架构图
二、问题解析:
概念性DW/BI和大数据架构。
三、参考答案:
1.结构化数据通过ETL过程进入缓冲区;处理后进入MDM和中心仓库;中心仓库包括ODS、DM、和数据立方体;
2.非结构化数据通过ELT过程进入数据湖,进行数据集成、数据探索、和模型评估等;
3.数据仓库和数据湖整合数据提供各类分析能力,包括描述分析、预测分析、规范分析、机器学习和数据可视化等。
4.大数据处理结果作为数据仓库的数据源,数据仓库也作为大数据的数据源。
概念性DW/BI和大数据架构图如下:略
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 5 天前 | 显示全部楼层
第六题 简答题:(考点:安全能力、隐私、脱敏)
一、问题简述:
数据安全:(1)企业应该具备什么样的数据安全能力;(2)哪些个人隐私数据需要脱敏处理;(3)数据脱敏的常用方法
二、问题解析
1.信息安全、网络安全、数据安全、和系统安全等;
2.个人信息、敏感信息、法律规定的信息等;
3.主要考察9种脱敏方法。
三、参考答案
1.数据安全能力包括:
(1)信息安全,包括:脆弱性、威胁、风险、风险等级、数据安全组织、安全流程、数据完善性、加密、混淆/脱敏;
(2)网络安全,包括:后门、机器人/僵尸、Cookie、防火墙、边界、DMZ、超级用户账户、键盘记录器、渗透测试、虚拟专用网(VPN);
(3)数据安全,包括:设施安全、设备安全、凭据安全、电子通信安全。
(4)系统安全,包括:滥用过多权力、滥用合法权力、未经授权的特权升级、服务账户或共享账户滥用、平台入侵攻击、SQL注入漏洞、默认密码、备份数据滥用。
2.如下的个人数据应该进行脱敏或处理,包括:
(1)个人识别信息(PII);
(2)对财务敏感的数据;
(3)医学敏感数据(MSD)/个人健康信息(PHI);
(4)教育记录;
(5)以及中国的个人隐私相关数据;
3.数据脱敏的常用方法包括:
可通过混淆处理(变得模糊或不明确)或脱敏(删除、打乱或以其他方式更改数据的外观等)的方式来降低数据可用性,同时避免丢失数据的含义或数据与其他数据集的关系。
数据混淆或脱敏是解决数据使用过程中的一种安全手段。数据脱敏分为两种类型:静态脱敏和动态脱敏。
可以脱敏或混淆数据的方法有以下几种:
(1)替换。将字符或整数值替换为查找或标准模式中的字符或整数值。例如,可以用列表中的随机值替换名字。
(2)混排。在一个记录中交换相同类型的数据元素或者在不同行之间交换同一属性的数据元素。例如,在供应商发票中混排供应商名称,以便将发票上的原始供应商替换为其他有效供应商。
(3)时空变异。把日期前后移动若干天(小到足以保留趋势),足以使它无法识别。
(4)数值变异。应用一个随机因素(正负一个百分比,小到足以保持趋势),重要到足以使它不可识别。
(5)取消或删除。删除不应出现在测试系统中的数据。
(6)随机选择。将部分或全部数据元素替换为随机字符或一系列单个字符。
(7)加密技术。通过密码代码将可识别、有意义的字符流转换为不可识别的字符流。
(8)表达式脱敏。将所有值更改为一个表达式的结果。例如,用一个简单的表达式将一个大型自由格式数据库字段中的所有值(可能包含机密数据)强制编码为“这是个注释字段”。
(9)键值脱敏。指定的脱敏算法/进程的结果必须是唯一且可重复的,用于数据库键值字段(或类似字段)脱敏。这种类型脱敏对用于测试需要保持数据在组织范围内的完整性极为重要。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 05:46 , Processed in 0.107690 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表