找回密码
 立即注册
查看: 61|回复: 6

葵花宝典:2021年06月CDGP真题解析

[复制链接]

656

主题

70

回帖

2291

积分

管理员

积分
2291
发表于 2025-11-6 12:24:06 | 显示全部楼层 |阅读模式
1.某书店[此处省略一百字]。问题:依据顾客等级、书籍折扣、书籍分类、购物车、付款类型、顾客信息、优惠卷等描述,建立逻辑数据模型(LDM)。(10分)(考点:CDM、LDM、书店(电商平台))
2.某企业[此处省略二百字]。问题:企业已建立了多年的元数据系统,该系统有对外接口,且元数据质量不高,如何解决元数据质量不高的问题?(10分)(考点:MD、DQ)
3.某企业[此处省略三百字]需要构建分析系统,使用数据仓库实现报表制作和深度分析,国家会议中提倡使用数据仓库和BI或者大数据解决方案,请给出系统架构设计方案。(10分)(考点:DW/BI、大数据)
4.某企业[此处省略四百字],需要进行个人信息安全评估。问题:1)信息安全评估流程是什么;2)简述个人信息安全关键点包括哪些?画图或描述;3)简述个人信息安全评估和管理的重要性。(10分-3/3/4)(考点:信息安全、隐私)
5.某企业[此处省略五百字],1)主数据管理的7个活动排序;2)主数据管理的关键点是什么?(10分-5/5)(考点:MDM)
6.某企业[此处省略六百字]。要解决数据仓库和BI的性能问题,即一天的数据需要26小时才能分析完成。问题:1)如何再确保BI功能的前提下提高性能?2)源数据(包括外部数据)质量有问题怎么办?(10分-5/5)(考点:DW/BI、大数据、DQ)

回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-6 12:24:36 | 显示全部楼层
第一题 设计题:(考点:CDM、LDM、网上书店)
一、问题简述
某书店[此处省略一百字]。问题:依据顾客等级、书籍折扣、书籍分类、购物车、付款类型、顾客信息、优惠卷等描述,建立逻辑数据模型(LDM)。
二、问题解析
1.逻辑模型设计题是必考题,历史上的CDGP考试,每期都考。主题包括:零售、书店、餐厅、电影院和照相馆等。
2.逻辑模型设计题的答题思路是:先找实体和关系,后找属性和外键约束。
3.一般画出10-15个左右的主要实体及其关系即可。
三、参考答案
CDM:略
LDM:略
【另外,说明主要实体之间的关系】
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-6 12:24:55 | 显示全部楼层
第二题 论述题:(考点:MD、DQ)
一、问题简述
某企业[此处省略二百字]。问题:企业已建立了多年的元数据系统,该系统有对外接口,且元数据质量不高,如何解决元数据质量不高的问题?
二、问题解析
1.历史遗留元数据问题;
2.元数据质量问题。
三、参考答案
1.在管理元数据的质量时,我们需要认识到许多元数据是通过现有的过程产生的。例如,数据建模过程生成表和列的定义,以及创建数据模型所必需的其他元数据。为了获得高质量的元数据,元数据应该被视为这些过程的交付物,而不是副产品。
同样,元数据遵循数据生命周期。可靠的元数据从计划开始,随着使用、维护和增强而增加价值。元数据源,如数据模型、源到目标的映射文档、ETL(抽取、转换和加载)日志等应该被视为数据源。它们应该将过程和控件放在适当的位置,以确保生产出可靠、可用的数据产品。
所有的过程、系统和数据都需要某种程度的元信息,即对它们的组成部分及工作方式进行描述。最好计划如何创建或收集这些信息。此外,随着过程、系统或数据的使用,元信息会不断积累和变化,需要不断地进行维护和加强。元数据的使用常常带来对附加元数据的识别要求。例如,销售人员使用来自两个不同系统的客户数据,可能需要知道数据起源于哪里,以便更好地了解客户。
通过元数据管理的几个一般原则,我们可以看到基于质量要求管理元数据的方法∶
(1)可靠性。认识到元数据通常是通过现有流程(数据建模、SDLC、业务流程定义)生成的,并让流程所有者对元数据的质量负责(在初始创建和维护中)。
(2)标准。对元数据标准进行设置、执行和审核,以简化元数据集成的复杂度,并使元数据具有可用性。
(3)改进。创建反馈机制,以便消费者可以向元数据管理团队报告不正确或过时的元数据。
(4)与其他数据一样,为了提高质量,元数据也可以进行归类和检查。对它的维护应该作为项目工作的可审计部分来安排或完成。
2.元数据本身也是数据,元数据符合数据质量管理工作的一般方法。元数据质量工作一般包括:
(1)定义高质量元数据
(2)定义元数据质量战略
(3)定义初始评估范围
(4)执行初始元数据质量评估
(5)识别改进并排列优先级
(6)定义元数据质量改进目标
(7)开发和部署元数据质量操作等方面
3.(元)数据质量和数据治理一样是一个组织的持续性工作,而非项目。戴明环/休哈特环被认为是解决质量问题的基本方法,即PDCA(计划、执行、检查、行动)循环。
(1)在“计划”阶段,数据质量团队评估已知问题的范围、影响、和优先级,并评估解决方案。该计划应基于对问题的根本原因进行分析的坚实基础。通过了解问题的原因和影响,可以了解成本/收益,确定优先级,并制定解决这些问题的基本计划。
(2)在“执行”阶段,DQ团队负责解决问题的根本原因并计划对数据进行持续监视。对于基于非技术流程的根本原因,DQ团队可以与流程所有者合作实施变更。对于需要技术变更的根本原因,DQ团队应与技术团队合作,以确保正确实施需求,并且技术变更不会引入错误。
(3)“检查”阶段包括主动监视根据需求测试得到的数据质量。只要数据满足定义的质量的阈值,就无需采取其他措施。这些流程将在控制之下并满足业务需求。但是,如果数据低于可接受的质量的阈值,则必须采取其他措施将其提高到可接受的水平。
(4)“行动”阶段的活动旨在处理和解决新出现的数据质量问题。评估问题原因并提出解决方案后,周期重新开始。通过开始新的周期可以实现持续的改进。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-6 12:25:08 | 显示全部楼层
第三题 设计题:(考点:DW/BI、大数据)
一、问题简述
某企业[此处省略三百字]需要构建分析系统,使用数据仓库实现报表制作和深度分析,国家会议中提倡使用数据仓库和BI或者大数据解决方案,请给出系统架构设计方案。(10分)。
二、问题解析
1.数仓/BI、大数据等提示使用“概念性DW/BI和大数据架构”;
2.并进行适当的说明。
三、参考答案
1.结构化数据通过ETL过程进入缓冲区;处理后进入MDM和中心仓库;中心仓库包括ODS、DM、和数据立方体;
2.非结构化数据通过ELT过程进入数据湖,进行数据集成、数据探索、和模型评估等;
3.数据仓库和数据湖整合数据提供各类分析能力,包括描述分析、预测分析、规范分析、机器学习和数据可视化等。
4.大数据处理结果作为数据仓库的数据源,数据仓库也作为大数据的数据源。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-6 12:25:51 | 显示全部楼层
第四题 论述题:(考点:信息安全、隐私)
一、问题简述
某企业[此处省略四百字],需要进行个人信息安全评估。问题:1)信息安全评估流程是什么;2)简述个人信息安全关键点包括哪些?画图或描述;3)简述个人信息安全评估和管理的重要性。(10分-3/3/4)
二、问题解析
1.个人信息也是组织数据,评估过程可以参考组织数据的评估过程;
2.个人信息安全的关键点,就是数据生命周期阶段的数据安全工作;
3.个人信息安全评估和管理的重要性,可以从风险、社会环境、法规方面描述。
三、参考答案
1.在数据和信息安全实施过程中,首先要评估组织当前的数据状态,确定需要保护的数据范围。该过程包括以下步骤∶
(1)识别和分类敏感数据资产。根据行业和组织的不同,它们可能会有很少或很多的数据资产,而敏感数据范围涵盖身份识别、医疗和财务信息等方面。
(2)定位整个企业的敏感数据。安全要求可能会有所不同,这取决于数据的存储位置。如果敏感信息集中存储在一个地方,那么很有可能会由于单点违规导致所有数据泄露,形成较高风险。
(3)确定各项资产的保护方式。根据数据内容和技术类型,保证资产安全所需的措施因资产不同而不同。
(4)确认信息与业务流程的交互方式。需要对业务流程进行分析,以确定在何种条件下允许哪些人访问数据。
除了对数据本身进行分类,还需要评估外部威胁,如来自黑客和犯罪分子的威胁,以及员工和流程带来的内部风险。大量数据的丢失和泄露都是由员工的无知导致的。员工的无知表现在,没有意识到信息是高度敏感的,或是违反安全规章的。残留在网络服务器上的客户销售数据被黑客攻击,下载至项目承包商计算机上的员工数据被盗,保留在执行人员计算机中未加密的商业秘密丢失,所有这些都可能源于安全控制策略的缺失,或者缺乏强制执行安全策略的措施。
近年来,由于安全漏洞事件的发生,一些知名品牌公司已经遭遇了巨大的财务损失和客户信任度下降。威胁不仅仅来自于外部日益复杂和有针对性的黑客犯罪社区,还来自于有意识或无意识的、内部的或外部的威胁带来的损害。
2.个人信息的关键点都体现在数据安全治理生命周期中:
(1)规划:将数据与安全和隐私需求关联
(2)设计&启用:在系统中建立数据保护和安全措施
(3)创建/获取:对新数据进行分类,以便合理保护数据
(4)存储/维护:确保数据存储符合政策法规的要求
(5)使用:管理访问权限,以保证对数据的合理使用,防止滥用
(6)增强:在监管要求和识别新的安全威胁上保持领先
(7)处置:遵循有关政策和法规要求处理数据
3.个人信息安全评估和管理的重要性主要表现如下方面:
(1)随着数据法规的增加,主要是针对数据窃取和违规方面法规的设立,合规性方面也会加强。组织安全的任务通常不仅是管理IT技术安全要求,还要涵盖整个组织的安全策略、实践、数据分类和访问权限规则等。
(2)数据安全与数据管理类似,相关方面关联紧密,最好将数据安全作为一项企业解决方案,并在数据生命周期的全过程中加以应用。如上图所示。
(3)如果没有努力与业务部门协调一致,那么组织将不得不寻求不同的解决方案,以满足安全需求,这样会使得总体成本增加。同时,因应用不同的安全方案而存在降低数据安全性的潜在风险。
(4)无效的安全架构或流程可能会因组织违规或出现数据安全问题而影响生产力使得组织为之付出代价。
因此,有足够的资金支持,面向系统、企业内保持方案一致,建立运行中的安全战略,都将降低这些风险。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-6 12:26:05 | 显示全部楼层
第五题 论述题:(考点:MDM)
一、问题简述
某企业[此处省略五百字],1)主数据管理的7个活动排序;2)主数据管理的关键点是什么?(10分-5/5)
二、问题解析
1.主数据管理活动参考语境关系图中的活动即可;
2.主数据管理的关键的包括三个方面:评估、规划、活动。
三、参考答案
1.主数据管理活动顺序如下:
(1)识别驱动因素和需求
(2)评价和评估数据源
(3)定义架构方法
(4)建模(MD/RD)数据
(5)定义管理和维护流程
(6)制定治理政策
(7)实施数据共享和集成服务
2.主数据管理关键点描述如下:
主数据管理需要控制主数据的值和标识符,以使跨系统一致地使用有关基本业务实体的最准确、最及时的数据。目标包括确保准确的当前值的可用性,同时减少模棱两可的标识符的风险。主要包括三个方面:
(1)评估主数据需求
a.重复引用哪些角色、组织、地点、和事物
b.哪些数据用于描述人、组织、地点、和事物
c.数据的定义和结构方式,包括数据的粒度
d.数据在哪里创建/采购、存储、可用、和访问
e.数据在组织中移动时如何发生变更
f.谁使用数据以及出于什么目的
g.使用什么标准来理解数据及其来源的质量和可靠性
(2)规划主数据管理
a.识别可以提供主数据实体全面视图的候选来源
b.制定规则以准确匹配和合并实体实例
c.建立一种方法来识别和恢复不适当的匹配和合并的数据
d.建立一种方法来将可信数据分发到整个企业系统
(3)生命周期重要活动
a.建立主数据实体的上下文。此过程需要治理。
b.识别在数据源的多个实例;建立和维护标识符和交叉引用以实现信息集成。
c.跨来源协调和合并数据以提供主记录或事实的最佳版本。
d.识别未正确匹配或合并的实例,并确保它们已解析并正确与标识符关联。
e.通过直接读取、数据服务、或通过复制提要到事务、仓库、或分析数据存储中,跨应用程序提供对可信数据的访问。
f.在组织内强制使用主数据值。此过程还需要进行治理和变更管理,以确保共享企业视角。
回复

使用道具 举报

656

主题

70

回帖

2291

积分

管理员

积分
2291
 楼主| 发表于 2025-11-6 12:29:31 | 显示全部楼层
第六题 论述题:(考点:DW/BI、大数据、DQ)
一、问题简述
某企业[此处省略六百字]。要解决数据仓库和BI的性能问题,即一天的数据需要26小时才能分析完成。问题:1)如何再确保BI功能的前提下提高性能?2)源数据(包括外部数据)质量有问题怎么办?(10分-5/5)
二、问题解析
1.性能问题一般是由于基础设施和技术栈老化、新业务需要变化、数据量增加、架构设计不合理等方面引起的问题。
2.质量的好或者坏,主要取决于适用性,即是否满足业务需求和应用的需要。组织中数据也不是同等重要的,要优先解决重点的关键数据。
3.数据质量还依赖于数据标准,尤其再数据集成和共享时,必须统一标准。标准制定一般不会从零开始,一般可以考虑根据共享范围需求选择合适基础版本。
三、参考答案
1.先进行架构规划设计,确保建立一个能够满足3-5年数据战略的架构蓝图,并制定一个行动路线图。总体规划,分步实施。通过MPP或Hadoop技术提升并行数据处理能力,将数据业务按照优先顺序逐步迁移。
2.数据资产盘点,对资产进些评估和估价,排列优先顺序,对核心主数据和参考数据先进行数据质量检查,并修复数据质量问题。其他数据按照优先级逐步开展数据质量相关工作。数据质量过程采用PDCA思路,持续迭代优化。
3.整合国际标准、行业标准和组织标准,并参考国际标准和行业标准,制定数据统一标准。依据标准开展数据管理和数据治理相关工作,利用标准指导外部数据与内部数据的整合集成和共享。数据标准也是数据质量工作的基础和前提。
4.数据质量和数据治理一样是一个组织的持续性工作,而非项目。戴明环/休哈特环被认为是解决质量问题的基本方法,即PDCA(计划、执行、检查、行动)循环。
(1)在“计划”阶段,数据质量团队评估已知问题的范围、影响、和优先级,并评估解决方案。该计划应基于对问题的根本原因进行分析的坚实基础。通过了解问题的原因和影响,可以了解成本/收益,确定优先级,并制定解决这些问题的基本计划。
(2)在“执行”阶段,DQ团队负责解决问题的根本原因并计划对数据进行持续监视。对于基于非技术流程的根本原因,DQ团队可以与流程所有者合作实施变更。对于需要技术变更的根本原因,DQ团队应与技术团队合作,以确保正确实施需求,并且技术变更不会引入错误。
(3)“检查”阶段包括主动监视根据需求测试得到的数据质量。只要数据满足定义的质量的阈值,就无需采取其他措施。这些流程将在控制之下并满足业务需求。但是,如果数据低于可接受的质量的阈值,则必须采取其他措施将其提高到可接受的水平。
(4)“行动”阶段的活动旨在处理和解决新出现的数据质量问题。评估问题原因并提出解决方案后,周期重新开始。通过开始新的周期可以实现持续的改进。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 03:08 , Processed in 0.098497 second(s), 20 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表