|
数据通常是枯燥乏味的,相对而言,人们对于大小、图形、颜色等怀有更加浓厚的兴趣。利用数据可视化平台,枯燥乏味的数据转变为丰富生动的视觉效果,不仅有助于简化人们的分析过程,也在很大程度上提高了分析数据的效率。 数据可视化是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。 虽然可视化在数据分析领域并非是最具技术挑战性的部分,但却是整个数据分析流程中最重要的一个环节。 在大数据时代,数据容量和复杂性的不断增加,限制了普通用户从大数据中直接获取知识,可视化的需求越来越大,依靠可视化手段进行数据分析必将成为大数据分析流程的主要环节之一。让“茫茫数据”以可视化的方式呈现,让枯燥的数据以简单友好的图表形式展现出来,可以让数据变得更加通俗易懂,有助于用户更加方便快捷地理解数据的深层次含义,有效参与复杂的数据分析过程,提升数据分析效率,改善数据分析效果。 在大数据时代,可视化技术可以支持实现多种不同的目标。 1.观测、跟踪数据。许多实际应用中的数据量已经远远超出人类大脑可以理解及消化吸收的能力范围,对于处于不断变化中的多个参数值,如果还是以枯燥数值的形式呈现,人们必将茫然无措。利用变化的数据生成实时变化的可视化图表,可以让人们一眼看出各种参数的动态变化过程,有效跟踪各种参数值。比如,百度地图提供实时路况服务,可以查询包括北京在内的各大城市的实时交通路况信息。 2.分析数据。利用可视化技术,实时呈现当前分析结果,引导用户参与分析过程,根据用户反馈信息执行后续分析操作,完成用户与分析算法的全程交互,实现数据分析算法与用户领域知识的完美结合。在一个典型的可视化分析过程中,数据首先被转化为图像呈现给用户,用户通过视觉系统进行观察分析,同时结合自己的领域背景知识,对可视化图像进行认知,从而理解和分析数据的内涵与特征。随后,用户还可以根据分析结果,通过改变可视化程序系统的设置,来交互式地改变输出的可视化图像,从而可以根据自己的需求从不同角度对数据进行理解。 3.辅助理解数据。帮助普通用户更快、更准确地理解数据背后的含义,如用不同的颜色区分不同对象、用动画显示变化过程、用图结构展现对象之间的复杂关系等。例如,微软亚洲研究院设计开发的人立方关系搜索,能从超过10亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并通过算法自动计算出它们之间存在关系的可能性,最终以可视化的关系图形式呈现结果。 4.增强数据吸引力。枯燥的数据被制作成具有强大视觉冲击力和说服力的图像,可以大大增强读者的阅读兴趣。可视化的图表新闻就是一个非常受欢迎的应用。在海量的新闻信息面前,读者的时间和精力都开始显得有些捉襟见肘。传统单调保守的讲述方式已经不能引起读者的兴趣,需要更加直观、高效的信息呈现方式。因此,现在的新闻播报越来多地使用数据图表,动态、立体化地呈现报道内容,让读者对内容一目了然,能够在短时间内迅速消化和吸收,大大提高了知识理解的效率。 【出处】林子雨.大数据导论.人民邮电出版社,2020年9月第1版.
|