1.4 数据可视化的流程和设计框架
1.数据可视化的流程
数据可视化的流程以数据流向为主线,其核心流程主要包括数据采集、数据处理和变换、可视化映射和用户感知4个步骤。整个可视化过程可以看成是数据流经过一系列处理步骤后得到转换的过程。用户可以通过可视化的交互功能进行互动,通过用户的反馈提高可视化的效果。
(1)数据采集
可视化的对象是数据,而采集的数据涉及数据格式、维度、分辨率和精确度等重要特性,这些都决定了可视化的效果。因此,在可视化设计过程中,一定要事先了解数据的来源、采集方法和数据属性,这样才能准确地反映要解决的问题。
(2)数据处理和变换
这是数据可视化的前期准备工作。原始数据中含有噪声和误差,还会有一些信息被隐藏。可视化之前需要将原始数据转换成用户可以理解的模式和特征并显示出来。所以,数据处理和变换是有必要的。它包括去噪、数据清洗、提取特征等流程。
(3)可视化映射
可视化映射过程是整个流程的核心,其主要目的是让用户通过可视化结果去理解数据信息以及数据背后隐含的规律。该步骤将数据的数值、空间坐标、不同位置数据间的联系等映射为可视化视觉通道的不同元素,如标记、位置、形状、大小和颜色等。因此,可视化映射是与数据、感知、人机交互等互为依托,共同实现的。
(4)用户感知
可视化映射后的结果只有通过用户感知才能转换成知识和灵感。用户从数据的可视化结果中进行信息融合、提炼、总结知识和获得灵感。数据可视化可让用户从数据中获取新的信息,也可证实自己的想法是否与数据所展示的信息相符,用户还可以利用可视化结果向他人展示数据所包含的信息。用户可以与可视化模块进行交互。交互功能在可视化辅助分析决策方面发挥了重要作用。
目前,还有很多科学可视化和信息可视化工作者不断地优化可视化工作流程。
图1-10所示为Haber和McNabb这两位学者提出的可视化流水线,描述了从数据空间到可视空间的映射,包含了数据分析、数据过滤、数据可视映射和绘制4个阶段。这个流水线常用于科学计算可视化系统中。
图1-10 Haber和McNabb提出的可视化流水线
图1-11所示为图书情报领域信息可视化流程模型,该模型把流水线改成了回路,用户可在任何阶段进行交互。
图1-11 图书情报领域信息可视化流程模型
可以看出,不管在哪种可视化流程中,人都是核心要素。虽然机器可承担对数据的计算和分析工作,而且在很多场合比人的效率高,但人仍是最终决策者。
2.数据可视化的设计标准
设计数据可视化时,我们应遵守以下可视化设计标准。
① 表达力强。能真实全面地反映数据的内容。
② 有效性强。一个有效的可视化设计应在短时间内把数据信息以用户容易理解的方式显示出来。
③ 能简洁地传达信息。简洁地传达信息能在有限的画面里呈现更多的数据,而且不容易让用户产生误解。
④ 易用。用户交互的方式应该简单、明了,用户操作起来更方便。
⑤ 美观。视觉上的美感可以让用户更易于理解可视化要表达的内容,提高工作效率。
3.数据可视化的设计框架
数据可视化的设计框架分为4个层次,如图1-12所示。
图1-12 可视化设计框架
第一层描述现实生活中用户遇到的实际问题。在第一层中,可视化设计人员会用大量的时间与用户接触,采用有目的的采访或软件工程领域的需求分析方法来了解用户需求。首先,设计人员要了解用户的数据属于哪个特定的目标领域。因为每个领域都有其特有的术语来描述数据和问题,通常也有一些固定的工作流程来描述数据如何用于解决每个领域的问题。其次,描述务必细致,因为这可能是对领域问题的直接复述或整个设计过程中数据的描述。最后,设计人员需要收集与问题相关的信息,建立系统原型,并通过观察用户与原型系统的交互过程来判断所提出方案的实际效果。
第二层是抽象层。它将第一层确定的任务和数据转换为信息可视化术语。这也是可视化设计人员面临的挑战之一。在数据抽象过程中,可视化设计人员需要考虑是否将用户提供的数据集转化为其他形式,以及使用何种转化方法,以便选择合适的可视编码,完成分析任务。
第三层是编码层,设计视觉编码和交互方式,是可视化研究的核心内容。视觉编码和交互这两个层面通常相互依赖。为应对一些特殊需求,第二层确定的抽象任务应被用于指导视觉编码方法的选取。
第四层则需要具体实现与前3个层次匹配的数据可视化展示和交互算法,相当于一个细节描述过程。它与第三层的不同之处在于第三层确定应当呈现的内容及呈现的方式,而第四层解决的是如何完成的问题。
框架中的每个层次都存在不同的设计难题,第一层需要准确定义问题和目标,第二层需要正确处理数据,第三层需要提供良好的可视化效果,第四层需要解决可视化系统的运行效率问题。各层之间是嵌套关系,外层的输出是内层的输入。