2.2.3 循环模型
随着可视化技术的深入发展,人们逐渐意识到了“用户交互”和“信息反馈”在可视化中的重要地位,因此Sacha等人建立了信息可视化和分析过程中的意义建构循环模型。分析者根据分析任务需求进行信息觅食,在信息可视化界面中借助各种交互操作来搜索信息,如对可视化界面进行概览、缩放、过滤、检索、查看细节等。在信息觅食的基础上,分析者开始搜索并分析潜在的规律和模式,可通过记录、聚类、分类、关联、计算平均值、设置假设、寻找证据等方法抽象提取出信息中含有的模式。然后,分析者利用发现的模式开始分析解决问题的过程,可通过操纵可视化界面设定假设、读取事实、分析对比、观察变化等。在对问题进行分析推理过程中创造新知识,并且形成一定的决策,或者开始进一步的行动,带着任务需求开始新一轮的循环。以上所述的意义建构循环模型中的几个关键步骤之间还存在着多种转移路径和依赖关系,描述了人在数据分析时的主要认知行为、过程及关系。
如图2-16所示,该模型包含左边计算机的部分和右边人的部分。在计算机部分中,数据被绘制为可视化图表,同时也通过模型进行整理和挖掘。在人的部分中,提出了3层循环:探索循环、验证循环和知识产生循环。
图2-16 可视分析中的知识产生模型
(1)探索循环。探索循环描述分析师如何与可视化分析系统进行交互,以产生新的可视化模型和分析数据。分析师通过互动和观察反馈来探索数据,在探索循环中所采取的行动依赖于发现或具体的分析目标。万一缺少具体的分析目标,探索循环会成为搜索的结果,这可能会导致新的分析目标。即使探索回路受控于分析目标,由此产生的结果并不一定与之有关,但也可以洞察解决不同的任务或打开新的分析方向。
(2)验证循环。验证循环引导探索循环确认假设或者是形成新的假设。为了验证具体的假设,需要进行验证性分析并且验证循环会转向揭示假说是否正确的结果。在问题域的上下文中,当分析师从验证循环的角度上进行搜索时,可以得到答案。见解可能会导致新的假设,需要进一步调查。当他们评估一个或多个值得信赖的见解时,分析师会获得额外的知识。
(3)知识产生循环。分析师通过他们在问题领域的知识来形成猜测,而且通过制定和验证假设来获取新的知识。当分析师信任所收集的见解时,他们在问题领域所获取的新知识,可能会影响在后续的分析过程中制定新的假设。在视觉分析过程中分析师试图找到现有的假设或学习有关问题域的新知识。一般来说,在循环模型中的知识可以被定义为“合理信仰”。
评估新知识的可信度需要从数据收集开始对整个分析过程进行严格审查。
总之在探索循环中,人们通过模型输出和可视化图表寻找数据中可能存在的模式,基于此采取一系列行动,如改变参数,去产生得到新的模型输出和新的可视化图表。这样做的动机是在验证循环之中,人们通过模式洞察到数据的特点,产生可能的猜测。这些猜测的验证正是基于探索循环中的行动。最后,在验证循环之上有知识循环,不断收集验证循环中已被验证的猜测,总结为知识。
同时利用本模型可对一些实际的可视分析系统进行评价和比较。Jigsaw是一款免费的文本可视分析系统,它可以读入文本数据,自动提取实体,建立主题模型,因此强于建模。此外,它提供了一系列可视化图表来显示文本的各种特征,因此也强于可视化。它的许多可视化,例如文件聚类视图,是基于主题模型的,因此可以算是对模型的可视化。用户可以在多种视图之间切换,改变各种视觉特性,因此它很好地支持了探索循环。此外,它还提供了tablet视图,允许用户记录自己的发现,并整理归类,提供一定的验证循环支持。然而,Jigsaw不支持对原始数据的预处理,也不太支持模型参数的选择。