日前在2014 VIS会议上,来自德国康斯坦茨大学数据分析和可视化组(Data Analysis and Visualization Group, University of Konstanz)的Sacha等人,提出了一种基于可视化分析的知识产生模型。这个模型保留了过去的挖掘模型,如KDD模型,也从各角度、各层次更加全面地阐述了人类利用计算机的可视化分析系统产生知识的过程。
可视化分析使我们直观地观察庞大的信息空间并支持复杂的决策,人类在这个过程中扮演核心的角色。计算机没有人类的创造性思维,而人类依赖计算机即时有效地大数据处理能力。如图1所示,知识产生模型包括人机两部分,左边的计算机部分表示一个数据的可视化分析系统,右边则是人类验证假设的知识产生过程,云状图案表示数据分析时要求人机间密切交互。
图1:可视化分析的知识产生模型
计算机可视化分析系统
数据(Data)是一切分析的开始,用来结构化、半结构化、非结构化地描述现象,在一次分析中附加的数据可以通过一定方法自动或人工生成,称作metadata,就是“关于数据的数据”。模型(Model),即KDD过程,包括的范围从对数据做最简单的统计分析,到复杂的数据挖掘算法,是从数据集中识别有效、可理解的模式的过程。而另一个从数据到知识的路径就是可视化技术(Visualization),可视化使分析员直观地观察到数据间的关系。
人类知识发现的三层循环
- 探索循环(Exploration Loop)
探索循环描述分析师同一个可视化分析系统进行一系列互动行为(Action),如数据准备、建立模型、操控可视化结果等,观察和探索由此产生的反馈,并获得发现(Finding)。分析师的行为应当遵循分析的目标而展开。
- 验证循环(Verification Loop)
验证循环是在探索循环基础上证实或者提出新的假设。分析师在观察阶段得到发现的结果后,深入分析获得现象背后的猜测(Insight),会产生新的假设(Hypothesis)并成为进一步调查的动机。猜测并非知识,而是由弱证据得到的感知等待进一步假设验证。
- 知识产生循环(Knowledge Generation Loop)
分析师不断形成和验证假设,当证据足够可信时这一系列的洞察和猜测便衍生出了知识(Knowledge)。知识同样会影响所提出的新假设。
同其他模型的联系
知识产生模型是基于现有的各种模型建立的,提供了可视化分析时知识产生过程的全局观。图2阐明各种相关模型在知识产生模型中的位置。计算机部分的InfoVis pipeline模型描述了从数据产生可视化图表的流程,KDD过程的核心则是应用数据挖掘模型将数据抽象化、有意义化;交互部分有行为的七个阶段(Seven Stages of Action)模型,描述人建立目标、执行和评价的行为,在这个模块还有关注特定方面的若干其他模型; 人类认知、意会、论证的部分,则包括意会循环(Sensemaking loop)、人类认知模型(Human Cognition Model)等,来说明人类形成知识的过程。
图2 同其他模型联系的知识生产模型
一个模型应用的例子——Jigsaw文档可视化分析系统
Jigsaw是一款利用文本挖掘算法建立各种文档可视化视图的软件,可生成文档的聚类图、时间轴、词树图等。建模是系统根据任务自动完成的,并产生相对模型的可视化图表,用户可自由调节图表的属性和外观,是一个典型的可视化分析系统。
图3 Jigsaw中的可视化结果。(a)中表示将人名和文本关联,(b)中表示文本聚类图,(c)Tablet界面
Jigsaw十分支持模型中提出的所有行为。在人类的探索循环中,Jigsaw提供各种专业的可视化结果,而用户可以利用这些工具探索某一数据集,如用户根据他们的需要改变聚类的簇数。验证循环同探索循环紧密连接,引导用户由发现产生猜测,而这些发现又可用来验证实际的假设。Jigsaw中提供tablet界面,允许用户整理和归纳发现,有助于结构化地衍生出猜测。知识产生循环取决于用户,因为涉及到相信和推理的概念,而知识又是建立在验证基础上的,Jigsaw形象化的分析过程也有助于知识的产生。
这个模型将人类和计算机作为一个循环,在产生知识的过程中二者不可或缺。利用模型可以评估分析系统的功能和效果,改进系统;在模型中探索循环是知识产生的基础,对知识生态系统改进的重心应放在人机交互,如自动发现意外的结果特征和复杂模型的可操作性;而在知识圈中间位置的验证循环,要求可视化的分析系统设计有效组织和总结结果的功能;对于最末端的知识循环,人类设计和依赖系统提供不同的视角。
参考:Dominik Sacha, Andreas Stoffel, Florian Stoffel, Bum Chul Kwon, Geoffrey Ellis, and Daniel Keim,Knowledge Generation Model for Visual Analytics,IEEE Transactions on Visualization and Computer Graphics
来源:数盟 作者:Ashley Wang, BI分析师
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。