27.1. 可视分析概述#
可视分析的起源
可视分析源于2004年美国国家可视化与分析中心(National Visualization and Analytics Center)提出的一个研究计划,旨在应对日益增长的数据复杂性和分析需求。2005年,可视分析的研究议程(Research Agenda for Visual Analytics)正式发布,标志着这一领域的正式确立。该议程将可视分析定义为:”可视分析是一种分析推理科学,它通过交互式视觉界面,将人的灵活性、创造力和背景知识与计算机的存储和处理能力相结合,实现复杂、大规模数据集的高效处理和决策”。
可视分析是可视化、数据分析、人机交互等多个学科交叉融合的结果。其中,可视化为分析提供直观、易理解的视觉表示;数据分析为可视化提供坚实的数学基础和计算支持;人机交互则构建了人与数据、人与模型之间的桥梁。三者相辅相成,共同塑造了可视分析”人在回路”(Human-in-the-loop)的核心理念。
可视分析的提出有其深厚的时代背景。一方面,随着数字化进程的加速,数据在体量、维度、异构性上呈现爆炸式增长,传统的分析工具和方法已难以完全应对;另一方面,恐怖袭击、金融危机等事件凸显了及时洞察、响应复杂形势的迫切需求。在此背景下,如何将人的洞察力与机器的计算力高效协同,成为学界和业界共同关注的焦点。可视分析正是顺应这一需求应运而生。
可视分析关键要素
数据
可视分析需要处理大规模、多源异构、时变动态的复杂数据。对于原始、杂乱的数据,需要进行预处理,如数据清洗、集成、变换、规约等,提高数据质量,并提取适合分析和可视化的特征。同时,需要考虑数据的语义、不确定性、来源可信度等因素。
任务
可视分析的任务是开放、探索性的,旨在回答从”是什么(What)”到”为什么(Why)”的各种问题。常见的分析任务包括:数据概览、模式发现、异常检测、关联分析、数据比较、因果分析、预测预警等。任务驱动是可视分析设计的出发点,需要抽象用户的分析意图,并转化为可执行的分析工作流。
用户
可视分析的用户涵盖领域专家、分析人员、决策者、公众等不同群体。他们的背景知识、分析目的、交互偏好各不相同。因此,需要开展用户调研,建立人物角色(Persona),从认知、知觉、交互等层面分析用户的特点和需求。用户往往是整个分析过程的主导者,其洞察力和创造力是可视分析成功的关键。
表示
表示是指将数据映射到视觉元素的过程。一个有效的可视表示应最大化数据的信息传输,最小化用户的认知负荷。常用的表示技术包括:标量数据的色标映射、矢量场的流线追踪、张量场的椭球面表示、时变数据的堆积图、层次数据的树图等。表示的设计需要考虑数据的特点、任务的要求、美学原则等因素。
交互
交互是用户探索、操纵可视化视图,与数据进行对话的手段。常见的交互类型包括:数据选择、视图导航、编码控制、抽象/精细化切换等。一个流畅、直观的交互机制可以增强用户的参与感和控制感,引导用户进行自主分析。但交互的设计也要注意简约性,避免过度干扰用户的思维过程。
推理
推理是可视分析的核心,是从数据到洞察的桥梁。它包括从数据到信息的分析推理和从信息到知识的认知推理两个层面。前者侧重机器智能,通过数据挖掘、统计分析、机器学习等技术,自动计算数据的特征模式;后者侧重人的智慧,通过知识联想、假设验证、因果推断等,主动构建对数据的理解。二者在可视分析过程中交替进行,形成一个上升的认知螺旋。
以上六个要素环环相扣,共同塑造了可视分析的方法论框架。在实践中,需要根据具体的应用场景和分析需求,灵活地选择和组合这些要素,设计出切实可行的可视分析解决方案。
可视分析与传统的信息可视化有许多相通之处,但也有一些本质区别。相通之处在于,两者都利用人眼的高带宽通道优势,将抽象数据以直观的视觉形式呈现,放大人的认知能力。但信息可视化更侧重表示,即如何准确、高效、美观地将数据映射到视觉通道;而可视分析则更侧重分析,即如何与用户进行有效互动,共同完成数据推理和决策任务。信息可视化强调”以用户为中心”,可视分析则强调”以任务为中心”。此外,信息可视化关注”可视化”,可视分析则关注”可视化+分析”,因而对分析模型、交互机制、认知理论等有更高要求。从这个角度看,可视分析是信息可视化在大数据时代的自然延伸和必然选择。