24.2. 可视化研究内容#
24.2.1. 可视化的子领域#
科学可视化、信息可视化和可视分析三个学科方向通常被看成可视化的三个主要分支 [WGK10]。
科学数据可视化:主要关注于将科学计算、仿真产生、或采集到的数据转化为图形和视觉表达,以便于研究者理解复杂的物理现象、化学过程或生物结构。这类可视化技术常被应用于各理工、医学领域,如气候模型的可视化、医疗成像(如 MRI 或 CT 扫描)以及大规模天文数据的可视化等。
信息数据可视化:专注于将抽象数据和非几何空间数据(如文本数据、社交网络数据、商业和金融信息)转化为图形和视觉格式,侧重于呈现清晰的信息架构,以便研究者发现数据中的关联、模式和趋势,支持数据驱动的决策和分析。
可视分析:结合了数据分析的自动化方法与用户交互,将人的洞察力和经验与计算机的处理能力相结合,支持对复杂问题的理解、推理和决策。旨在通过视觉表示手段加强人的分析推理能力,处理大规模和不确定的数据集。
在后续章节中,我们将从这三个研究方向入手,对可视化技术展开介绍。
24.2.2. 可视化流程#
如图 24.9,纪怀新(Ed Chi)于 1999 年提出了信息可视化参考模型(Information Visualization Reference Model)[CMS99],展示了信息可视化的大致流程。这一模型适用于普遍的可视化任务,它分为以下几个阶段:

图 24.9 信息可视化的流程示意图。© Wikipedia#
原始数据(Raw Data):可视化的起点,是未经处理的原始数据集,这些数据可能是多维的、复杂的,可能包括表格、文本、图像、时间序列等多种形式。
数据表(Data Tables):原始数据经过预处理和数据转换(Data Transformation),包括并不限于清理,格式化等,转换为可用状态,如适合可视化和分析的数据表(结构化数据)形式,并通过用户选择过滤出要进行可视化的数据部分,以确保数据中的核心信息得到进一步处理和分析。
可视化结构(Visual Structures):通过视觉映射(Visual Mapping),数据表被映射为可视化结构,包括适当的图形元素(如点、线等)及其属性(如颜色、位置、大小等),使数据在可视化空间中获得对应的表达。这一阶段涉及:(1)视觉编码:将数据属性映射为视觉变量(如位置、颜色、大小、形状等);(2)布局设计:确定图形元素在空间中的排列方式(如节点链接图、矩阵图等)。
视图(Views):将可视化结构呈现成用户看到的视图,并经过视角调整和用户交互等视图变换(View Transformation),来增强对视图中所蕴含信息的探索。如果选择的图形元素是三维空间中的元素,那么视图变换还会包括光照、阴影处理、纹理映射等处理。
另外,人类交互(Human Interation) 也在可视化中扮演着至关重要的角色。由于可视化应用中包含大量而丰富的信息,因此用户需要参与到数据筛选、视觉表达选择、视图调整等各环节中,以此来获得用户满意的可视化结果。通过可互动的可视化,特别是在网站或应用程序中使用时,用户能够从不同的角度查看信息主题,并操作其可视化,直到达到所需的见解并满足广泛的用户需求和探索性体验。
24.2.2.1. 视觉映射#
在可视化流水线(图 24.9)中,视觉映射是决定其表达效果的关键步骤。 视觉映射也被称为视觉编码(Visual Encoding),负责将数据从数据空间转化为可视化空间的视觉元素。这一过程通过视觉通道(Visual Channels) 实现,例如位置、颜色、大小、形状等,将数据属性映射为可感知的图形特征,从而帮助用户理解数据内在的模式与关系。
不同的视觉通道直接影响用户的认知效率。常见的视觉通道包括:
位置(Position):最有效的通道,适合表示定量数据(如折线图、散点图)。
颜色(Color):
色相(Hue):区分类别数据(如不同产品类别)。
亮度/饱和度(Brightness/Saturation):表示数值大小或强度(如热力图)。
大小(Size):表示数值差异(如气泡图)。
形状(Shape):区分定性数据(如不同节点类型)。
方向(Orientation):适合表示趋势或方向性数据(如箭头图)。
一般来说,定量类通道(如位置、长度、面积等)在人类的视觉感知上优先级高于定性类通道(如颜色、形状等) 根据 Cleverland 等人的研究 [CM84],人类对视觉通道的感知效率排序如下: 位置 > 长度 > 角度/斜率 > 面积 > 体积 > 颜色饱和度。 因此,在可视化设计中,应优先将关键数据维度映射到高感知效率的通道(例如用位置表示核心指标)。
在一张图表中,有时也需要使用多种视觉通道协同工作,从而编码更丰富的视觉信息。但需要注意的是,人类在同一时间内只能处理有限的视觉信息,当过多通道在同一空间内竞争用户的注意力时,视觉通道之间相互干扰会导致认知负荷增加:
当多个视觉通道同时使用时,某些通道可能干扰用户对数据的感知。例如,在散点图中,同时使用颜色和形状编码类别数据,可能导致用户难以区分类别(红色圆形 vs. 红色方形)。
当使用多个视觉通道传达同类的信息,也会导致资源浪费或视觉过载。例如,在饼状图中,同时使用颜色和标签标注类别,可能导致信息重复和图表拥挤。 因此,应使用恰当数量的视觉通道(通常不超过3-4个),尽量使用能协同工作的通道,并根据数据维度的重要性安排对应优先级的视觉通道。