联系我们

干货 | 如果这都不能让你hold住数据可视化

2016/09/21

干货 | 如果这都不能让你hold住数据可视化

 

作为一名高(ku)大(bi)上的营销人员,你有没有花费过多的时间思考如何将电子表格制作成一张好看的数据图表?然而,原本预想得很美好的图表,却常常被做成“五毛”效果,究其根本原因,是因为不了解数据可视化理论的基本准则。所以,今天小编就和大家一起来讨论如何运用这些准则,让你的图表呈现更加规范、美观。

为什么使用数据可视化?

 

干货 | 如果这都不能让你hold住数据可视化

 

相对于Excel这样电子表格化的数据,我们的大脑更容易处理已经形成图表的数据。数据可视化专家Alberto Cairo 在他的《功能艺术(The Functional Art)》一书中提到,“任何图表和可视化,都是为了帮助获取所见信息之外的洞察”。光说不练假把式,小编带你看看实例:

 

第一颗栗子

 

安斯库姆四重奏(Anscombe’s quartet)是一个非常著名的数据集。数据分为四组,用罗马数字进行了标记,其中每组都包含X和Y坐标。如果放在Excel中,这些数据比较难消化理解。

 

干货 | 如果这都不能让你hold住数据可视化

 

即使对这些数据进行普通的统计分析,也仍然看不出来区别。

 

干货 | 如果这都不能让你hold住数据可视化

 

但是如果我们将这些数据做成散点图的话~

 

干货 | 如果这都不能让你hold住数据可视化

 

如上所示,图表制成后,我们明显看到了这四组数据中的差异:

 

  • Set I:简单的直线线性回归
  • Set II:X轴和Y轴的倒抛物线非线性关系
  • Set III:另一个直线回归,但有明显的离群
  • Set IV:大部分数据都处于X轴8的位置上,没有显示X轴与Y轴的关系,而且与Set III相比有一个数据离群的更加明显。

 

第二颗栗子

 

让我们看一个和营销相关的栗子。现在有一组访问过官网和活动落地页的用户数据,以年龄和性别划分。如果通过表格来呈现这组数据,能否看出什么趋势呢?

 

干货 | 如果这都不能让你hold住数据可视化

 

由于数据变量较多,通过表格数据我们并不能一眼看出任何趋势。但是将数据可视化后,DuangDuangDuang!趋势就一目了然了。

 

干货 | 如果这都不能让你hold住数据可视化

 

总体来看,整个年龄层很少有男性去浏览官网或活动落地页,只有25-29岁年龄段例外,这个年龄段访问官网和活动落地页的男性要多于女性。

 

这两个例子有没有让你感受到数据可视化的魅力?下面我们就来看一下,哪些方法能让数据表达更有效率。

 

“前注意特质”助力数据可视化


当我们观察物体时,视觉感知(visual perception)的工作顺序是这样的:

 

1.眼睛接收到物体的光反射。

2.物体在视网膜上的成像通过感光细胞被编译为电信号传递到大脑。

3.大脑对物体的基本特征进行判断,这些基本特征也被称为前注意特质。

4.大脑进行分析,并对记忆信息(映像记忆、工作记忆以及长期记忆)进行编译。

 

第3条在数据可视化运用中尤为重要。前注意特质是一些视觉特性,可以在200-250毫秒之内监测到,不需要大脑进行过滤和处理。前注意特质包括颜色、长度、宽度、方向、形状、大小、闭合、色相、强度/阴影、位置等。

 

这些特质中,某些特质相对于另外一些特质,能够被更快速监测到。比如,我们辨别颜色变化的速度,要比辨别阴影或形状变化的速度更快。

 

有些吃瓜群众可能不相信,那么就让我们检验一下这个结论。下面的文本由不同数字组成(即不同的形状),你能快速找到数字5吗?

 

干货 | 如果这都不能让你hold住数据可视化

 

如果把“5”用黑色阴影描出来呢?是不是一眼就能找到了。

 

干货 | 如果这都不能让你hold住数据可视化

 

如果使用更亮丽的颜色,比如红色,我们能更迅速的发现“5”。

 

干货 | 如果这都不能让你hold住数据可视化

 

千万不要小看这个信息!这些特征如果能运用到图表和可视化中,将大大提高数据的沟通和理解效率。

 

让“感知度”助力数据可视化

 

美国著名专家William S. Cleveland和Robert McGill利用前注意特质和人们对图表的感知做了一个调研,通过人类感知的层次结构,把基本感知任务(elemental perceptual tasks)从最能精确感知到最不能精确感知排序,解开数据的“封印之力”:

 

1.置于一个坐标轴内或同一区域内进行对比

2.置于两个坐标轴或不同区域进行对比

3.长度、方向、角度

4.面积

5.体积、弯曲率

6.阴影、颜色饱和度

 

干货 | 如果这都不能让你hold住数据可视化

 

下面我们举例来证明这些基本感知任务。同心圆图示为2010年和2015年各行业获得的风投基金对比:

 

干货 | 如果这都不能让你hold住数据可视化

 

根据现在这个图,请快速回答以下问题:

 

1.哪个行业获得2015年最大风投基金?

2.哪个行业获得2015年第二大风投基金?

3.猜测一下,与2015年相比,2010年生物产业获得的风投基金比例是多少?

4.猜测一下,与2015年相比,2010年媒体和娱乐产业获得的风投基金比例是多少?

 

记下你的答案,然后看下一张柱状图。图示数据和上图相同,你的答案有所改变吗?

 

干货 | 如果这都不能让你hold住数据可视化

(图一)

 

现在再看另一张图。同样地,数据没变,只是展示有所区别。

 

干货 | 如果这都不能让你hold住数据可视化

(图二)

 

现在你是不是越来越肯定答案了?这里的每个图表都是运用了Cleveland和McGill的感知层次结构中,更易解码数据的结构层来展现数据。

最后,让我们看看含有实际数值的完整图表:

 

干货 | 如果这都不能让你hold住数据可视化

(图三)

 

Q1:哪个行业获得2015年最大风投基金?

答:这是最简单的一个问题,可以直接从同心圆图表中得出答案。但同心圆图主要使用到“面积”,而条形图使用的是“长度”。我们的感官相对与“长度”更敏感一些,解码数据就更加迅速。

虽然图一和图二都运用了“长度”这一基本感知任务,但是图二更容易被解读,因为图二“置于一个坐标轴内或同一区域内进行对比”,于是我们可以轻松比较生物产业获取的风投基金和其他行业的对比情况。

 

Q2:哪个行业获得2015年第二大风投基金?

答:个人消费服务业。

这从同心圆图中很难看出来。个人消费服务业获得的风险投资额(48亿元)非常接近媒体和娱乐业(47.49亿元)。当我们比较多个相似值的时候,不建议用面积这一基本感知任务。

图一也不是解码数据的最佳方式,虽然它使用了“置于两个坐标轴或不同区域进行对比”呈现,但图二“置于一个坐标轴内或同一区域内进行对比”表现得更加直观。

 

Q3:猜测一下,与2015年相比,2010年生物产业获得的风投基金比例是多少?

答:54%。在2010年,生物产业获得了38.94亿元的风险投资基金,而在2015年,该产业获得74.08亿元的风险投资。大多数人会根据同心圆图而错误地认为大约在80%左右。

 

Q4:猜测一下,与2015年相比,2010年媒体和娱乐产业获得的风投基金比例是多少?

答:34%。在2010年,媒体和娱乐业获得了16.24亿元的风险投资基金;在2015,该产业获得了47.49亿元的风险投资。 由此可知,人们很难通过同心圆图来判断比例,因为人们不擅长感知面积差异,尤其是圆圈内的差异。大多数人会误判为50%左右。

 

总结

 

在这个被大数据环抱的时代,数据的价值被不断强调,因此作为解开数据“封印之力”的数据可视化也逐渐升温。虽然数据呈现的方式多种多样,但数据可视化的根本目的在于要高效利用数据,所以我们要将数据转换为更便于理解的图形和可视化形象,从中获取需要的洞察。从视觉方面分析了数据可视化,希望小编今日的分享,能帮助各位看官在以后的图表制作、演讲中,能将数据更加直观、清晰地展现出来。

 

联系我们