联系我们

解密数据的8个“把戏”(下)

2014/12/05

第五,数据的精确不一定代表准确
  最经典的例子就是收入数据。经常有报道说:公务员收入其实很低,劝大家不要错怪公务员。但问题是,工资收入是低,但非工资收入可能不低。当然,这种情况不仅限于公共组织。其实无论任何组织,只要挣的花的不是自己的钱,就都可能出现这种“工资不等于收入”的情况。
  在具体业务中,“精确不等于准确”可能出现在两种情境中——总结归纳、分析预测。
  比如消费者调研,一般都会有定性和定量两种方法。如果没有定性分析,定量分析就可能陷入“虚假精确”的陷阱。如果你的调研对象有问题,那么,就算再辛苦的计算和再精确的数据,其实都没有意义。又比如广告测试,精确的测试结果真的有实际意义吗?
  又比如销量预测,每个人心里都明白,这是无法准确预测的,你只能无限接近,却不能完全准确,因为“预测未来”本来就是上帝才能搞定的事,所以我们能做的,只能是在保证方向准确的情况下,尽量精确。但也不必过于花费力气、苛求预测数据的精确,因为这不会增加多少实际意义,还不如花多点时间研究其他可操作性强的数据
  总之,尽量避免追求虚假的准确和错误的确定性。

第六,相关性不一定是因果性
  我老板的经典口头禅就是:“你们这些人,总是自说自话、以果推因分析法,错把相关性当成因果性,把偶然性当成必然性。”这句口头禅可真是太强大了,因为可应用范围颇广,躺枪几率也颇高,导致我们现在不得不日省三次:“有没有自说自话?有没有以果推因?”
  以前还听过一个段子,一个领导手下的两个部门同时做生意报告。A部门搞不清楚自己生意为啥涨,B部门搞不清楚自己生意为啥降,结果最后的生意报告中,两个部门不约而同,提到了同一个原因——天气。只不过,A部门说,因为这段时间按天气冷导致A产品需求增大;B部门说,因为这段时间天气热导致B产品需求减少。我现在觉得吧,多亏这领导不是我老板,否则这两部门可以一起蹲小黑屋了。
  这就是统计学最重要的价值——可以帮助我们排除无关因素,因为这些无关因素太容易让大家混淆了因果性和相关性的区别。

第七,被忽略的“大数定律”
  有公司做新品上市的消费者调研时,最后需求是:只要超过45%的人喜欢,就决定上市这个新品。其实这压根不用调研了。如果这个新品和对照组的产品本身差距不明显的话,且样本量足够大,肯定会有50%的人喜欢,这就是大数定律的基本常识。

第八,数据是可以作弊的、是可以有偏见的
  初三接近中考时,老师突然要调座位,而且这次不按学号、不按个子、也不按“好帮差”原则,而是直接按成绩调座位——成绩好的人坐左边两组,成绩不好的坐右边两组。当时我还很懵懂,不明白为啥非要在复习备考的紧张时刻折腾调座位,因为和我关系非常好的小伙伴们都被调到右边两组了。
  后来我终于懂了。因为接下来的两周,右边座位的同学们,一个接一个的被老师叫走谈话,然后,又一个接一个的,退学了。我想我这辈子都忘不了,那些同学一声不吭的低头收拾完书包,佝偻着腰沉重的走出教室前,回头望过来的最后一眼。那种悲伤和无奈的眼神,让我至今想起来都心酸喉梗。然后,当年我校的升学率就非常高。
  企业当中数据作弊和偏见也不少见,比如通过压低头一年的数据、使得第二年增长率更高;比如选择错误的样本数据做市场调研;又比如常见的会计数据作弊。
  总之,数据的把戏大有乾坤。一方面,我们需要数据去分析问题、印证结论,没有数据的虚谈是没有意义的,也是很难有定论的。另一方面,数据不是全部,我们不能成为“数据教”的人。过于追求数据的完美精确,容易让我们忽略那些无法用数据表现的关键要素,比如人的态度、动机和精神气;也容易忽略企业的最终目标。其实,在不该使用数据的使用数据,可能比在该用数据的时候没有数据,结果更可怕。


也欢迎关注我们的微博:
http://weibo.com/biddingx

联系我们