农企新闻网

感冒药多少钱(我们能相信统计数据吗)

发布者:马楠一
导读一天深夜,一个社畜,完成了一天的工作,踯躅在深圳的街头。就在距他100米的一个豪华酒店,人民富豪马总正在里面觥筹交错。就在这一刻,以这个社畜为圆心画一个100米的圆,在这个圆内所有人的平均财富,一定是

一天深夜,一个社畜,完成了一天的工作,踯躅在深圳的街头。就在距他100米的一个豪华酒店,人民富豪马总正在里面觥筹交错。就在这一刻,以这个社畜为圆心画一个100米的圆,在这个圆内所有人的平均财富,一定是一个非常高的数字。那么,这一刻这个社畜的幸福感和获得感是否会有提升呢?

这个段子告诉我们两件事。一是,我们不能以个例来评价整个社会,比如这个社畜很疲惫,很沮丧,觉得没有前途,不代表所有人都是如此,至少马总不是,这时候我们需要统计数据;二是,统计数据也不一定靠谱,比如这个社畜的平均财富是如此之高,然而他的个人境遇并未因此有任何改变。

统计是门大学问。一方面,我们能够通过统计数据看清社会的真实面目,另一方面,统计也能欺骗我们,我们往往会被刻意修饰过的统计数据所误导。

美国作家达瑞尔·哈夫著《怎能利用统计撒谎》(初版于1954年),向我们揭示统计数据中的各种欺骗手法。书名直译过来应该是《如何利用统计撒谎》(How to Lie with Statistics)。

这本书篇幅不长,也没有什么高深的专业理论。作者以幽默的语言,丰富的例证,向我们揭示了统计中的那些花招。全书共10个小节,下面我们跟随作者的思路,一起看看60多年前统计是怎么欺骗我们的。

我们能相信统计数据吗?

1、有偏差的样本

当统计者向我们展示一些统计数据时,我们首先要问的是,统计样本是什么样的状况?有没有代表性?

本书举了一个很简单的例子。《时代杂志》文章称,1924级的耶鲁大学毕业生一般年收入25111美元,这在1950年代是极高的收入了。

问题来了。25年前的毕业生,有多少人还能找到呢?那些人生失意者会回答这个问卷吗?25年过去了,当年的毕业生,还会那么努力地回答问卷吗?并且一定会如实填写吗?如果答卷,有些人由于虚荣心或者过于乐观,会夸大自己的收入;还有一些人,由于税务等原因,会刻意缩小自己的收入。这两种情况分别占多大比例?

如果想获得统计数据,因为调查成本的原因,或调查时限的原因,不可能调查所有人。这就需要抽样调查。统计数字的质量依赖于样本,也只能代表所调查样本的情况。

毫无疑问,上面的数据来自这样一些样本,即当年全体毕业生中那些知道其住址,又肯提供答案的人,这些人可能是社会上的头面人物。这个数字,如果是真实的,也只能代表1924级中那些知道地址而又愿意站起来报告他们挣多少钱的人。即便如此,也要假定这些人说的都是实话。

有杂志社想知道读者都喜欢什么杂志,于是进行逐户调查,结果显示读者喜欢《哈帕斯》而不是《真实的故事》,这与杂志社的发行量不符。问题在哪里呢?逐户调查未必能了解到真实情况,因为读者未必如实回答。更好的方法是到住户家中收购旧杂志。当然,这也只能知道读者有过什么,而不是他们现在喜欢什么。

河水不会高于源头,抽样调查的结果不会比样本更好。抽样调查过程可以完全符合已获证明的数学原理,貌似很科学,然而只要精心选择样本,调查者总能得到自己想要的结果。

2、选择得当的平均数

当我们获知本地的人均年收入是X万元时,假定我们相信统计者没有作假的动机,数据真实可靠,那么这个年均收入对我们有多大参考意义?这个“平均”是哪种平均,算术平均,中位数,还是众数?

一位地产商为了笼络顾客,告诉他本地住户年均收入1.5万美元,是一个较好的社区。一年后,同一个人,现在是纳税委员会成员,向当局申请降低税率,声称本地住户年均收入仅3500美元。这两个数字差别也太大了。哪个是准确的呢?可能都是。因为这两个数字都是统计汇总的平均数。

我们经常会用到三种平均数:均值、中位数和众数。

年收入1.5万美元,可能是所有住户的年收入(算术)平均值,即所有收入累加并除以住户数。年收入3500美元,可能是所有住户年收入的中位数,即一半的住户在这个数字之上,另一半在这个数字之下;还可能是众数,即最多的住户是这个水平。

就是说,不加限定的平均数可能是没有任何意义的。

某些数据会符合正态分布,在这种情况下,均值、中位数和众数三者差别不大。然而,就小区住户收入而言,可能并不如此。如果有某几家住户拥有高额财产,只是偶尔度假才在此居住,则可急剧拉高均值,然而并不会拉高中位数和众数。

所以,当你获知某公司年均收入多少,或某地、某国年均收入多少,首先要问,这个年均收入是哪个平均值,是均值,中位数,还是众数?统计部门拥有详尽的数据,他们有能力得到某项数据的各种平均值。如果他们发布了一项指标,而不说明是均值、中位数还是众数,这值得你深思。

回应本文开头的段子,如果计算以这个社畜为圆心的100米范围内人群的收入水平,中位数或众数更能反映真实情况。

3、没有透露的小数字

偶尔,我们读到一份报告,告知我们一点很有意思的信息。然而,报告中常常会有一些小数字,告知我们一些更有意思的信息:样本数非常少,试验只做了很少几次,……,这往往是我们会忽略的。

某公司广告称使用他们的牙膏可使蛀牙减少23%。是不是觉得很不错?然而,仔细阅读广告的小字说明,参加实验的用户只有12人。某牙粉广告宣称在治疗龋齿方面相当成功。然而这个实验只进行了6次,并且是先入为主的。医药界很多新药都是如此炮制出来的,即只进行了较少的实验。

怎样识破这些花招呢?你并不需要成为统计专家。

有一个简单易懂的显著性检验法,这不过是一种说明实验数据能够在多大程度上代表真实情况,而不是某种偶然出现假象的方法,这就是查一查那些没有透露的小数字。

表示这种显著程度的最简单的方法,就是概率。

对大多数用途来说,任何显著水平达到5%就够好了。而对某些用途来说,对显著水平的要求是1%。

还有一种不公开的小数字,就是说明事物的范围,或者与给出的平均数之间的离差的数据。

未透露的小数字的欺骗性在于它的失踪经常无人察觉。

在《时代周刊》,1948年的一个电力公司的广告上说:“现在美国四分之三以上的农场可以获得电力……”。似乎很好。然而,这个“可以获得”可以随意接解释,它并不意味着四分之三的农场已经获得电力。这可能意味着电线经过他们的村庄,或者电线距他们不到10英里或100英里而已。

4、无事空忙

我们对数据进行比较时,如果两个数据相差很小,因为数据测量本身就存在误差,那么在统计意义上,这两个数据实际上并没有实质区别,完全不能说较低的数据就代表着较差的表现。这是我们需要警惕的。

比如,有两个孩子,智商测试表明,彼得智商是98分,琳达是 101分。能不能说明琳达比彼得更机灵呢?

常用的智商测试的误差率是3%。所以彼得的智商应该表述为98±3;琳达则是101±3。也就是,彼得的智商在95-101之间,琳达在98-104之间。从这里可以看出,彼得的智商是有可能高于琳达的。

对待这种情况的唯一办法是看它所表示的范围。将差别不大的数字比较是毫无意义的。

《读者文摘》组织人对多种品牌的香烟进行分析,并公布了结果。人们发现危害成分排名,“老金”牌香烟排在最后。“老金”香烟的名声因之大噪,“老金”公司也趁机大做广告,但是删掉了排行中危害成分含量的差距微乎其微的内容。虽然后来“老金”厂商被命令停止宣传,但是他们已经从早期的宣传中捞到了足够的好处。

5、惊人的曲线

一图胜千言。有些情况下,数字、表格太枯燥,而文字说明又难以解释清楚时,这时,图是最适合的表现形式。然而,我们往往会被精心设计的图表严重误导。

有多种方法让一个很平凡的数据产生强大的视觉冲击力。

比如,一个折线图中,将纵坐标的起点取为某个较大的数值,而不是从0开始;将纵坐标的间隔取较小的数值,都能让实际变化较小的数据显示为比较陡峭的曲线。例如:

我们能相信统计数据吗?

销售额变化趋势图。本图是笔者根据本书作者原意重新绘制的

这个图中的数据,销售额从1月20.03百万元到12月的20.1百万元,仅上升了0.35%,然而精心设定纵坐标的起点和间隔,却能显示为一条陡峭的折线。

这并不是作者编造的。1951年《新闻周刊》就是这么干的,它显示的图形剪掉了下面的80个刻度,以显示“股票市场创21年来新高”。1952年哥伦比亚煤气公司在《时代周刊》的广告,从数据可以得知10年来生活费上涨60%,煤气费下跌约4%;然而通过精心选定的纵坐标起点,给人的视觉观感是生活费上涨了3倍,而煤气费降低了1/3。

有很多公司和每天使用这样的花招误导读者。

6、平面图

形象图经常用来对两个指标进行对比。形象图的前身是条形图或柱状图。条形图也可以通过精心选择纵坐标的起点以误导读者。

而形象图就更容易做到这一点了。例如,比较两个人的工资,一个人周薪30美元,另一个人是60美元。用两个钱袋的形象图表示两者的对比,其中一个钱袋的高度是另一个高度的2倍。然而这完全是误导性的。因为右边钱袋的高度是左边的2倍,宽度也是2倍,视觉观感上右边钱袋的面积是第一个的4倍;这还不算完,读者会将这两个钱袋想象为立体图,这样右边钱袋的体积就是左边钱袋的8倍。

我们能相信统计数据吗?

《新闻周刊》就干过这样的事。他们绘制了一张图,用来吹嘘从30年代到40年代美国钢铁生产能力的进步。为了表示生产能力从30年代的1000万吨上升到40年代的1425万吨,绘制了一个高炉形象图,生产能力增加了42.5%,然而从图上看来,生产能力似乎提高了好几倍。

我们能相信统计数据吗?

这些问题也许可以认为是制图员的失误,然而就像超市柜员在找回零钱时的偶尔失误一样,如果每一次失误都有利于柜员,那么这个问题就值得深思。

7、牵强附会的数字

我们看到的报告,有时候会列举一些数字,如果不细究,这些数字会给我们以震撼,令我们很自然相信某种结论。然而这些常常是精心挑选的、牵强附会的数字,目的就是误导我们。

药厂为了证明某种感冒药的神效,发布一个试验报告,宣称仅仅1/2英两的药物,就在11秒钟内杀死了试管中的31108个细菌。挑选一个有名的,或名字令人印象深刻的实验室,拍一个穿白大褂的医生模特的照片,印在报告边上。但是千万不要告诉公众,这种药物在咽喉中可能无效,也不要讲杀死的细菌是哪一类。报告里面列举的细菌,也许与引起感冒的某种东西,并无直接联系,谁知道呢。

有很多这样的花招。比如,吹嘘某种榨汁机能多榨出26%的果汁。然而比什么多榨26%?旧式的手摇榨汁机。这种榨汁机也许是市场上最差的。去年在飞行事故中丧生的人员远比1910年多,是不是现代飞机更不安全呢?根本不是,现在乘飞机的人是以前的千万倍。最近因铁路事故死亡的人达4721人,是不是铁路更不安全呢?不是。

很多数字和事件之间并无关联关系,把这两者列在一起,完全是牵强附会,就是为了误导。

《哈帕斯》杂志的读者为A&P商店辩解说,该店纯利润只占销售额的1.1%,谁会因这么低的利润率而受到谴责呢?实际上这里的骗人之处是混淆了投资收益和销售收益。例如,每天上午以0.99美元买入,下午以1.0美元卖出,赚的钱只是销售额的1%,然而却是一年投资额的365%。

1940年以前美国南方每年都有成千上万的疟疾病例,而现在却很少报告。原因是现在证明是疟疾的才会被记录下来,而以前南方很多地方口语中的感冒和伤风也被认为是疟疾。

美国和西班牙战争中海军的死亡率是9‰,而同一时期纽约市民死亡率是16‰。是不是战争更安全呢?海军士兵是健康的年轻人,而纽约市民包括从婴儿到老年人的广大范围。

8、死灰复燃的伪因果论

两个数字,似乎是有关联的,宣传者也极力将这个两个数字联系起来,让人觉得似乎这两者之间存在某种因果关系,然而事实并非如此。这种一种常见的花招,即将统计关联宣传为因果关联。

有人想弄清楚学生抽烟与成绩的关系。结果确实抽烟的学生成绩差些。于是要想成绩好就得戒烟。进一步的逻辑是抽烟使大脑麻木。然而实际情况可能相反,可能因为低分,没有去借酒消愁,而是吞云吐雾。

B事件是在A之后发生的,因此,A是B的原因。这不一定是事实。甚至还有一种可能,这两件事都是第三种因素的产物。

要避免上这种伪因果论的当,必须严格检查任何说明相互关系的材料。关于不同数字的相关性,实际上由好几种:

一种是偶然的相关。也许有一次,搜集的数字证明了相关性;但是再来一次,可能又证明不了相关性。人们往往会抛弃不想要的结果,并大量报道想要的结果。

还有一种普遍的协变关系,就是相关性确实存在,但是哪一个是原因,哪一个是结果,却不可能弄清。这里,因和果可以不时互换位置。

还有一种比较棘手的情况,两个变量中一种对另外一种具有明显的影响,然而它们之间确实存在着真实的相关。许多不光彩的勾当就利用了这一点。比如抽烟与成绩之间的关系,还有很多医学统计数字也是如此,相互关系被证明是真实的,但是因果性质仅仅是臆想。

9、怎样变统计戏法

利用统计资料可以向人们传递错误信息,可以说是利用统计进行操纵。

歪曲统计数据和为了某种目的而操纵统计数据的事,并不总是专业统计人员干的。统计人员手里的实事求是的数据一到商人、公共关系专家、新闻记者和广告商手上,就会扭曲、夸大,过分简单化,或在筛选过程中变形。

1949年美国普通家庭年收入是多少呢?美国普查局说是3100美元;拉塞尔·塞奇基金会说是5004美元。普查局的数据一般是中位数,塞奇基金会的数据可能是均值,即便如此,也不至于差距这么大。这是为什么呢?这是一个戏法。基金会将全美国的个人总收入除以全美人口数,然后乘以4(假定一家4口),就得到了5004美元。这种算法是完全错误的,四口之家的富裕程度决不是两口之家的2倍。

广告称现在购买圣诞礼物可以节省100%的钱,这不过是基数混乱,实际上是减价50%。

《标准石油公司史》说:“西南部的减价幅度……在14%至220%之间。”这是在倒贴吗?

上面说的这些花招似乎太陈旧、太露骨了,然而一直有人这么用。比如,每次发生罢工,就有人宣称罢工每天造成几百万美元的损失。这是将罢工时间乘以该时间的产出额。

有人宣称,对出版公司来说,由于各个环节成本上升,如车间成本提高了10-12%,原材料上涨了6-9%……,各项相加,总计成本上涨了33%,对小的出版商则是40%。然而即便每个环节都上涨了10%,总成本最多上涨了10%。这种各个环节百分比累加的逻辑纯粹是无稽之谈。

一个路边兔肉三明治小贩解释他的三明治为何如此便宜,他说,我不得不掺些马肉,我是对半掺的,一只兔子掺一匹马。这个小贩深得数字戏法真谛。

还有百分比和百分点的混淆。投资利润率从第一年的3%提高到第二年的6%,可以说是提高了3个百分点,似乎很小,然而这个数字还可以描绘为利润增加了100%。

尽管统计学是以数学为基础,但它既是科学,也是艺术。在规定的适当范围内变点戏法,甚至歪曲,都是可能的。

10、如何识别统计数字的真实性和有用性

面对统计数据,我们并不能用化学分析或金属纯度检验那样的方法进行检验,然而,可以用下面的5个问题试探一下。

(1)谁这么说的?

实验室为了支持某种理论,为了荣誉或金钱而证实某种东西,报纸为了耸人听闻的消息,工厂或厂房为了控制性命攸关的工资水平,这些都可能产生偏见。

这些偏见之下,可能会瞪着眼瞎说,也可能说一些含糊之词;可能会选择有利的数据,回避不利的数据;也可能改变计算的标准。

(2)他是怎么知道的?

要密切注意选择的样本:是由于选择不当,还是由于只选择迎合自己的样本,这个样本是否大到足以作出任何可靠的结论。

关于相关系数,也要问一下,是否大到足以说明问题,是否从足够多的实例得出,是否有一定的显著性。

(3)缺了什么东西?

要密切注意未加说明的平均数,任何情况下,均值和中位数有很大的差别。

(4)有人偷换概念了吗?

检验统计数字时,要注意在原始数字和结论之间某个环节上可能发生的变动,将一种东西报导成另外一种,这样的事太多了。

(5)这有意义吗?

每当听到以没有得到证实的假设为基础的长篇大论时,可以想一想,这有意义吗?这个问题可以使统计数字恢复它的本来面目。

许多统计资料一下就看出是假的,仅仅是由于数字的魔法镇住了常识,它才得以蒙混过关。

虽然这本书初版距今已经67年,这并不意味着这本书所介绍的统计花招已经过时,我们在媒体上依然能看到各种各样的欺骗性的统计数据。当然,时代在前进,新的花招也层出不穷。比如,如果某个统计数据很难看,怎么办?调整其中某项指标的权重即可。如果调整权重仍然难看呢?也很容易,将这几项指标直接踢出去。

有关部门或企业为什么要进行这种统计欺骗呢?当然是为了某些目的,这还用得着说吗?

英国前首相迪斯雷利说过,谎话有三种,谎言,弥天大谎和统计。我们要了解社会,当然离不开统计数据,然而我们要睁大眼睛,仔细分辨这些数据背后的真相,凡事要多问几个为什么。