“实验证明,99%以上的人皮肤上都感染有螨虫。”听到这样一句广告,你是不是会潜意识地摸一摸自己的脸,甚至感觉到毛孔里面有螨虫在蠕动,几乎要迫不及待地下单买下这个产品,一解皮肤之痒。在数据时代,似乎有数据说话的广告总是更令人信服。但是这个99%从哪里来的?具体检测了多少人?是从哪些人群中挑选的?似乎谁也没有追问。小长假最后一天,小编给大家推送一个欢乐烧脑的话题:用数字说话,就一定更具说服力吗?大家都要小心啦。糖丸效应、向均数回归、错误归因和偏向性实验,给出的都看似是货真价实的数字,但也是千真万确的伪科学。
糖丸效应
用户仅凭自己的心理作用得到治愈作为医药界最著名、波及最广泛的理论,糖丸效应告诉我们:当人们以为自己服用了药物、但其实只是服用了糖丸的时候,由于心理作用,糖丸也可能产生和药物类似的治愈效果。
18世纪,英国生物学家John Haygarth第一个以科学实验证明了糖丸效应的存在:当时一位美国医学家Perkins号称发明了一种神奇的金属针,可以“吸走疼痛根源的有毒电流”,从而治疗风湿痛和肿胀,并且成功案例无数,还申请了专利。
于是John Haygarth从Perkins那里买了一支神奇金属针,用它和随便的一支普通针交替给病人治疗。结果发现,Perkins神奇金属针的治疗效果,和任何一支普普通通的铜针或者银针的治疗效果,并无差别。
所谓的“神奇金属”以及那些治愈病例,完全是病人的心理作用。
这种因病人的心理作用而产生治疗效果的“糖丸效应”,广泛地出现在医药界的每个角落。譬如在一个实验中,病人被告知自己吃下了刺激药物,随后便不同程度地出现了心率加快、血压升高、反应速度骤增的现象;另一个试验中,病人被告知吃下了安眠药,随后就出现了完全相反的身体变化。而在两个实验中,病人吃下的都是糖丸。
也正是因为这个原因,在现在药物的功效测试中,“糖丸对照组”成了必不可缺的部分。只有当服下真正药物的病人组比服下糖丸的病人组产生明显优越的结果时,才能表示药物真的具有某种疗效。
而广告里仅凭用户的自我反应,觉得自己比使用前有精神、腿不疼、皮肤变白,很可能完全是糖丸效应在作祟。
向均数回归
高值和低值会不断向中值靠拢如果用户的自我感觉不够科学,那么客观指标的数据,是否就完全值得信赖了?先来听听“向均数回归”(regression to the mean)再说。
“向均数回归”理论由Sir Francis Galton提出,指的是在统计学上,如果第一次测量时某个变量的数值非常极端,那么第二次测量时它一般都会向平均值靠拢。
举个例子。如果在医院选出胆固醇测试中含量最高的人,不管他们吃不吃药、改不改变生活方式,过半个月,都会出现胆固醇指数降低的现象。这也是一个极端群体在“向均数回归”。
这些“奇效”,可能只是向均数回归的结果。这种统计理论在生活中随处可见。许多学习辅助工具只挑选成绩最差的学生进行实验、降脂降压药只跟踪血脂血压极端超标的人群,它们所测出的“提高”,很大程度上只是极端人群在自然而然地“向均数回归”。
错误归因
我们只是选择了优秀的样本,而并非把样本变得优秀在所有科学实验的伪数据和伪结论中,逻辑关系的判断错误是隐藏最深,却出现频率最高的一个,甚至于许多真正的科学家和社会学家在写论文、著书立说的时候,都会犯这样的错误。
- 数据1:上过大学的人,比没上过大学的年薪高50%。薪水拿的多,是因为上了大学,还是上大学的人本身就更聪明、更渴望提升自我?
- 数据2:经常运动的人,幸福指数更高。幸福指数高,是因为经常运动,还是去健身房的人本身就有钱有闲、身体健康?
- 数据3:xxx产品的用户比同龄人显得更年轻。许多广告中的数字里说的,服用某某保健品,或者实施某种健康/饮食计划的人群寿命比平均水平更长,很可能是因为那些肯花钱去吃保健品、合理膳食和调整生活作息的人,本身就有更好的生活状态。他们经济优裕,营养良好,并且比普通人更注重保养、关注自己的健康。这样的人,本身就比平均水平活得长。大多数昂贵的保健品,只是通过市场定位和营销手段选择了高收入人群作为自己的用户,而非真正给这批用户带来了任何提升。
- 数据4:从某校走出了近三十位英国首相。实在说不清到底是学校的教育成果,还是那些学生们本来就将成为政治精英,而某校只是挑选了他们入学。
我们同样也可以说,本文的读者智商水平比未读过的人高20%。难道是这篇文章骤然提高了读者的智力?当然不是。更可能地,是只有智有余力的人才会点开并且详读这篇推送。本文只是选择了一批高智商的读者,并没有带给读者的智商以任何改变。我们只是选择了优秀的样本,而并没有把随机样本变得优秀。
关联关系并不能代表因果关系。
偏心的实验
只要稍微控制下选样范围,就能获得自己想要的结果前面所说的三种错误推导的共性,是仅仅通过观察得出结论,而没有控制变量、进行对比试验,导致不可控因素太多、结论完全不可信。
不过即使是由实验室对比验证过的“科学数字”,其中也可能掺杂着猫腻:只要稍微调整一下实验环境,几乎就能得到自己想要的任何结果。
70%的用户在同类产品中更喜欢本品牌;产品盲测中,xx品牌被75%的用户选中;
听起来是不是都无比熟悉?这些数字,其实都很好做到。
- 人为控制采样范围比如说,大多数广告没有透露实验人群的选择标准。在百事大楼里采访纯果乐(百事出品)和果粒橙(可口可乐出品)的青睐度;在汉堡店测试炸鸡和寿司的喜爱度;以及在政协食堂调查民意......都可以严重地将结果的天平往一方倾斜。
- 巧妙地调控实验环境。譬如在炎热的海滩,将自己品牌的冰镇果汁与其他品牌的常温果汁放在一起,显然自己的将更受欢迎。
- 甚至到了实验结果的统计阶段,依然可以挑挑拣拣。倘若有100个人参加实验,那么统计学上的随机谬误最多导致48比52的误差。可是如果一共只调查五个人,那么喜好的倾向最少就是60比40、甚至可能制造出80比20这样的悬殊差距啊!
- 在自己品牌的支持度随机占上风的时候使调查戛然停止,也是一个十分有效的控制结果的手段。看广告的人不会关心它们的取样范围到底有多大。
糖丸效应、向均数回归、逻辑错误和偏向性实验,给出的都看似是货真价实的数字,但也是千真万确的伪科学。所以千万不要掉以轻心!生活从来就是一道随时出现的思考题。