拆穿数据胡扯
作者:[美]卡尔·伯格斯特龙
/
[美]杰文·韦斯特
分类:生活
ISBN:9787521738797
出版时间:2022-3
出版社:中信出版社
内容简介
“用数据说话”是互联网时代的通用思维方式,有人说数据不会骗人,真的是这样吗?
X 让人看不懂的数据分析和神奇算法
X 莫名奇妙的数学方程
X 强行联系因果的统计学论文
X 某些新闻报道或PPT中花里胡哨的图表
……
我们都曾经或正在被这些东西蒙蔽,却往往毫无察觉,甚至乐在其中!
一些貌似可靠的数据来源,也可能藏着一本正经的胡说八道。比如TED演讲中的统计数字、《纽约时报》等媒体报道的大数据分析新算法、甚至是医学期刊中的诊断数据……虚假信息都有可能鱼目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯吗?
对此,华盛顿大学专门开发了一门尚未开课即爆满的公开课,而这本书正是源自这门引发热议的课程。
两位作者花了多年时间研究打着数学和统计学幌子的胡扯,犀利幽默地对它们分门别类一一剖析,帮助我们培养批判性思维,有效分析海量数据和观点,拆穿无用数据的精致伪装,在信息时代做个游刃有余的明白人。
话说回来,除了教会你如何识别数据胡扯,当你迫不得已需要胡扯时,它也会成为一本实操性强的工具书呢!
章节介绍
推荐序1 科学地对抗科学的胡扯的“胡扯” / V
推荐序2 拨开扯淡的迷雾 / IX
推荐序3 闲得没事也别胡扯 / XIII
前 言 / XVII
第1 章 胡扯无处不在
惯于欺骗的甲壳类动物和狡猾的乌鸦 / 003
狡辩之词和律师的语言 / 008
谎言传千里,真相难出门 / 012
第2 章 媒体、信息和错误信息
印刷厂就是妓院 / 022
不加渲染的事实宛若凤毛麟角 / 025
偏见性、个人化和对立 / 029
错误信息和虚假信息 / 033
新型造假者 / 037
第3 章 胡扯的本质
胡扯与黑箱 / 048
刑事机器学习 / 051
第4 章 因果关系
夜晚天空红艳艳,水手脸上笑容现 / 060
关于因果关系的思考 / 064
相关性不会增加报纸销量 / 068
延迟享乐与共同原因 / 076
伪相关性 / 078
吸烟不会导致死亡? / 083
如果其他方法都行不通,那就人为操控吧 / 084
第5 章 数字与胡扯
提取数字 / 095
有害的百分比 / 098
古德哈特定律 / 106
数学滥用 / 110
僵尸统计数据 / 115
第6 章 选择偏倚
你看到什么取决于你看的是哪儿 / 126
隐藏在墨菲定律背后的原因 / 129
帅哥和顶级程序员 / 137
音乐才华的致命危险 / 143
消除选择偏倚 / 148
第7 章 数据可视化
数据可视化的发端 / 158
鸭子! / 162
水晶鞋和丑陋的继姐 / 166
邪恶的轴 / 177
比例油墨原理 / 192
第8 章 大数据与胡扯
机器是怎么看到东西的 / 213
废料进,废品出 / 219
同性恋雷达和胡扯的结论 / 221
机器是怎么思考的 / 226
机器为什么失败 / 230
第9 章 科学的易感性
检察官谬误 / 242
p 值操纵和发表偏倚 / 251
点击诱饵科学 / 260
胡扯科学的市场 / 265
科学为什么有用 / 271
第10 章 辨别胡扯
1. 质疑信息来源 / 278
2. 小心不公平的比较 / 281
3.如果好得或糟糕得不像是真的…… / 284
4. 从数量级考虑 / 287
5. 避免证真偏差 / 292
6. 考虑多个假设 / 295
辨别网上的胡扯 / 296
第11 章 驳斥胡扯
使用归谬法 / 306
要让人难以忘记 / 308
寻找反例 / 311
使用类比 / 312
重新绘制图表 / 314
使用零模型 / 316
揭穿者心理 / 319
致 谢 / 329
注 释 / 333
参考文献 / 349
网盘地址:
书友评论
-
pineshan的评论
信息甄别与真实通讯
-
中信出版鹦鹉螺的评论
在被数据包围的世界里,你需要这本“生存指南”。
-
鹅克拉何马的评论
一本《人类驯服数据为己所用骚操作大全》,强烈推荐”数据可视化”那章,笑出声的同时还偷师了几个让辣鸡PPT看起来很厉害的小技巧