射手、农场主、台球,《三体》里探讨的数据科学

《三体》是一本深探宇宙本源以及生命哲学的书,所以它对于一个小分支学科“数据科学”也有很精妙的见解。

santi

《三体》是一本深探宇宙本源以及生命哲学的书,所以它对于一个小分支学科“数据科学”也有很精妙的见解。

主人公汪淼先是告诉我们“数据运营与分析”的局限性

在“科学边界”的学者们进行讨论时,常用到一个缩写词:SF,它不是指科幻,而是上面那两个词的缩写。这源自两个假说,都涉及到宇宙规律的本质。

“射手”假说:有一名神枪手,在一个靶子上每隔十厘米打一个洞。设想这个靶子的平面上生活着一种二维智能生物,它们中的科学家在对自己的宇宙进行观察后,发现了一个伟大的律:“宇宙每隔十厘米,必然会有一个洞。”它们把这个神枪手一时兴起的随意行为,看成了自己宇宙中的铁律。

“农场主假说”则有一层令人不安的恐怖色彩:一个农场里有一群火鸡,农场主每天中午十一点来给它们喂食。火鸡中的一名科学家观察这个现象,一直观察了近一年都没有例外,于是它也发现了自己宇宙中的伟大定律:“每天上午十一点,就有食物降临。”它在感恩节早晨向火鸡们公布了这个定律,但这天上午十一点食物没有降临,农场主进来把它们都捉去杀了。

射手和农场主的故事告诉我们一个简单的道理:采样样本要足够,但是却永远不足够。

我们能从数据样本里得出的结论,始终只是一个统计性的结论,不是定论。从一定意义上讲,数据只反映结论成立的“机率”的大小,而不反映结论成立的“对错”。我们要时刻提醒自己:我们是在定量,而不是在定性。

《三体》中,汪淼又和另一位大牛丁仪探讨了试验数据的风险

“那好吧,打过台球吗?”丁仪走到了台球桌前。

“上学时随便玩过几下。”

“我和她很喜欢打,因为这让我们想到了加速器中的粒子碰撞。”

丁仪说着拿起黑白两个球,将黑球放到洞旁,将白球放到距黑球仅十厘米左右的位置,问汪淼,“能把黑球打进去吗?”

“这么近谁都能。”

“试试。”

汪淼拿球杆,轻击白球,将黑球撞入洞内。

“很好,来,我们把球桌换个位置。”丁仪招呼一脸迷惑的汪淼,两人抬起沉重的球桌,将它搬到客厅靠窗的一角。放稳后,丁仪从球袋内掏出刚才打进去的黑球,将它放到洞边,又拾起那个白球,再次放到距黑球十厘米左右的地方,“这次还能打进去吗?”

“当然。”

“打吧。”

汪淼再次轻而易举地将黑球打入洞内。

“搬。”丁仪挥手示意,两人再次抬起球桌,搬到客厅的第三个角,丁仪又将黑白两个球摆放到同样的位置,“打吧。”

“我说,我们……”

“打吧。”

汪淼无奈地笑笑,第三次将黑球击入洞内。

他们又搬了两次台球桌,一次搬到了客厅靠门的一角,最后一次搬回了原位。丁仪又两次将黑白球摆到洞前的位置,汪淼又两次将黑球击入洞内。这时两人都有些出汗了。

“好了,实验结束,让我们来分析一下结果。”丁仪点上一枝烟说,“我们总共进行了五次试验,其中四次在不同的空间位置和不同的时间,两次在同一空间位置但时间不同。您不对结果震惊吗?”他夸张地张开双臂,“五次,撞击试验的结果居然都一样!”

“你到底想表达什么?”汪淼喘着气问。

“你现在对这令人难以置信的结果做出解释,用物理学语言。”

“这……在五次试验中,两个球的质量是没有变化的;所处位置,当然是以球桌面为参照系来说,也没有变化;白球撞击黑球的速度向量也基本没有变化,因而两球之间的动量交换也没有变化,所以五次试验中黑球当然都被击入洞中。”

丁仪拿起撂在地板上的一瓶白兰地,把两个脏兮兮的杯子分别倒满,递给汪淼一杯,后者谢绝了。“应该庆祝一下,我们发现了一个伟大的定律:物理规律在时间和空间上是均匀的。人类历史上的所有物理学理论,从阿基米德原理到弦论,以至人类迄今为止的一切科学发现和思想成果,都是这个伟大定律的副产品,与我们相比,爱因斯坦和霍金才真是搞应用的俗人。”

“我还是不明白你想表达什么。”

“想象另一种结果:第一次,白球将黑球撞入洞内;第二次,黑球走偏了;第三次,黑球飞上了天花板;第四次,黑球像一只受惊的麻雀在房间里乱飞,最后钻进了您的衣袋;第五次,黑球以接近光速的速度飞出,把台球桌沿撞出一个缺口,击穿了墙壁,然后飞出地球,飞出太阳系,就像阿西莫夫描写的那样。这时您怎么想?”

丁仪盯着汪淼,后者沉默许久才问:“这事真的发生了,是吗?”

汪丁两人做的台球试验并不是一个精心设计的科学试验,但是它和大多数我们在现实中做的试验一样,简单,高效,目标明确。这个试验的结论非常符合“常识”和“预期”,但是和“真实”天差地别。科学边界的科学家们,做了更加精细的更加科学的试验,然后得到了完全不一样的结果。从某种角度来看,科学边界的试验结果更接近“真实”。

如何能够让我们平常做的简单试验的结果更加准确,更加贴近“真实”,是一个不容易的事情。在不断提高“真实”的标准的情况下,会越来越难。做一个好的试验工具来帮助我们降低试验数据的风险,这是一个很有意义的探索,值得我们去不断尝试。

有幸,我们一直在朝这个方向做着努力。

最后,看着现在疯狂的政治题材的韩剧和美剧,我们是不是应该欢迎《三体》降临?

作者:吆喝科技创始人及CEO 王晔博士

本文由 吆喝科技 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/38080.html 。

(0)
王晔的头像王晔专栏
上一篇 2016-11-12 20:11
下一篇 2016-11-14 18:40

相关文章

关注我们
关注我们
分享本页
返回顶部