坐拥海量数据，社交平台就能“光明正大”地监测用户身心健康吗？

本文作者为Sam Volchenboum，外媒科技专栏作家。

整个世界如同大型的临床试验室。人类每分每秒都从不同渠道生成数据流。而在社交媒体、移动GPS、WiFi热点、网页记录、医疗卡，可穿戴式装置等等信息源上储存或流动的信息，都可能为人们的健康生活提供帮助。

可以想象，Facebook或Google作为目前最大的两家数据平台和搜索引擎，可以在病人检出癌症之前就预测到这一点。有人在社交网站上抱怨自己夜间盗汗和体重降低，他们可能不知道这是淋巴瘤的前兆；还有些人说自己早晨关节僵硬，而且很容易晒伤，而这可能预示着他们患有红斑狼疮。社交网络有可能在整理这些帖子时，从中发现蛛丝马迹。

这些迹象和预测也许能救人一命，或者改善用户的健康状况。但是社交网络并没有将这些信息暴露出来，这当然情有可原。那么问题来了，社交网络利用平台信息预测用户健康状况这件事的利弊如何衡量呢？

思想实验

虽然有报道称社交平台可用于预测甚至阻止自杀，但是有关其能在用户看医生得到确诊之前就预知未来的观点只是个假设。

假设Facebook可以透露一些去标识化的数据，例如用户的位置、旅行线路、喜好、发贴频率、情绪、浏览和搜索习惯，研究人员可以基于这些数据建立预测人身体和情绪状态的模型。

例如，数万个帖子组成的数据集中，有某些可以看做人们罹患癌症、抑郁症或炎性肠病方面的记录。研究人员利用机器学习技术可以在诊断前后采集这些数据并研究其语言、风格和内容，然后设计出模型，输入新的用户数据集，便可预测有哪些用户可能会有相同的病症。

此模型系统不需要关注用户类似发烧或体重减轻一样严重且发作较快的病症。它关注的是一些看似不重要的无关数据——如购买抗呕吐药物或观看失眠纪录片——这些数据可能会给预测加上重重一记实锤，表明用户可能有某种疾病。困难在于，我们在社交媒体留下的蛛丝马迹指向无限的可能性，有些很明显，有些则无从判断，却都可能影响者我们的身体健康和幸福生活。所以如何利用好这些数据又是另一回事了。

某些临床医生支持社交平台为了社会的利益，整合用户数据并提供相应信息。他们与数据科学公司Litmus Health展开合作，以便从临床试验中收集、整理和分析数据，并利用这些数据改善公民健康状况。然而，有关部门也需严格监管，从道德、技术和社会层面谨慎看待这一合作。

从监管的角度来看，所有社交媒体的服务条款中都标明他们有责任妥善处理用户数据。不走运的是，2014年Facebook与卡内基梅隆大学的研究表明，由于服务条款和/或隐私政策过于复杂，根本没人会阅读它们，用户只是盲目地阅读并在同意处点击对话而已。

社交平台的正确“身份认知”

社交平台如果想要扮演道德上的“无害”角色，有很多种方法可以实现——它们可以制定简单易懂的数据政策，避免以不恰当的方式使用用户个人资料。要在伦理框架下使用大数据必须考虑用户的身份、隐私、所有权和声誉。目前对于大多数公司来说，未经用户同意便使用它们的数据构建疾病预测模型，可能有悖于其既定的价值体系。但是，征得用户同意可能的做法也不过就是把本来就没人看的用户协议写得更长些。

如果公司要求用户授权允许使用他们的数据并参与实验中，那么公司本身应该将信息收集、使用和分享的过程公开透明化。假设一个社交网络可以使用某种算法来分析用户的活动——他们抱怨的事物、他们分享的文章、他们点赞的帖子等等。AI便可以探寻到一种表明用户可能存在健康问题的模式。

假设现在能够跨越社交网络、可穿戴式传感器和移动设备等不同数据源获得可用数据流。那么这些不同数据流的预测价值可能马上会水涨船高。例如，用户关于头痛和恶心的帖子，Fitbit上的逐步减少的步数，导航过药房的手机GPS数据，以与反应速度和协调性微妙相关的打字准确度的降低，这一些都可能指向不容乐观的身体状况。

这种完美的预测模型一旦推出，一定技惊医疗界，但更多的情况是，大多数有头痛和恶心症状的人也没有得脑肿瘤。

若社交媒体提示用户他们可能会感染流感，也许促使其寻求医生诊断或治疗，这两者都是相对轻松和廉价的干预措施。但在类似情况下，如果给出的建议是用户可能患有癌症，这会引起用户恐慌并进一步带来更严重的后果，轻则导致情绪创伤，重则会导致用户盲目进行有害的测试和治疗。

由于预测系统针对对象为数百万用户，对于医疗体系而言，潜在的后勤和财务影响可能是巨大的。虽然基于算法的预测可能涉及我们生活的许多方面，颇有用处，上述这些例子说明了算法预测在健康领域更要三思后行。无论对于潜在的利益亦或风险，都应该进行严密的管理和监控。