摘要:「人工智能」已经成为当下最为火热的词汇,它不仅涵盖了无人驾驶,语音助手,甚至图像识别也是它下面的分支。目前人们已经成功地将它调教成能够辨识猫咪的智慧体,但「猫脸识别」只是人工智能成长中的一小步,要想完全成为人类想象中的样子,它或许还要先掌握「无监督学习」这个重要技能。
在 2012 年之时,全世界都知道了 Google 在它的秘密实验室 X lab 里进行的惊人研究。模拟包含三百万神经元的一个巨大组织学习如何在没有人接入的情况下,从 YouTube 视频中提取的图片中识别猫咪和人类。
这个项目背后的研究人员在 Google 内部的研究部门创立了为大家所熟知的新型研究项目——Google Brain。他们和其他地方的研究人员向世人证明了开发了十年的人工神经网络能够理解图片和精确理解对话。
其中的深度学习系统让 Google 等企业在人工智能技术上投入重金,这一度使得专家们提出人类需要谨防人工智能超越自身的言论。
然而 Google 的「猫脸识别」某种意义上而言却是一条死路。同样,深度学习成功的案例也要依赖人类来帮助它们学习——人工智能能否摆脱人类的「投食」将最终影响它的发展。
「猫脸识别」背后的技术
Google 的实验使用的是一种被称为无监督学习的方法。采用这个方法的机器将会被喂给一些粗略的数据,并且必须在无人介入的情况下自行分辨这些数据。尽管它能辨识猫咪,面孔和其他的一些物体,但它的精确度还不足以派上实际的用场。深度学习研究和其衍生出的产品依然停留在无监督学习之上——无监督学习需要的数据依然由人类分类打上标签。
即使这样,它依然在很多问题上出奇地有效率,比如辨识图片中的物体,过滤垃圾邮件,甚至是为短消息提供建议回复。这项功能在去年已经被 Google 运用在了相应的产品中了。Google Brain 项目的领头人 Jeff Dean 表示,如果机器想要继续提高对世界的认识水平,那么无人监督学习可能还是必要的。
「我十分确定,我们需要它。」Dean 说道,「如果输入的数据都是正确的,那么无监督学习是一套不错的机制。最终无监督学习将会成为建立真正的智能系统的最重要部件——人类在学习的过程中是完全地无监督的,而这是机器的无监督学习的最终方向。」
我们在婴儿时期学习的方式就是一个例证。比如,婴儿能明白即使物体不在视野内,还依然存在;物体失去支撑,就会倒下……这些都是婴儿通过观察世界而得到的信息,无需详细地指导。无论是机器人还是动物,他们都必须要有这样的常识,才能在世界上存活下去。不仅如此,对于表面上看上去抽象的任务,如理解语言,这个道理同样适用。
找出机器怎样做到人类婴儿毫不费力完成任务的方法对于人工智能想要进一步发展而言,也是至关重要的,Facebook 人工智能研究组的总监 Yann LeCun 表示。「我们都知道无监督学习是我们最终的答案,」他说道,「解决这个问题将会让我们的技术得到更进一步的发展。」
无监督学习的探索
尽管他们还没有拿到最终答案,但无论是如 Google 和 Facebook 这样的大企业中的人员,还是学界都在尝试探索无监督学习有限的形态。
其中一个研究的目的是创造出一套人工神经网络,这套网络能从视频和图像中获取知识,并且使用它们获取的关于世界的认识产生新的视觉图像——这暗示它们已经形成了如何起作用的内部描述。对世界的未来形成一套准确的基本预言对于人工智能的发展也是至关重要的。
Facebook 的研究人员开发出了名为「EyeScream」的软件,它能够生成诸如「教堂」或者「飞机」这样的提示符,同时他们还在开发一款能够预测视频中将会发生什么的软件。在 Google DeepMind 的研究人员已经开发出了能够填补图像中损失部分的软件。
DeepMind 也在测试能够完全替代无监督学习的另一个选择,「增强学习」——它被训练来根据自身的表现自动给予反馈。比如,反馈电脑游戏的得分情况。研究人员也展示了在不使用深度学习的情况下,软件是如何通过单个例子来识别单个手写字母的。
然而那些探索中目前没有一个找出了能保证无监督学习能达到人类水准的方法,或者能通过经验或实践学习复杂事物的软件。「目前我们似乎还欠缺一个关键点。」百度硅谷的人工智能实验主管 Adam Coates 说道。
监督学习在搜索中起到很大的作用,Coates 表示:「互联网公司能拿到人们操作和关心事情的大量数据,这些数据能被用来创造出比目前我们正在使用的语音交互和个人助手更强的服务。」大公司花费了数以百万计的美金,目的只是让外包商为它们的大数据「贴标签」,以喂给自己的机器学习系统。
来自 Facebook 的 LeCun 相信,未来研究者将不必以给数据「贴标签」维持生计。但他却拒绝预测人工智能还需要多久超过人类智能。「我们已经知道烹饪需要原料了;我们尚不明确的是菜谱而已,」他表示,「这也许要花上不少时间。」
本文编译自MIT Technology Review,配图来源于网络。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。