摘要:芮勇认为实现真正的人工智能大约要500年,“你要让我在后面再加个0我也不反对”。
微软亚洲研究院常务副院长芮勇认为外界对人工智能的看待并不理性,甚至被夸大地解读成“战胜人类”,在他看来,缺乏常识、没有概念这些都是人工智能的硬伤,或许在计算、记忆领域,人工智能将超过人类的表现,但是在人类擅长的想象力、创造力领域,人工智能还没有找到打开大门的钥匙。
人工智能也分强人工智能和弱人工智能。从弱人工智能到强人工智能还有很长的距离。今天所有的人工智能几乎都是来自于人类过去的大数据,没有任何一个领域的能力源自自我意识,不管是象棋还是围棋,计算机都是从人类过去的棋谱中学习。其他领域也是类似,计算机在做图像识别的时候,也是从人类已有的大数据中学习了大量的图片。
在面对人类从来没有教过的问题时,计算机就会一窍不通。假如让AlphaGo去下跳棋,它就会完全傻掉。甚至说把围棋的棋盘稍作修改,从19×19的格子变成21×21的格子,AlphaGo都招架不住,但是人类就没有问题。
我们今天看到的绝大多数的人工智能是弱人工智能,这是说它只能做一件事情,做到比较好。会下围棋的只会下围棋,不会下跳棋,这是很单一的弱人工智能,强人工智能则会全面达到人类的水平。AlphaGo可以打败三十多岁的李世石,但它的学习能力不及一个5岁的小孩,这二者是有很大区别的,也是弱人工智能和强人工智能的区别。
人类的学习不完全是通过样本获取的。比如说目前计算机在人脸识别领域做得还不错,可以达到90%以上的准确率,但它是通过看上百万幅图片做到的,人类不是这样,小孩生下来以后一段时间就能认识妈妈。
我更想表述的观点是,人类和人工智能是各有所长的。人类的大脑分左脑和右脑,左脑控制语言、逻辑思维和理性,右脑则掌管着创造性和直觉。
其实今天的人工智能,它很强的一点是记忆能力和计算能力太强大了。它不如人类的是创造力、想象力。把计算机放在苹果树下,一个苹果砸到上面,它不会联想到这个跟万有引力有什么关系,它没有这种概念。但是牛顿被苹果砸了之后,就会思考和想象,这是今天计算机和人工智能远远做不到的。
所以关于人类和人工智能的关系并不是去PK,而是说人类加上人工智能,或者加上计算机,使得人类更强大,增强智能。
具体来说人工智能的缺陷会有哪些体现呢?比如说语音识别领域,在很安静的环境下,人工智能几乎跟人类的语音识别水平差不多,但很多情况下环境不一定是安静的,如果在一个嘈杂的环境下,几个人同时说话,人是有能力选择性听某一个人的声音,但是人工智能做不到。
即便是这个问题解决了,可以在能力上突破这个难关,人工智能还是无法像人类一样,这是因为人工智能缺乏常识,今天的机器是没有常识的。
没有常识的机器没有办法像人类一样,小学生都做过一个题目叫鸡兔同笼,一共有多少个头、多少只脚,算一下有多少只鸡和多少只兔。这个题目的前提是小学生是知道鸡有一个头两只脚,兔子有一个头四只脚,但计算机是不知道的,这个题目就会把它难住。
但告诉计算机这个前提之后,把题目换成鸭狗同笼,计算机还是不会做,因为新的常识它也没有。所以在没有常识之前,计算机没办法达到人类的各种智能,并且这是一个必要不充分条件,即使有一天它知道了所有的常识,计算机也缺乏形象思维和创造能力。人类很多问题都不知道大脑为什么会那样想,计算机的逻辑是一步一步,“突发奇想”这种事情只存在人类中,而不可能发生在现阶段的人工智能领域。
在上世纪60年代,一位人工智能的科学家曾经说要实现真正的人工智能可能需要5到500年的时间,我是完全站在500年那边的,你要让我在后面再加个0我也不反对。
总结来看,基本上是在任何有规则的,并且规则非常明确的情况下,不管是下围棋、跳棋、象棋、五子棋,只要是有规则的,计算机未来都会超越人类,不超越人类是不对的。
除了有明确规则之外的领域,计算机和人工智能还有很长的路要走,因为人类强的地方,就是在很多信息不全的情况下,人类可以自动补全。人类其实是可以在这种情况下做出判断,在这种情况下,人类的力量远远大于机器的力量。
目前来看,关于人工智能的研究,除了计算机科学这个学派以外,仿生学也是重要的学派,仿生学就要研究人类机体的结构、功能和工作原理,寄希望通过模拟的方式运用到人工智能领域,换句话说,就是研究人类大脑是怎么思索这件事情。
在弱人工智能上,计算机科学这一派还是挺成功的,但是强人工智能有可能需要结合仿生学这一派,因为强人工智能是远远超越了有规则的东西,但这些没有规则的领域如何突破,可能需要对自身有更多的了解,如果能把计算机科学和仿生学相结合的话,人工智能的突破或许能更快。
人工智能这个行业还需要理性的看待,这半年人工智能很热,好处是全社会、全民包括政府都在关注,对产业和学术界的发展有好处,但这个泡沫千万不要吹大,吹大了以后大家会失望的,一旦失望对这个产业的打击是巨大的。
现在包括微软在内的很多公司和科学家都在解决人工智能缺乏常识这个难题,它有几个途径,第一个是纯人工做,向计算机普及人类所有的常识,但是这个工作量是巨大的,不可能完成的。
第二个途径是全自动,从一些结构化的数据库里抓取。比如美国有50个州,每一个州的名字是什么?首府在哪里?人口有多少?用机器学习的方法把它抓取出来,放在计算机的知识图谱里。
第三种途径是一个半自动的方法,可能对于大量的常识不会有非常标准的数据表,它是以非结构化文字的形式呈现,计算机要做的是能够从里面以“统计滚雪球的方法Statistical snow ball”抓取出知识。
事实上,强人工智能500年之后能不能做到我都不能确定,但没有关系,人类的伟大之处正在于此,不是说因为这件事情很难就不做了,正是因为它很难,所以才需要一步一步扎实地往前走。我希望各界同仁们不要把人工智能捧成夏天,然后再跌入冬天,而是要理性看待。
作者:李亚婷 liyating@iceo.com.cn
来源:微信公众号【中国企业家杂志】
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。