作者 | 陈思
编辑 | Natalie
导读: 北京时间 7 月 3 日,一年一度的百度 AI 开发者大会如期而至,AI 前线受邀参加了本次活动。
今年的 AI 开发者大会有些不同,不仅在于技术上的迭代,更在于人事的变动。空缺了好一段时间的 CTO 职位由王海峰出任,景鲲此次也以百度副总裁的身份亮相。同时,何俊杰加盟百度任副总裁一职,负责战略投资;沈抖接替向海龙担任百度高级副总裁。新一届的高管不仅平均年龄更低了,王海峰、沈抖、景鲲等人也都具备深厚的技术底蕴。
随着以技术人为核心的新一届高管集团陆续登场,百度人工智能的全新战略布局也正式亮相。虽然大会中途出现了一段不太和谐的小插曲,但 AI 落地的道路怎么可能一帆风顺?以下是 AI 前线从现场发回的详细报道。
李彦宏:AI 前行的路上总会有人泼凉水
2019 年 5 月 7 日,百度第一季度财报公布,财报显示:百度第一季度总营收为 241.23 亿元人民币,同比增长 15%,市场预期 242.7 亿元;剔除分拆业务对收入的影响,同比增长 21%。归属百度的净亏损为 3.27 亿元,去年同期为净利润 66.94 亿元。
彼时,李彦宏的在内部信中说道:
在移动业务上,我们会继续强化、放大百度已经形成的一超多强的产品矩阵优势,在搜索、信息流双引擎驱动的基础上进一步升级为生态思维,通过社区化运营、垂类内容深耕、新交互形式提升用户时长和黏性。在活跃用户量和有效时长增长的基础上,实现收入结构的多元化和商业模式的健康良性升级。
在 AI 业务上,我们需要深入理解各行业的发展模式,精耕细作,抓住产业智能化的机遇,进一步拓宽我们的业务领域和商业模式,加快我们业务发展。
带着这样的目标,百度迎来了第三届 AI 开发者大会。
在大会开场演讲中,李彦宏表示:“这已经是第三届 AI 开发者大会了,中国有句老话叫:一生二,二生三,三生万物。AI 虽然不能产生万物,但是正在‘唤醒万物’。”
说到唤醒,还记得 2018 年百度世界大会上,李彦宏跟小度做了一次多轮对话。时隔半年,小度又有了新本领。
现场,李彦宏演示了小度的“全双工免唤醒”能力,不仅实现了“一次唤醒,多轮交互”,还能在与他人对话的同时互不干扰地实现人机交互,即小度知道什么时候该应答,执行任务;什么时候只需要听着,不搭话,不反应。另外值得一提的是,对于中英文夹杂的识别,小度完全可以自如地应对。
但是,今天的小度似乎有些小脾气,现场使用唤醒词“小度小度”一直未能一次性唤醒成功,但是新本领“全双工免唤醒”功能表现优异,哪怕中间经过了一大段无关对话,依然可以无需唤醒让小度切换曲目或降低音量。今年有不少科技大厂都为智能助理部署了免唤醒能力,比如谷歌的 Google Assistant、苹果 Siri。
万万没想到,在退出的时候,又出现了退出两次才成功的情况,可能是现场音乐声音太大了吧。
正如李彦宏在之前的内部信中所说,产业智能化会带来很多的机遇。在现场,李彦宏再次强调:不论在医疗健康、金融服务、交通出行等等领域,都感受着 AI 带来的改变,一个小环节就能带来巨大的用户体验升级。
“停车”是城市的一大痛点。2018 年我国乘用车的保有量达到 2.7 亿台,而停车位的缺口高达 6000 万;有 44% 的车位利用率非常低。在一线城市,司机 30% 的驾驶时间花在停车、找车位上。
去年百度世界大会,李彦宏向大家介绍了百度在自主泊车(Valet Parking)方向的探索。半年后的今天,他演示了百度自主泊车解决方案的新进展:可以通过手机 APP 召唤车辆;如果目的地附近非常拥堵,司机可以直接下车走人,无人驾驶的车低调地跟在人类司机驾驶的车流里,自动排队开往地下停车场。
而在智慧城市领域,百度在保定通过对智能红绿灯的运营,对提升交通效率有明显提升的效果。实测显示,在早晚高峰期间,市民的行程延误时间减少了 20%~30%
就在 AI 前线记者奋笔疾书进行记录的时候,突然听到了一声惊呼:“What’s your problem?”抬头一看才发现李彦宏被从头浇了一瓶水。
本以为是安排的环节,但是在看到安保人员的行动之后,我们确定了这是个突发事件,不过李厂长的反应很是优秀,面对满场的沉默,李彦宏说:“大家看,在 AI 前进的道路上会有各种各样的事情发生,但是我们前进的决心不会改变,AI 会改变每一个人的生活。”全场响起热烈的掌声。
小插曲之后,李彦宏简单收拾了一下,立刻重新投入到演讲当中。
李彦宏通过现场连线,与吉利汽车控股集团董事长李书福进行互动,展示吉利汽车与百度 AI 相结合打造的车机互动功能。不过这次小度助手又不给面子了,经过四次唤醒才终于唤醒成功。李书福到达现场之后,李彦宏宣布:百度和吉利已经在智能网联、智能驾驶、智能家居、电子商务等领域达成战略合作。
此外,在金融领域,浦发和百度成立了深度学习联合实验室,在智能客服、深度学习等领域取得了非常好的联创成绩。
本场大会的主题是“Do Better,科技为更好”,在演讲中,李彦宏也介绍了百度 AI 在寻人、助盲等领域的一些案例,并表示:百度人在技术创新的同时,也在积极用技术去解决多种社会问题,用科技让世界变得更美好。
王海峰:百度大脑升级 5.0,发布远场语音交互芯片“鸿鹄”
如前文所述,本届百度高管经历了一场巨大的变化,不仅平均年龄更加年轻化了,技术人更是成为了核心。
空缺了九年之久的 CTO 岗位终于有人接任,王海峰是不二人选。
2010 年,王海峰加入百度,值得一提的是,此时也正是上一任 CTO 李一男离开百度的时间。
2010 至 2013 年期间,他先后为百度创建了自然语言处理部、互联网数据研发部(包括知识图谱和互联网数据挖掘)、推荐引擎和个性化部、多媒体部(包括语音和图像技术)、图片搜索部、语音技术部等。
2013 年上半年,王海峰作为执行负责人协助创建了百度深度学习研究院(IDL)。
从这段履历可以看出,王海峰自加入百度起,就一直致力于人工智能相关的工作。到了 2018 年,时任百度集团总裁的陆奇离开之后,王海峰扛起了 AI 技术平台体系(AIG)和基础技术体系(TG)总负责人的重任。
今天的百度 AI 开发者大会,是王海峰成为 CTO 后首次公开亮相。
王海峰开场带来了一段演示:机械臂倒盖碗茶。这个机械臂既会茶艺绝活儿,还能说会道。据了解,这个机械臂融合了机器人视觉、语音、自然语言处理等多种人工智能技术,百度 AI 大脑就是这背后的支撑。
在演讲中,王海峰宣布:百度大脑升级至 5.0,形成了包括基础层、感知层、认知层、平台层和 AI 安全五个部分的核心架构。百度大脑 5.0 正式成为软硬件一体的 AI 大生产平台。
随后,百度语音技术部高级总监高亮进行了一段演示,一段中英夹杂的话被百度输入法流畅、精准、及时地识别出来,百度大脑流式多级的截断注意力模型(SMLTA)提供了技术支持,它能让语音识别速度大幅提升,准确率提 15%-20%,是首个基于流式注意力的语音识别线上服务。
除此之外,百度与浦发银行打造的虚拟客服助理、对纪录片中的角色、人物关系、音乐种类、取景地、影片主题等信息的精准分析,都是百度大脑能力的展示。
整体来说,百度大脑语音、视觉、语言和知识等核心算法再度升级。包括流式多级的截断注意力模型(SMLTA)和风格迁移的语音合成技术;知识增强的语义理解框架 ERNIE 和基于知识图谱的视频语义理解技术;高准确、低时延的机器同传技术。值得关注的是,在语言方面,百度大脑推出知识增强的语义理解框架——ERNIE,再次全面刷新了中文自然语言处理任务效果,据称,该框架效果超越了谷歌 BERT。
继去年开发者大会发布“昆仑”芯片后,今年王海峰发布了一款新的芯片:远场语音交互芯片“鸿鹄”。该芯片使用了 HiFi4 自定义指令集,双核 DSP 核心,平均功耗仅 100mW。据了解,这款芯片是根据车规级标准打造,将为车载语音交互、智能家具等场景带来巨大的便利。
之后,王海峰与华为消费者 BG 软件总裁王成录博士联合宣布,百度飞桨 Paddlepaddle 与华为麒麟芯片达成深度合作。中国人自己的深度学习平台将运行在中国人自研的芯片上,“两大国货之光将充分发挥各自在软、硬件方面的优势,走出中国智能之路”。但双方具体的合作形式,暂未有更多信息透露。
景鲲:智能音箱是 AI 的一大载体
景鲲带领的 SLG 智能生活事业群组,小度及小度助手构建的 AI 生态,也是百度一条重要的赛道。
经过两年的飞速发展,截止到 2019 年 6 月,小度助手激活设备量已经超过 4 亿台,月交互次数已经超过 36 亿。另外据 Canalys 等三家机构报告显示,2019 年第一季度小度智能音箱出货量已经位列全球第三,中国第一。
现场,小度助手 5.0(DuerOS 5.0)正式发布,它包含全双工免唤醒能力、全球首创的家庭信息流、行业领先的家庭通讯与通知和全球首创的智能音箱 DLNA 直接投屏能力。小度全双工免唤醒除了能实现一次唤醒后免唤醒词连续对话,还特别拥有“拒绝反应”能力,它知道什么时候该应答和执行任务,什么时候只需要听着不搭话不反应。
景鲲表示:智能音箱已经不再仅仅是音箱,其第三方技能已经成为了第一大应用,智能音箱是人工智能的一大载体。
此外,景鲲在现场发布了小度智能音箱大金刚以及小度智能音箱 Play 两款新品,均包含百度独创的 DLAN 直接投屏能力。最后,一款去掉电源线的小度在家 1C 4G 版亮相,再次吸引了全场的目光,至此,小度全家福亮相完毕。
押注 Apollo,自动驾驶这张王牌怎么打?
作为百度主推的人工智能业务之一,Apollo 自上线以来就得到了全球的关注,百度也在 Apollo 身上倾注了太多的心血。
所幸,一切付出都是值得的,百度副总裁、智能驾驶事业群组总经理李震宇在演讲中介绍了 Apollo 的新物种:
Apollo 已经与众多开发者在 9 大场景,完成多样化的“新物种”创新并相继落地,包括无人零售车、景区智能漫步车、智能清扫车、无人挖掘车以及本次大会首次亮相的酷黑自动驾驶教学小车。其中,阿波龙已搭载 4 万名乘客,在 25 个城市落地运营;新石器无人零售车已提供零售服务 16 万次;金瑞麒智能漫游车已签约 43 个景区。截至目前,Apollo 生态合作伙伴规模已达 156 家。
7 月 1 日,百度拿到了北京首批 T4 级别自动驾驶测试的全部 5 张牌照。
据了解,T4 技术标准要求能够通过隧道、学校等区域,应对行人违章通行、施工路段绕行等复杂场景,车辆还要准确识别多种交通要素如潮汐车道、可变导向车道、路口左转待转、临时红绿灯等特殊交通标志、标线和信号灯,并可以正确实现无障碍通行。
此外,车辆还要具备超车能力,并具备坡路行驶,具备坡道停车和起步能力,误差要严格小于 15cm。不仅如此,在停车入库和侧方停车等泊车能力也需进行考核,车辆需要应对车库内行人和障碍物识别等细节场景。
7 月 2 日,百度 Apollo 5.0 悄然上线,这一全新版本仿佛是为 T4 牌照标准量身打造的。
继 Apollo Lite 之后,Apollo 5.0 新增了针对“复杂”道路场景的升级感知模型和定制的传感器校准服务。
Apollo 的 GitHub 更新日志显示:Apollo 5.0 是为支持地理定位自动驾驶的批量生产而做出的努力,搭载该系统的无人车现在拥有 360 度的可视能力,这让它更安全、更灵敏。
新版本还引入了全新数据通道服务,包含了每辆车的校准选项,以及经过修饰的预测评估器和地图数据验证工具。另外值得注意的是,Apollo 5.0 的开放空间规划器使用新的基于场景的规划算法,并对多种路况进行了改进支持,包括路口是否有明显的交通标志和信号灯等等。
百度在 Apollo 上花费如此大的心血,或许是与 Robotaxi 服务有关。
今年 6 月,百度在长沙一口气拿下了 45 张无人车测试牌照,而长沙市颁布的《长沙市智能网联汽车道路测试管理实施细则(试行)V2.0》中规定,在法律规定的条件下允许第三方乘客搭乘智能网联汽车。对于百度来说,这是个令人振奋的好消息,布局多年的 Apollo 生态在此刻看到了新的希望,虽然无人车载客服务看起来还很遥远,但是谁先走出第一步,谁就有可能先抢占最大的市场。
本次大会,李震宇正式宣布 Apollo Go 正式亮相长沙,会率先帮助长沙完成“城市级”智能化升级,并打造全国最大规模的 L4 级自动驾驶出租车车队。
百度也“刷新”
2017 年,微软 CEO 萨蒂亚·纳德拉写了一本书,名曰《刷新》,讲述的是他自 2014 年接任 CEO 职位以来,微软的变革路径。
如今的百度也迎来了一次“刷新”。
除了王海峰出任 CTO 以外,侯震宇、景鲲等人被陆续提拔为百度副总裁。同时,何俊杰加盟百度任副总裁一职,负责战略投资;沈抖接替向海龙担任百度高级副总裁,负责移动移动生态事业群组工作。
值得一提的是,王海峰、沈抖、景鲲等人都具备深厚的技术底蕴,并且这些人都是为百度注入新动力的功臣。
去年的百度世界大会上,百度 App 11.0 上线,仅第一季度的日活用户就达到了 1.74 亿,同比增长 28%;百度 App 和短视频信息流总用户时长同比增长 83%;智能小程序月活跃仅上线 3 个季度,月活跃用户达到 1.81 亿,环比增长 23%。本届大会上,景鲲宣布小度助手的激活设备已经达到了 4 亿,月交互次数超过 36 亿次。
依靠“搜索 + 信息流”双引擎,百度移动生态的活力凸显,而这一业务的负责人正是沈抖。
侯震宇及其团队则在 2019 年春晚的“红包大战”中表现出色,为百度 App 产品矩阵赢下了关键一仗。
景鲲带领的智能生活事业群组,更是让小度成为了中国最大、最活跃的对话式人工智能平台,而小度智能音箱在 2019 年第一季度也一跃成为了全国出货量第一、全球第三的智能音箱产品。
这次大规模的人事调整被外界认为是一次“自救”行动,百度太需要一次“刷新”了,从人事到战略,“破而后立”或许是百度重新回归技术高地的最佳途径。
本文为专栏文章,来自:AI前线,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/65419.html 。