大数据概念近乎透支,人工智能如何撩起下一波创业高潮?

摘要:大数据概念被热炒多年之后,我们是时候开始关注大数据人工智能在具体领域中的应用问题。那么,目前大数据和人工智能领域还存在着哪些技术挑战如何找到大数据和人工智能的创业入口,利用数据挖掘和机器学习的能力创造出更大的商业价值

作为第四次工业革命的引领性领域,近年来的人工智能和大数据持续升温。最近的AlphaGo事件更是将人工智能的前沿技术呈现于大众面前。

大数据概念被热炒多年之后,我们是时候开始关注大数据与人工智能在具体领域中的应用问题。那么,目前大数据和人工智能领域还存在着哪些技术挑战如何找到大数据和人工智能的创业入口,利用数据挖掘和机器学习的能力创造出更大的商业价值

近期,天天投联合腾讯众创、清华启迪之星举办了“人工智能和大数据投融资面对面”活动。在圆桌论坛环节,几位学术专家、投资人、创业者分别以各自的视角发表了自己的观点。

大数据概念近乎透支,人工智能如何撩起下一波创业高潮?

人工智能和大数据投融资面对面活动 圆桌论坛

大数据和人工智能领域的技术障碍

大数据技术本身的不可读性

清华大学机算机系崔鹏教授多年深耕于数据挖掘和信息处理领域的研究,他认为不管是大数据还是人工智能,从学术研究的角度来讲不是新的概念,核心基本都是围绕在数据分析和挖掘、数据建模等工作。

目前在大数据的不同层面,都出现了一些提供标准化服务的公司。 但大数据的核心部分,也就是数据的处理和分析,恰恰不容易用一个通用的框架来实现。

大数据有很多的数据来源,不同领域的数据也呈现出非常强的领域特性,我们不可能搞找到一个通用的数据模型,来解决所有的问题。因此,大数据如果想真正地投入到产业应用的话,一定是需要将懂大数据技术的人,与某一领域背景很强的人结合起来,才能够使大数据的分析和处理层面实现比较大的突破。

其实硅谷现在有些公司正在试研发一些大数据的标准化工具,但是就我们了解到的情况来看,尽管能够获得投资,他们的存活状态并不是太好。因为从企业的角度来讲,它并没有很好的应用场景。规模比较大的企业完全有能力自己构建一个数据分析团队,不太可能把所有的数据都交给专门做数据分析的服务商;而小公司采用这些些服务,还是会面临工具通用性上的问题。

另外,大数据技术本身的不可读性,使它目前存在着技术风险 。目前几乎所有大数据的分析,都是基于关联算法进行预测。也就是说,以前有大量的数据证明发生A就是发生B,基于这种逻辑的关联,我们就会预测在下次发生A时也会发生B。

但这些所谓的预测是存在精确度方面的限制的,并且整个过程是一个黑盒子,我们没有办法控制。因此,目前的大数据分析还不能实际应用于某些领域的一些严肃决策之中。2011年,Judea Pearl凭借因果推理模型拿到图灵奖,这也预示着计算机技术的发展将有可能打开黑盒子模型,使大数据分析变成一种可解释的行为。这与目前的大数据完全是两条线。

今年我们也看到一个标志性的事件,就是2015年10月份《科学》杂志出现的文章,只需要非常少量的样本,只用了几百个样本的数据,加上人的推理能力在里边,它的性能比用数十万的样本得到的效果还是好,这也预示着我们尽管目前大数据很热,在很多领域已经实现了实际应用,但从技术的发展来讲,目前的大数据技术并不是一个进口;以前瞻性的投资视角来看,还是应该关注更前沿的技术发展。

机器学习如何运用于数据治理

原英特尔中国研究院院长、驭势科技CEO吴甘沙认为,目前大数据与人工智能领域存在的技术障碍主要有以下两点:

一是大数据工具与特定领域的结合 。过去几年大数据关注的是最底层的存储,去解决分布式运算的基础设施的问题。现在是时候考虑如何进入到具体运用的问题。太计算机化的工具,绝大多数用户是不知道如何使用的。从某种程度上来说,如何提供实际可用的工具给不同领域的用户,有针对性地提取数据中的价值,这是现在很多厂商都要试图解决的问题。

第二是数据治理问题 。目前大家很少谈论大数据的数据治理环节。在传统的数据分析流程中,数据清洗花费的时间可能占到整个流程的60%-70%,消耗了大量精力和资源。现在,已经有一些机器学习运用于数据治理方面的研究和产业化的尝试出现,机器学习可以从非结构化的结构中学习出结构化的数据,并通过不断的学习把一些歧义消除。未来大数据和人工智能将出现一个交汇点,大数据解决通古晓今、见微知著的问题,人工智能则解决认知的问题,二者的结合会对一些重要领域的发展起到里程碑式的作用。最近IBM提出了“认知商业”的概念,某种程度上我们可以将其理解为人工智能和大数据的结合,相信这两种技术的组合将会有非常好的发展前景。

深度学习很好地反映了技术上面的发展,但它未必是一种终极状态。如何把深度学习和推理、逻辑这些模型、算法结合起来,把人工智能与现代应用的需求结合起来,对已有的技术进行重新组合,搭出一些独特的架构,将人工智能从传统的感知带入到拥有决策能力的阶段,来实现工程上的创新,是未来非常值得期待的。

人工智能和大数据创业的建议

行业垂直类的大数据项目受青睐

在创势资本创始合伙人汤旭东、极客邦创始人蒋涛看来,现在一些行业垂直类的大数据项目更被看好,通过三个维度对项目进行评估。

第一是要有基于自然语言处理的核心技术,二是拥有更多的数据源,三是要解决客户的实际问题 ,实现数据变现。即使是目前的市场容量还不大,但如果能真正解决用户的实际问题,就是值得投资的项目。

集中精力做到领域化和专业化

虽然吴甘沙创业的时间不长,但却深有感触。在吴甘沙看来,创业者 首先要明确要解决的问题和自身专注的领域分别是什么 。每个领域都有不同的问题,你要解决的问题是不是用户真正的需求。

第二是短期内,你的目标能不能实现 。有时不光是技术上的问题,还要对市场和政策等方面进行综合考量。

第三个就是合伙人 。在人工智能领域创业还是存在一定的技术壁垒。如想想做出与众不同的产品,还是需要能力很强的专业人才,如果能忽悠到很强的人和你一起创业,一定是事半功倍的。

利用技术实现产业上的创新

图灵机器人创始人俞志晨认为,在人工智能和大数据领域创业,不仅技术壁垒很强,对创新能力要求同样很高,人工智能和大数据是一个长线的发展过程,怎样用技术创造出符合当前环境要求、更具创新性质的产品,是最值得关注和探索的。

凭借数据的力量提升领域竞争力

不管是零售还是商城,许多行业都可以受益于数据驱动的方法和技术。崔鹏教授分析到,大数据的投资热也持续了很长一段时间,“大数据”的概念也慢慢被透支。如何判断这个公司是不是真正利用大数据技术的本质在做产品, 利用数据的力量提升在某一垂直领域竞争力,而不是只扣一个概念。

对于用户来说,自己做大数据分析是一什非常奢侈的事情,因为它不是买几个工具就可以做成的,而是要真正懂得怎么样对数据进行建模,怎么样进行数据分析,并和公司里其他部门深度耦合才能解决。 一些初创公司不具备这样的实力,可以向一些研究机构或是高校寻求“产学研”方面的合作,这也是很好的方式。

利用已有的能力和基础加速进展

数据堂CEO齐红威坦言,他在创业的过程中同样经历了很多的失败和挫折,总结出三点建议和大家分享。

专注。尤其是在创业初期,精力和时间都是有限的,领域化、专注化非常重要。

开放的思维。尤其是在VR、AR和大数据领域,一定要想办法利用已有的能力和基础,比如数据层面的基础或者技术层面的技术,这样会加速你的进展,不要所有的事情都自己从头做。

耐心。这件事情不比其他的领域,尤其移动互联网靠一定模式砸出来,要累积技术能力,要有很强的耐心。

结语

AlphaGo令人震撼的思维能力背后,是大数据挖掘和学习能力。 随 着硬件的达标,算法的进步,数据的积累,也使我们在人工智能的垂直领域看到了更多新的机遇和想法。大数据与人工智能将成为企业发展的强大助力,产生更大的商业价值。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(0)
张乐的头像张乐编辑
上一篇 2016-04-07
下一篇 2016-04-10

相关文章

  • 阿里云估值390亿美元,摩根士丹利判断三年后阿里股价靠云计算

    近日,美国五大投行之一的摩根士丹利发布报告称,阿里巴巴的云计算业务阿里云正在迅速崛起,其单独估值已经高达 390 亿美元。

    2016-07-01
    0
  • 数据挖掘化功大法(2)——挖掘模式

    数据模式包括:特征化与区分、频繁模式、关联和相关性挖掘、分类与回归、聚类分析、离群点分析等。 任务可以分为两类:描述性和预测性数据。 数据特征化:汇总所研究类的数据。 数据区分:将目标类一个或多个可比较类进行比较。 频繁模式挖掘、关联和相关性: 频繁模式(Frequent Pattern)是频繁出现在数据集中的模式(如项集,子序列和子结构)。频繁模式一般可以…

    2015-01-02
    0
  • 如何解读决策树和随机森林的内部工作机制?

    随机森林在过去几年里得到了蓬勃的发展。它是一种非线性的基于树的模型,往往可以得到准确的结果。但是,随机森林的工作过程大都处于黑箱状态,往往难以解读和完全理解。近日,Pivotal Engineering Journal 网站发表了一篇文章,对随机森林的基础进行了深度解读。该文从随机森林的构造模块决策树谈起,通过生动的图表对随机森林的工作过程进行了介绍,能够帮…

    2019-09-08
    0
  • 数据挖掘系列篇之会员分析

    说到数据挖掘,就不得不说到会员分析。老生常谈的问题,包括会员分级、用户画像、会员个性化营销、会员价值挖掘等等。而现在围绕会员的运营模式也在发生着变化,从过去做产品,到现在做会员服务,从P到S的转变势必会需要介入数据来挖掘会员的特征、习惯、活跃、忠诚度等。凡是接触到会员分析这块,都会谈到会员分级和忠诚度这些话题。至于为什么从零售到金融,从线下到线上都在谈这个,…

    2015-12-04
    0
  • 17个值得关注的人工智能(AI)营销工具

    本文将深入研究人工智能营销策略的世界,通过分析17个典型的AI营销工具,探索如何通过利用人工智能驱动的工具和技术来创建强大的数字营销。

    2023-11-29
    0
关注我们
关注我们
分享本页
返回顶部