机器学习

  • 数据的价值哪里来?来自更好的决策

    现在大家都在谈大数据,数据分析,机器学习,但是这些都是手段,决策才是我们的目的,要想发挥数据的价值,先看看你身边的工作中有哪些决策,再决定用什么样的数据,怎样用数据来改进他们,我们先看一个小例子: 有100人来找你借钱,每人借100块,他们都愿意一年后还你115块(因为跟隔壁老王家借,也要还这么多),现在问题来了,你借还是不借,借给谁? 既然赚的钱已经固定了…

    2016-02-15
    0
  • 近200篇机器学习、深度学习资料分享

    摘要:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。 《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning. 《De…

    2016-02-15
    0
  • R语言中的情感分析与机器学习

    利用机器学习可以很方便的做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由Timothy P.Jurka开发的情感分析以及更一般的文本挖掘包已经得到了很好的发展。你可以查看下sentiment包以及梦幻般的RTextTools包。实际上,Timothy还写了一个针对低内存下多元Logistic回归(也称最大熵)的R包maxt…

    2016-02-14
    0
  • 万字长文深解(下):如果超人工智能出现,人类任何试图控制它的行为都是可笑的

    一旦超人工智能出现,人类任何试图控制它的行为都是可笑的。人类会用人类的智能级别思考,而超人工智能会用超人工智能级别思考。隔壁老王想要用互联网,因为这对它来说很方便,因为一切它需要的资源都已经被互联网连起来了。

    2016-02-12
    0
  • 万字长文深解(上):有生之年,超级人工智能将如何导致人类灭绝或永生?

    如果我现在跟你说你可以活到150岁,250岁,甚至会永生,你是不是觉得我在扯淡:“自古以来,所有人都是会死的。”是的,过去从来没有人永生过,但是飞机发明之前也没有人坐过飞机呀。

    2016-02-12
    0
  • BuzzFeed如何用算法找出打假球的网球选手

    新闻聚合网站 BuzzFeed 以善于挖掘眼球著称,其新闻经常能炮制出很多话题。其中的奥秘在于它是一家以数据为驱动的公司。现在这家网站又利用大数据做出了一篇有关顶级男子网球选手打假球的深度报道。该网站的记者 John Templon 与 BBC 通过利用算法,对 2009 到 2015年 的 26000 场 ATP 与大满贯顶级男子网球赛进行了分析,经过长达…

    2016-02-04
    0
  • Facebook动态消息算法揭秘:它比你还了解你自己

    导读:你登陆社交网站,以为新鲜事中都是自己订阅的内容,但它还包括平台想让你看到的,以及猜测你可能喜爱的内容。平台会猜测用户的心思,用户也往往沦为小白鼠。本文编译自SLATE,揭露了Facebook动态消息的背后的技术原理。为了了解你,科技公司可是很努力的。 每次你打开 Facebook ,这个世界上最具影响力,最有争议也是最被人误解的一套算法机制就开始运行。…

    2016-02-04
    0
  • 今日头条CEO张一鸣:隐藏在今日头条百亿市值背后的算法

    导读:无论2016年科技圈热门的噱头有多少,对数据基础设施方面的耕耘仍然是决定实力的关键。阿里之类电商数据帝国自不待言,今日头条、一点资讯等在资讯数据领域的开拓更加值得注目。比起电商的物流数据,资讯算法驱动与用户数据分析是更加“触及灵魂”的事情。 1月15日,在头条主办的“珠海未来媒体峰会”上,技术出身的CEO张一鸣走到台前,向台下一众媒体人发表演讲:《我眼…

    2016-02-04
    0
  • 史上最大机器学习数据集,雅虎对外开放了

    导读:数据是机器学习研究的命门。访问真正的大规模数据集,是一项传统上由机器学习研究者和大公司的数据科学家所保有的特权,然而大多数学术研究人员缺无法触及。2016年1月14日,雅虎实验室对外发布了发布史上最大机器学习数据集,达 13.5 TB。 数据集主页:http://webscope.sandbox.yahoo.com/catalog.phpdatatyp…

    2016-02-03
    0
  • 已经证实提高机器学习模型准确率的八大方法

    我从实践中学习了到这些方法。相对于理论,我一向更热衷于实践。这种学习方式也一直在激励我。本文将分享 8 个经过证实的方法,使用这些方法可以建立稳健的机器学习模型。希望我的知识可以帮助大家获得更高的职业成就。 导语 提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没…

    2016-01-30
    0
  • 机器学习专家张栋:我看到的机器学习及其应用

    我们真的非常幸运,作为技术人,如果早生十年,当时没有足够快的运算和足够大的数据,做机器学习的无用武之地;如果晚生十年,好玩的机器学习难题可能都被前人解完了,会很无聊。 我是2007年博士毕业的,应该是最早把机器学习技术应用在中国互联网的一批人。其实在过去很多年,国外很多互联网和金融公司已经大量使用机器学习技术。中国的互联网公司大规模使用机器学习技术是从200…

    2016-01-28
    0
  • 机器学习和统计模型的差异

    在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么? 这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者的区别似乎仅仅在于数据量和模型建立者的不同。这里有一张覆盖机器学习和统计模型的数据科学维恩图。 在这篇文章中,我将尽最大的努力来展示机器学习和统计模型的区别,同时也欢迎业界有经验的朋友对本文进行补充。…

    2016-01-25
    0
  • Apache Hadoop准实时数据处理的架构模式

    评估好哪一种流架构模式最适合你的案例,是成功生产开发的先决条件。 Apache Hadoop 生态系统已成为企业实时地处理和挖掘大数据的首选。 Apache的Kafka, Flume, Spark, Storm, Samza等技术在不断地推进新的可能。人们很容易泛化大规模实时数据案例,但其实他们可以细分为几种架构模式,Apache系统里的不同组件适合于不同的…

    2016-01-24
    0
  • 开源机器学习项目 Oryx

    Oryx的目标是帮助Hadoop用户搭建并部署能够实时查询的机器学习模型,例如垃圾邮件过滤和推荐引擎。随着数据的不断流入,Oryx还将支持自我更新。 无论从建模还是部署,Oryx都可以随需扩展,Owen认为这是Oryx与Hadoop的传统“甜蜜点”——探索性分析和运营性分析最大的不同。 Owen认为传统的在Hadoop上部署机器学习的技术——Apache M…

    2016-01-24
    0
  • 优秀大数据GitHub项目一览

    VMware CEO Pat Gelsinger曾说:数据科学是未来,大数据分析则是打开未来之门的钥匙 企业正在迅速用新技术武装自己以便从大数据项目中获益。各行业对大数据分析人才的需求也迫使我们升级自己的技能以便寻找更好的职业发展。 跳槽之前最好先搞清楚一个岗位会接触到的项目类型,这样你才能掌握所有需要的技能,工作的效率也会更高。 下面我们尽量列出了一些流行…

    2016-01-20
    0
关注我们
关注我们
分享本页
返回顶部