机器学习
-
Splunk模式的中国践行者日志易,获红杉6000万A轮融资
摘要:过去45年,陈军一直在与互联网打交道,6岁开始玩旧式计算机打孔纸卡;小学一年级就学习二进制;14岁用Basic语言编程……陈军说,“创业就像一个人穿越沙漠,资本就是随身携带的水。必须知道走到哪一点融到钱,太多没必要,太少可能会渴死。” 今年8月,陈军账上还趴着几百万,他感觉形势不太好,便启动A轮融资。当月他便收到不少橄榄枝,最终陈军接受红杉资本6000…
-
机器学习编程语言之争,Python夺魁
摘要:随着科技的发展,拥有高容量、高速度和多样性的大数据已经成为当今时代的主题词。数据科学领域中所采用的机器学习编程语言大相径庭。究竟哪种语言最适合机器学习成为争论不休的话题。 近日,密西根州立大学的博士生Sebastian Raschka再次发起了机器学习编程语言之争,分析了自己选择Python的原因。 目前,机器学习牵涉的编程语言十分多样,包括了MATL…
-
微博用户关系数据挖掘模型介绍
概述 不同于传统互联网媒体,微博作为社交媒体最大的优势在于引入了非对等的用户关系,这种用户关系仅令传播更加高效。如果将微博中的用户视作节点,用户之间的关系视作节点之间的边,那么这些节点和边将构成一个社交的网络拓扑结构,或称作社交图谱,如图1所示。微博中的信息从社交图谱中的某个节点发出,并通过边来传播。 图1 微博中的社交图谱 但是信息在这个网络中的流动并不是…
-
IBM开源机器学习系统SystemML
继 Facebook 开源Torch、Google 开源TensorFlow以及微软开源分布式机器学习工具包DMTK之后,IBM 成为今年第四家开源自家机器学习系统的巨头,这显示出机器学习的生态构建与人才争夺战的白热化。IBM 开源的这套系统叫做SystemML,将会通过 Apache Software Foundation 开放共享,并允许开发者修改其代码…
-
你真的知道数据挖掘的定义吗?
我对做事的流程非常感兴趣。我想要知道一些可以把事情做好的好方法,甚至在可能的情况下可以知道做这些事情的最好方式。就算你的技能不强,理解相关方面的知识不深,这个过程也可以帮你在后面长时间的过程中解决这些问题。它可以指引你如何变得更有技能,同时对相关知识有深层次的了解。至少,我曾经就是用这样的方式完成了很多的工作。 我认为学习数据挖掘是很有用的,正如它以从数据中…
-
什么是数据挖掘和知识发现
摘要:我对做事的流程非常感兴趣。我想要知道一些可以把事情做好的好方法,甚至在可能的情况下可以知道做这些事情的最好方式。就算你的技能不强,理解相关方面的知识不深,这个过程也可以帮你在后面长时间的过程中解决这些问题。它可以指引你如何变得更有技能,同时对相关知识有深层次的了解。至少,我曾经就是用这样的方式完成了很多的工作。 我认为学习数据挖掘是很有用的,正如它以从…
-
数据分析职业发展3:我在面试大数据岗位时遇到的各种问题
自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体要求而定。 机器学习、大数据相关岗位的职责 自己参与面试的提供算法岗位的公司有 BAT、小米、360、飞…
-
开源机器学习平台H2O.ai,宣布完成2000万美元B轮融资
H2O.ai是初创公司 Oxdata 在去年末推出的一个独立开源机器学习平台,主要服务于数据科学家和开发者,为其应用提供快速机器学习引擎。 今日,H2O.ai宣布完成 2000 万美元 B 轮融资,由 Paxion Capital Partners(GoPro 董事会成员之一 Michael Marks 的新基金)领投,原有基金 Nexus Venture …
-
Yelp是如何使用深度学习对商业照片进行分类的
摘要:Yelp是美国最大点评网站,拥有世界各地的Yelper上传的成千上万的照片。各种各样的照片给进入当地的商业提供了一个丰富的窗口。通过开发一个照片理解系统使Yelp能够创建有关个人照片的语义数据。跟Yelp第一次在基于内容的照片多样化方面所做的尝试一样,由系统生成的数据正在增强Yelp近期推出的封面照片多样化、标签式照片浏览等服务。 构建一个照片分类器 …
-
机器学习和大数据:是先有鸡还是先有蛋
摘要:“对于机器学习,需要大量容易获得的历史数据。但是,如果你没有这个数据会怎样”
-
深度学习与拓扑数据分析结合的6个惊人案例
将深度学习与拓扑数据分析结合在一起完全能够达到此目的,并且还绰绰有余。
-
大数据与深度学习是一种蛮力?
Facebook去年底挖来了一个机器学习大神Vladimir Vapnik,他是统计学习理论和支持向量机的主要发明者。Vladimir Vapnik被称为统计学习理论之父,他出生于俄罗斯,1990年底移居美国,在美国贝尔实验室一直工作到2002年,之后加入了普林斯顿的NEC实验室机器学习研究组,同时任哥伦比亚大学特聘教授。2014年,Vladimir Vap…
-
小团队如何撬动大数据?当当推荐团队的机器学习实践
当当个性化推荐开发经理张相於深度分享当当推荐团队的机器学习实践经验。本次分享更侧重“面向过程”——在构建系统时的一些实践,一些坑,以及如何从坑里爬出来,以及“小团队”。
-
各种编程语言的深度学习库整理
本文总结了Python、Matlab、CPP、Java、JavaScript、Lua、Julia、Lisp、Haskell、.NET、R等语言的深度学习库,赶紧收藏吧!
-
点击流中的非结构化数据——文本挖掘应用实例
本篇介绍的是点击流中的非结构化数据的文本挖掘应用——当然,核心还是如何更好的应用这些非结构化数据。