机器学习
-
学术界的深度学习教授之一——Yoshua Bengio大神
摘要:近日雷锋网对深度学习三巨头Hinton、LeCun、Bengio中的前两位做了生平开扒,就差最后一个Bengio了。作为仅存的几个仍然全身心投入在学术界的深度学习教授之一,他在网上能刮到的生平介绍自然比前两位少得多,为大家找到了所有我们能找到的资料,让他不再活在传说中。 1. 根据Bengio的博文自述,在20世纪80年代Bengio还是一个学生的时候…
-
Facebook人工智能负责人Yann LeCun:不喜欢人们把深度学习描述为“它像大脑一样工作”
摘要:最近AlphaGo对李世乭的世纪大战让深度学习再次备受关注。本文是作者Lee Gomes于2015年原载IEEE,由机器之心翻译,也是雷锋网对人工智能领域做出接触贡献的先行者们致敬的《人类群星闪耀时》的第二篇。。虽然是旧文,但是文中大量关于深度学习的探讨依旧值得我们再次翻阅。读完文章,你也许就能明白,为什么Facebook人工智能负责人Yann LeC…
-
深度学习鼻祖杰夫·辛顿:没有他,就没有今天的人工智能
摘要:本文是在“人机大战”AlphaGo 4:1 获胜后,雷锋网采编的《人类群星闪耀时》系列文章的第一篇。谨以此系列向在人工智能和深度学习领域做出了接触贡献的天才们致敬。 20世纪60年代的英国:杰夫·辛顿(Geoff Hinton)还在读高中时,他的同学给他安利了一个说法:大脑的工作就像一张全息图。他深以为然。 80年代初期:辛顿发起了雄心壮志的计划——利…
-
海量数据挖掘最优解?机器学习!
摘要:机器学习是大数据挖掘的一大基础,本文以机器学习为切入点,分享达观在大数据技术实践时的一些经验。 大数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺诈交易监测等等。 互联网的海量数据不可能靠人工一个个处理,只能依靠计算机批量处理。最初的做法是人为设…
-
如何基于Spark进行用户画像?
摘要:从数据分析、机器学习和结果三方面详解利用高性能分布式计算平台解决现实问题的过程。 近期,comSysto公司分享了该公司研发团队利用Spark平台解决Kaggle竞赛问题的经历,为Spark等平台应用于数据科学领域提供了借鉴。 主办方提供了一个包含5万个匿名驾驶员线路的数据集,竞赛的目的是根据路线研发出一个驾驶类型的算法类签名,来表征驾驶员的特征。例如…
-
硅谷王川:深度学习有多深?学了究竟有几分?(7)
(1)神经网络计算, 另一个常为人诟病的问题,是过度拟合 (overfitting). 一个拥有大量自由参数的模型,很容易通过调试,和训练数据吻合.但这并不意味着,这就是个好模型. 美国数学家冯纽曼 (John Von Neumann) 曾说, “给我四个参数,我的模型可以拟合一个大象. 给我五个参数, 我可以让它扭动它的鼻子.” 神…
-
漫谈:机器学习和数据挖掘中一些常见的距离公式和相似性度量方法
在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则: 1) d(x,x) = 0 …
-
人与机器的区别在于,我们曾在梦里鲜衣怒马,为理想孤注一掷
摘要:AlphaGo赢下这场围棋的“世纪大战”,这到底是人工智能战胜了人类,还是人类向自然发起挑战? 人类对自然,抑或说人类对人类本身的改造,又会随着人工智能的飞速发展下走向何方? 而对于哲学家来说,除了询问自己生从何来死往何处,现在又多了一个命题:我们人类和机器到底有什么区别? 这可能是目前对人工智能发展最深度的思考之一,期待与你一同探讨。 从事机器智能研…
-
干货收藏:一份Python学习资源大全
摘要:Awesome Python ,这又是一个 Awesome XXX 系列的资源整理,由 vinta 发起和维护。内容包括:Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等。 代码下载地址:https://github.com/vinta/awesome-python 受 aw…
-
硅谷王川:深度学习有多深?学了究竟有几分?(6)
(1)计算速度和数据规模的大幅度提高,也引导出更多算法上的改进. 在网络构架上,一些算法更多地借鉴人脑认知的成功经验: 多提高效率, 少做无用功. 多闭目养神,少乱说乱动. 多关注主要矛盾, 少关心细枝末节. 2003年纽约大学神经科学中心的 Peter Lennie 在论文中指出,人脑的神经元,一般最多 1-4%的比例, 可以同时处于激活状态. 比例更高时…
-
AlphaGo 与李世石的对战会推动人类的极限还是机器学习的进步和觉醒?
摘要:世纪人机围棋大战中,知识分子与知乎共同举办知乎圆桌《对弈人工智能》,供网友在谷歌围棋系统 AlphaGo 与韩国棋手李世乭对弈期间随时参与讨论。本文来自笔者在该圆桌讨论中的相关回答。涉及到人工智能,虚拟现实,超越现实,机器人感情,人类文明。 最近看了一个科幻故事, 如果苹果、谷歌、微软打算毁灭世界会怎样? 2050年12月:聚集了三千人的北美人类抵抗军…
-
学好Python的11个优秀资源
无论你是新手还是老鸟,无论是用于机器学习还是web开发(Pinterest就是案例),Python都是一件利器。
-
一位算法师工程师的Spark机器学习笔记:构建一个简单的推荐系统
摘要:本文是一位算法师工程师的Spark机器学习笔记,教你构建一个简单的推荐系统。 推荐引擎应用场景: 用户有海量选择:随着场景内item越来越多,用户越来越难以选择到合适的产品 个性化场景:在选择产品时,会借鉴那些与推荐用户相似地群体,利用群体智慧对用户进行推荐”千人千面” 在本篇博客中,会涉及到以下几个部分: 介绍不同类型的推荐引擎 使用用户偏好模型来构…
-
机器学习必备的7项技能包
摘要:机器学习经常与人工智能紧密相连,在不考虑显式编程的情况下,机器学习可以使计算机具备完成特定任务的能力,例如识别,诊断,规划,机器人控制和预测等。它往往聚焦于算法创新,即在面对新数据时,其自身能够发生演化。 在某种程度上,机器学习与数据挖掘很相似。它们都是通过数据来获取模式。然而,与人类可理解的数据提取方式不同—通常是按照数据挖掘应用的方式——机器学习主…
-
Python教程:7款数据图表工具的比较
摘要:本文介绍7款 Python 数据图表工具的比较 Python 的科学栈相当成熟,各种应用场景都有相关的模块,包括机器学习和数据分析。数据可视化是发现数据和展示结果的重要一环,只不过过去以来,相对于 R 这样的工具,发展还是落后一些。 幸运的是,过去几年出现了很多新的Python数据可视化库,弥补了一些这方面的差距。matplotlib 已经成为事实上的…