机器学习
-
为什么要使用交叉验证?
什么是交叉验证法?它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。
-
企业为什么越来越依赖AI聊天机器人?
聊天机器人其实已经存在 50 年了,并不是什么新事物。早在 20 世纪 60 年代中期,计算机科学家 Joseph Weizenbaum 发明了第一个聊天机器人——Eliza,但是一直以来,聊天机器人给人的感觉就像一个“人工智障”。就在去年,Facebook 就关闭了它们的聊天机器人虚拟助理 M,一时间很多人都不看好聊天机器人的前景。但是,如果有人工智能加持的话,聊天机器人的前景会有什么样的改观呢?让我们看看 Bernard Marr 是怎么看待聊天机器人的前景的。
-
用Python语言模型和LSTM做一个Drake饶舌歌词生成器
未来AI的主要应用是在建立能够学习数据然后生成原创内容的网络。这个想法已经充分应用于在自然语言处理(NLP)领域,这也是AI社区能够搭建出所谓语言模型的原因:语言模型的前提是学习句子在文章段落中的组成结构,从而生成新的内容。
-
机器学习算法的优点和缺点
从Logistic回归开始,然后尝试Tree Ensembles和/或Neural Networks。奥卡姆的剃刀原理:使用最简单的算法,可以满足您的需求,并且只有在严格需要的情况下才用更复杂的算法。根据我自己的经验,只有神经网络和梯度增强决策树(GBDT)正在工业中广泛使用。 我目睹Logistic回归和随机森林被弃用不止一次(这意味着它们是好的开始)。 …
-
始于Jupyter Notebooks:一份全面的初学者实用指南
如果说有什么每个数据科学家都应该使用或必须了解的工具,那非 Jupyter Notebooks 莫属了(之前也被称为 iPython 笔记本)。Jupyter Notebooks 很强大,功能多,可共享,并且提供了在同一环境中执行数据可视化的功能。
-
在应用机器学习时如何处理不良数据?
我们在收集、储存和处理大量数据方面取得的进展对于机器学习,或者说人工智能的发展起着重要的作用。许多问题都需要大数据的支持来解决,幸运的是,现在收集、存储和处理大数据的成本比以前要小得多,速度也要快得多。
-
傅志华:人工智能可以预防“吵架”?
近日,Google旗下的科技孵化器Jigsaw、康奈尔大学和维基媒体基金会合作,联合开发了一个预测谈话走向的AI系统。这个系统能从一开始就能预测谈话是否会失控,想在对话能被挽救的情况下,尽早预防不必要的争吵甚至是攻击行为。
-
萌新误入数据科学歧途怎么办?这是16位顶级大牛的入坑指南
数据正在以指数级的速度生成,现在比以往任何时候都更需要那些能够理解数据并从中提取价值的人。如果你渴望成为下一代数据科学家,那么这些来自前辈们的经验教训将助你一臂之力。
-
应用机器学习时被遗忘的两个步骤
关于人工智能(AI)和机器学习(ML)如何改变商业实践的故事越来越多,数据科学从业者被要求仅用模糊的或高层次的商业目标来“应用机器学习”。在实施人工智能和从数据中创造商业价值方面存在很大差距,数据科学中的许多尚未解决的问题是导致这些差距的原因。
-
微软AI面试题有多难?这里有一份样卷
究竟什么样的AI人才能被微软这样的巨头聘用呢?
-
机器学习太难了!AI大佬们给你指条明路
与机器学习博士相关的工作职位不仅创下了薪水的新高,而且对世界产生了巨大的影响。80000 小时(YC S15)提供了一个综合指南, 用于指导如何开始你的机器学习博士学位之旅。
-
结合AI让系统自主编程,Gamalon获英特尔领投的2000万美元A轮融资
Gamalon创建于2013年,之前它一共获得了1200万美元融资。
-
从人脸识别到机器翻译:58个超有用的机器学习和预测API
本文精选了包括人脸和图像识别、文本分析、自然语言处理、文本情感分析、语言翻译、机器学习和预测等多个领域共 58 个实用 API。
-
机器学习创企有最不可碰的九大陷阱
由于技术和工具的进步,机器学习培训项目比以往更容易执行。但是,要获得可靠的结果需要对数据科学和统计学原理有深入的了解,如此才能确保团队从一个坚不可摧的底层数据集开始,这边是成功的基础。
-
傅一平:数据建模者,对算法要“知其所以然”
知其所以然是我们干成事,干好事,能够触类旁通的一般原则,当算法的黑箱子问题越加严重的时候,我们越要多问一个为什么。