数据挖掘
-
What?! 时间序列还能造音乐
时间序列分析是一种常用的处理随时间变化数据的统计方法,它通过寻找数据过去的规律来预测其未来的发展趋势。时间序列分析广泛应用于自然科学和社会科学的各个领域,比如天气预报、销量预测等等。
-
20本机器学习与数据科学必读书籍
高校的暑假即将来临,有没有想利用这个暑假为自己充电,为未来的自己赢在起跑线上,成为人工智能界的人生赢家呢?来自 KDnuggets 的 Matthew Mayo 就提供了这份书单,小编在翻译此书单的同时,还贴心搜索了相应的中文译本,并提供了中文版的购买链接。加油吧,骚年!
-
用Python语言模型和LSTM做一个Drake饶舌歌词生成器
未来AI的主要应用是在建立能够学习数据然后生成原创内容的网络。这个想法已经充分应用于在自然语言处理(NLP)领域,这也是AI社区能够搭建出所谓语言模型的原因:语言模型的前提是学习句子在文章段落中的组成结构,从而生成新的内容。
-
数据建模师的起跑线,从踏上工作岗位那一刻开始
我们常说孩子不要输在起跑线上,其实数据从业者的真正起跑线,是从你踏上工作岗位那一刻才开始的,一方面是大学还没做好培养大数据人才的准备,另一方面大学缺乏大数据人才成长的数据环境,一切都需要从头开始。
-
在应用机器学习时如何处理不良数据?
我们在收集、储存和处理大量数据方面取得的进展对于机器学习,或者说人工智能的发展起着重要的作用。许多问题都需要大数据的支持来解决,幸运的是,现在收集、存储和处理大数据的成本比以前要小得多,速度也要快得多。
-
关于模型评估那些事都在这里了
本篇是旧篇中的“如何直观地理解过拟合与欠拟合的那些事”,“分层抽样与交叉验证”及新篇“模型性能度量那些事”的合集,如已看过旧篇的童鞋可以直接跳到第三部分。
-
在VUCA时代, 数据分析起家的蓝灯数据如何利用”云原生微应用”将“颠覆式革新”进行到底?
日前,蓝灯数据发布了云原生智能微服务战略,并联合上海超级计算中心、上海大数据联盟、海计信息共同组建了国内首个大数据微应用实验室。蓝灯数据是一家什么样的公司?为什么在这样的时期推出大数据微应用实验室?带着这些问题,数据猿记者采访了蓝灯数据董事长周强。
-
在量化交易回测中容易犯的9个错误
回测是用来否定一个策略的最好的方法,但不一定适合来肯定一个策略。
-
如何打造敏捷的数据挖掘能力?
数据挖掘是发现规律的一种手段,但在很多传统企业里数据挖掘有点像奢侈品,因为数据挖掘的过程一般较长,总体来讲性价比不是那么高,规则取数往往成为了企业数据驱动业务的主流。
-
传统企业的模型最佳实践为什么很难复制推广?
数据挖掘是是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程,这个发现的模式就是我们一般意义上的数据模型。
-
傅一平:数据建模者,对算法要“知其所以然”
知其所以然是我们干成事,干好事,能够触类旁通的一般原则,当算法的黑箱子问题越加严重的时候,我们越要多问一个为什么。
-
数据驱动产品之knn算法
本文主要是 knn 算法原理的介绍, 以及在它在互联网行业中的具体应用, 后续会介绍这个算法的具体实现(R 语言和python 语言)。
-
数据挖掘师,要从一个人活成一支队伍
每每看到数据挖掘师对于大规模数据处理,机器学习算法侃侃而谈的时候,觉得这就是数据分析师该有的样子,这就是大师。
-
KDD 2018征集研究论文
日期 提交:2018年2月11日 通知:2018年5月6日 相机准备:2018年5月25日 (所有截止日期是太平洋时间晚上11:59) 注意:这些截止日期绝对没有例外。 描述 我们邀请论文提交论文,介绍关于知识发现和数据挖掘的各个方面的创新研究,从理论基础到用于科学,商业,医学和工程领域的数据挖掘问题的新模型和算法。关于新兴课题的有远见的论文也受到欢迎,应用…
-
Kaggle入门手册
顶尖的团队拥有数十年的综合经验,处理有挑战的问题,如改善机场安全或分析卫星数据。