数据集
-
下秒数据CEO蔡致暖:云原生时代数据管道的迭代之路
在如今数据被称为新经济时代的石油的大背景下,数据管道是什么?处于什么位置?其技术和演进趋势又是怎么样的?
-
R语言教程:创建数据集
数据集的概念 数据集一般情况下是由数据构成的一个矩形数据,行表示观测值,列表示变量。例如: 通过数据集,可以清楚的看到数据结构及其中包含的内容和…
-
43种机器学习开源数据集(附地址/调用方法)
开源数据集!
-
Python数据分析,学习路径拆解及资源推荐
关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类:一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序;另一类是提供具体的学习内容,知识点或实际案例。
-
使用Python的LDA主题建模(附链接)
本文为大家介绍了主题建模的概念、LDA算法的原理,示例了如何使用Python建立一个基础的LDA主题模型,并使用pyLDAvis对主题进行可视化。
-
开源时间序列数据集整理
UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理等诸多领域,目前全量数据有128种。该项目提供了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全…
-
降维,是数据科学家的必由之路!
本文为大家介绍了降维的概念及降维技术主成分分析(PCA)在特征工程中的应用。
-
盘点数据处理工具,手把手教你做数据清洗和转换
原始数据本身没有用。为了使它实际有用,你需要准备它。
-
14个超有趣的数据分析项目,数据集都给你整理好啦(建议收藏)
最容易上手的就是数据可视化, 以下3个数据集可以用于创建一些有意思的的可视化效果并加到你的简历中。 分析此数据集,找到任何确实影响员工满意度的变量,另外,还可以看看是否可以对变量进行重要程度排名…
-
机器学习模型训练全流程
发现一个很有趣的开源项目,作者用手绘图的方式讲解了机器学习模型构建的全流程,逻辑清晰、生动形象。
-
关于如何解释机器学习的一些方法
在这篇文章中出现的每一个技巧里,『可解释性』都被解构为几个更基本的方面:模型复杂程度,特征尺度,理解,信任 —— 接下来我首先就来简单对这几点做个介绍。
-
Fivetran筹集了5.65亿美元,并计划以7亿美元收购变更数据捕获 (CDC) 供应商 HVR
Fivetran 今天在企业数据集成领域迈出了一大步,宣布了由 Andreessen Horowitz 牵头的 5.65 亿美元融资,并计划以 7 亿美元收购变更数据捕获 (CDC) 供应商 HVR。
-
推荐系统数据集大列表
今天给大家介绍一个github仓库,收集了非常多的推荐系统的数据集,非常的全面,非常的实用,做推荐系统相关的同学可以收藏一下。
-
大数据日报(20191105):微软将数据保存在玻璃数千年,斯坦福视觉推出视觉感知数据集JRDB
大数据日报(20191105):微软将数据保存在玻璃数千年,斯坦福视觉推出视觉感知数据集JRDB。
-
Word2Vec揭秘: 这是深度学习中的一小步,却是NLP中的巨大跨越
Word2Vec模型用于学习被称为“词嵌入”的词的向量表示。这通常是作为预处理步骤来完成的,在此之后,学习到的向量被输入判别模型(通常是RNN)来生成预测,完成各种各样有趣的事情。