数据人网专栏
-
聚类分析中的可视化
如何对聚类分析做可视化呢?
-
如何为学习,实验和教学生成有意义的人造数据集?
如果你从事教学或喜欢实验,不想使用老套的数据集,fakir是一个非常好的值得了解的包。
-
小白学数据可视化:前言
关于数据可视化的认知,您有什么见解?
-
人工智能最佳利用的数据基础设施需求
AI的目标是开发出像智能一样行事的机器。
-
如何在R中执行Logistic回归?
逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x)。这个模型的典型用途是基于一组预测变量x预测y。预测因子可以是连续的,分类的或两者的混合。
-
机器学习算法的优点和缺点
从Logistic回归开始,然后尝试Tree Ensembles和/或Neural Networks。奥卡姆的剃刀原理:使用最简单的算法,可以满足您的需求,并且只有在严格需要的情况下才用更复杂的算法。根据我自己的经验,只有神经网络和梯度增强决策树(GBDT)正在工业中广泛使用。 我目睹Logistic回归和随机森林被弃用不止一次(这意味着它们是好的开始)。 …
-
作为数据科学家应该学习的第一件事
根据30年的商业经验,下面的列表是我认为首先应该在数据科学课中讲授的(非全面的)内容选择。 这是我文章的后续内容为什么Logistic回归应该最后讲解。 我不确定下面这些主题是否在数据营或大学课堂上讨论过。 问题之一是招聘教师的方式。 招聘过程是有利于以学业成就或其“明星”身份而闻名的个人,并且他们倾向于在数十年内反复教导同一事物。 厉害的专业人士对成为老师…
-
数据科学家喜欢Jupyter Notebook的10个原因
Python的主要优势以及它如此受欢迎的主要原因之一是它将科学计算功能带给了许多研究领域和行业中使用的通用语言。 这使得从研究到生产的过渡变得更容易。
-
数据科学的处理流程
数据科学家知道把不同的理论和工具有机地结合在一起并最终形成特定的流程,进而依据这个流程完成数据分析工作。
-
数据科学家所需技能
数据科学家所需具体技能,你掌握了多少?
-
用PHP蜘蛛做旅游数据分析
你最喜欢去哪里旅游?
-
教你如何用R进行数据挖掘
我们所说的机器学习和R有什么关系呢?我对R的第一印象是,它只是一个统计计算的一个软件。但是后来我发现R有足够的能力以一个快速和简单的方式来实现机器学习算法。这是用R来学习数据科学和机器学习的完整教程,读完本文,你将有使用机器学习的方法来构建预测模型的基本能力。
-
用贝叶斯判别分析预测股票涨跌情况
本文是从贝叶斯分类器的角度来讨论判别分析
-
用逻辑回归模型预测股票涨跌
如何使用逻辑回归模型预测股票涨跌
-
如何开始你的商业分析生涯?
为什么要构建一个商业分析生涯?