R
-
R语言教程:创建数据集
数据集的概念 数据集一般情况下是由数据构成的一个矩形数据,行表示观测值,列表示变量。例如: 通过数据集,可以清楚的看到数据结构及其中包含的内容和…
-
在R中使用LIME解释机器学习模型
本文为大家介绍如何在R中使用LIME来解释机器学习模型,并提供了相关代码。
-
如何为学习,实验和教学生成有意义的人造数据集?
如果你从事教学或喜欢实验,不想使用老套的数据集,fakir是一个非常好的值得了解的包。
-
良心推荐:R语言中的十个小技巧
由于R生态系统如此丰富且不断增长,人们往往会错过一些能够帮助他们完成任务的事情。所以我经常得到一些惊讶的反应,就像我从来不知道那样!
-
用R语言分析我和男友的聊天记录
我开始分析和男友的微信聊天记录,只不过正如原文作者所说,分析着,情人节变情人劫怎么办?
-
数据科学入门:选Python?还是R?
对于想入门数据科学的新手来说,选择学Python还是R语言是一个难题,本文对两种语言进行了比较,希望能帮助你做出选择。
我是德勤的数据科学家主管,多年来我一直在使用Python和R语言,并且与Python社区密切合作了15年。本文是我对这两种语言的一些个人看法。 -
HTML基础与R语言解析
无论学术研究还是商业分析,数据搜集永远是第一个需要解决的问题。
-
如何在R中执行Logistic回归?
逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x)。这个模型的典型用途是基于一组预测变量x预测y。预测因子可以是连续的,分类的或两者的混合。
-
三种可视化方法,手把手教你用R绘制地图网络图
不知道如何在地图上可视化网络图?下面这篇博客将使用R中的igraph、ggplot2或ggraph包来介绍三种在地图上可视化网络图的方法。
-
在Python和R中:使用交叉验证提高模型性能
关于黑客马拉松最有趣和最具挑战性的事情之一是在公共和私人排行榜上获得高分。 我密切关注了Data Hackathons系列,并发现了一个有趣的趋势。 这一趋势是基于参与者在公共和私人排行榜上的排名。 有一点非常突出,那就是在排行榜在私人排行榜上得到验证后,在排行榜上排名较高的参与者就会失去自己的位置。 有些人甚至未能在私人排行榜前20名中获得排名(图片见下图…
-
老司机带你分享R语言学习路径
作为数据分析或挖掘工作者,技能是一方面,另一方面是关于如何培养好自己的分析思维,毕竟技术这个东西是很容易替代的,而思维才是属于自己的,才是自己有别于其他人的地方。
-
用StackOverflow访问数据实现主成分分析(PCA)
主成分分析(PCA:Principal Component Analysis)非常有助于我们理解高维数据,我利用Stack Overflow的每日访问数据对主成分分析进行了实践和探索
-
如何使用ggplot2绘制公共债务地图
想要精通数据科学,你必须不断地实践。
-
数据领域最强编程语言Python和R要合作了!
是的,你没有看错,数据科学领域从业者最离不开的两大编程语言,当红炸子鸡 Python 和“过气网红”R 真的要展开合作了。近日,URSA 实验室宣布,R 和 Python 正携手合作,旨在让使用不同编程语言的数据科学家能够更轻松地协作,避免不同语言开发人员的过多重复工作,这或许会成为今年最雄心勃勃的交叉事件。有网友对这次合作发表评论道:“这个真的蛮历史性时刻的”,不过也有网友调侃“两个最慢的语言正在合作”,你怎么看?
-
初探 RSelenium —— 基于豆瓣电影的爬虫实例
本文基于 豆瓣电影 网站的爬虫实例, 对 RSelenium 包的使用做了初步的介绍。