张乐编辑
-
如何防止我的模型过拟合?这篇文章给出了6大必备方法
在机器学习中,如果模型过于专注于特定的训练数据而错过了要点,那么该模型就被认为是过拟合。训练数据用来训练模型;验证集用于在每一步测试构建的模型;测试集用于最后评估模型。 如果验证集和测试集的损失…
-
数据分析思维和方法—用户画像分析
无论是产品策划还是产品运营, 前者是如何去策划一个好的功能, 去获得用户最大的可见的价值以及隐形的价值, 必须的价值以及增值的价值, 那么了解用户, 去做用户画像分析, 会成为数据分析去帮助产品做做更好…
-
在数据科学中需要多少数学技能?
本文为大家介绍了在数据科学和机器学习中所需要的基本数学技能,并且分类给出了相应的主题建议。
-
如何通过数据分析选品(以新零售为例)
新零售概念很抽象,炒的也热(题外话,对新零售概念感兴趣的同学可以读读刘润老师写的《新零售:低价高效的数据赋能之路》,算比较通俗易懂的),比较主流的模式为线上线下一体化,选出的商品大多同时满足线上和线下场景的售…
-
一文读懂贝叶斯网络
本文从概率论出发,为你阐述贝叶斯网络。
-
机器学习的基础图表
机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。 快速三维地图测绘和建模:要建造一架铁路桥,PwC 的数据科学家和领域专家将机器学习应用到了无人机收集到的数据上。…
-
在R中使用LIME解释机器学习模型
本文为大家介绍如何在R中使用LIME来解释机器学习模型,并提供了相关代码。
-
如何看穿数据可视化的谎言?
用数据来撒谎已经不是什么新鲜事儿了,但现在图表越来越容易被广泛传播,网上到处都是,而其中好多传递的是假象。
-
数据分析方法和思维(aha 时刻)
同样的其他的数据, 比如发弹幕等等也是从其他维度去刻画用户的行为特征, 那么我们就可以得到比如用户 a, 30天观看天数XX天, 日均观看时长xx 分钟, 是否留存, 这样很多行的数据. 发现了影…
-
优秀的数据可视化,原来是这样做的!
工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
-
Python数据分析,学习路径拆解及资源推荐
关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类:一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序;另一类是提供具体的学习内容,知识点或实际案例。
-
如何构建业务数据分析体系
构建业务数据分析体系,对于分析师同学有两个方面的要求: 第一,要了解业务模式,能够解释数据背后的业务含义,找到业务的问题点、提升点,驱动业务向前发展; 第二,不能只做数据、图表的堆砌,需要根据业务的流…
-
5种数据同分布的检测方法
很多时候我们知道这个道理,却很难有方法来保证数据同分布,这篇文章就分享一下我所了解的同分布检验方法。
-
数据分析完整的流程与知识结构体系
完整的数据分析流程:1、业务建模。2、经验分析。3、数据准备。4、数据处理。5、数据分析与展现。6、专业报告。7、持续验证与跟踪。
-
使用Python的LDA主题建模(附链接)
本文为大家介绍了主题建模的概念、LDA算法的原理,示例了如何使用Python建立一个基础的LDA主题模型,并使用pyLDAvis对主题进行可视化。