数据挖掘

基于树的建模-完整教程(R & Python)

简介基于树的学习算法被认为是最好的方法之一，主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型，它们映射非线性关系相当不错。他们善于解决手头的任何问题（分类或回归）。决策树方法,随机森林,梯度增加被广泛用于各种数据科学问题。因此,对于每一个分析师(新…

张乐

2016-04-21

00

数据挖掘

产品策略研究期的数据分析与挖掘

摘要：《大嘴巴漫谈数据挖掘》系统而全面地描述了数据挖掘的基本概念、常用算法等。《大嘴巴漫谈数据挖掘（第2季产品篇）》是《大嘴巴漫谈数据挖掘》的姊妹篇，在前作的基础上，它以产品为核心，按照产品发展的过程，依次详细分析产品策略研究期、产品概念评估期、产品研发期、产品测试期、产品导入期、产品发展期、产品成…

大嘴巴漫谈

2016-04-18

00

数据挖掘

大嘴巴漫谈数据挖掘：维度角度辨特征，环比同比看趋势

外部调研结束后，接下来的内部数据分析则需由产品经理、行业专家和数据分析师共同配合完成。产品经理首先提出业务需求，并及时帮助数据分析师理解需求目标，然后数据分析师在充分掌握的基础上，将其转化为内部数据挖掘的分析目标，最后与行业专家确认所构建出的业务模型。同时，通过内部数据分析，产品经理还可以了解不同用…

大嘴巴漫谈

2016-04-18

00

数据挖掘

搭建电商平台的标签系统？看这就够了

摘要：如何建立电商平台的标签系统？期待该问题的优质回答，给所有需要设计标签系统的童鞋一个很好的指引，简要说明一下要做的事情： 1.电商系统的标签，可以支持前台分类的搜索（或者叫查询？） 2.电商系统的标签，可以支持某个关键词搜索出的产品的筛选 3.电商系统的标签，可以支持给商品、用户、供应商、产品…

张乐

2016-04-12

02

数据挖掘

解读芝麻信用与FICO评分的差异

自从听说阿里巴巴推出的芝麻信用评分可以帮助办理签证，小编就对这种评分产生了深厚的兴趣，何况它利用大数据分析的方法听上去也很酷，不知道你有没用过呢？今天，我们推送的文章就深度介绍了芝麻信用评分与经典的FICO评分之间的差异……

KPMG大数据挖掘

2016-04-12

00

数据挖掘

银行推荐系统在生活中的应用案例解析

介绍日常生活中，推荐工作都是怎样开展的呢推荐来源于经验。假设现在有人需要你基于现实生活中的数据立刻作出推荐，你会怎样做呢首先，我们会感觉自己得像智能顾问一样聪明。其次，我们做的已经超出人类的能力范围了。因此，我们的目标就是建立智能软件，让它为我们提供值得信赖的推荐系统。当我们访问亚马逊、Netf…

融智未来

2016-04-12

00

数据挖掘

个性化推荐到底是不是个伪命题？

最近，有一位网友在微博上说，推荐是不是个伪命题连续几天试用了据说很好的某头条，某资讯以及某快报，感觉逃脱不了看什么就是什么的套路。也有人说，这是Exploitation & Exploration出了问题，没有很好得Exploration导致的结果。那么，个性化推荐到底是不是伪命题呢为什么很…

张乐

2016-04-12

00

数据挖掘

大嘴巴漫谈数据挖掘：定量分析助定性，分析结果有展示

定性研究结束后，随后的定量分析需要接触一定规模的用户，以此获取用户对产品的认知度等方面的信息，为了保证样本的代表性，通常采取电话访问的形式。与试商用时期相比，产品上市后的用户数量会有所增加。如果成本允许，建议总样本规模尽可能达到600至800人左右，并按照用户黏性、订购方式分别配额。通常，访问80…

大嘴巴漫谈

2016-04-11

00

数据挖掘

数据挖掘系列篇：Facebook内容排序算法研究

摘要：最近研究了下Facebook内容排序问题，这个在新浪微博、知乎内容排序这些场景下都应用到。主要是关于edgerank的算法讨论以及Facebook的AB test机制。 EdgeRank 是Facebook 在 F8 开发者大会上提出的对 fb 新鲜事 (Feeds) 排序的新算法, 用于区别…

数据分析侠

2016-04-10

00

数据挖掘

基于内容和用户画像的个性化推荐

基于内容和用户画像的个性化推荐，有两个实体：内容和用户。需要有一个联系这两者的东西，即为标签。内容转换为标签即为内容特征化，用户则称为用户特征化。因此，对于此种推荐，主要分为以下几个关键部分：标签库内容特征化用户特征化隐语义推荐综合上面讲述的各个部分即可实现一个基于内容和用户画像的个性化推…

张乐

2016-04-07

01

数据挖掘

“用户画像”如何应用于个性化运营

摘要：前些天听了Shadow老师的线上课程分享（视频地址：），这个课程我觉得非常有意义，特别是对于我们这样想做个性化订制的精品导购平台来说，个性化运营尤其重要。所以今天把前些天上课的内容整理了一下，写出来与大家进行分享，希望大家批评指正。要做个性化运营，首先要有用户画像，那么如何定位一个产品的用…

张乐

2016-04-07

00

数据挖掘

数据挖掘：周期性分析SMCA算法简介

摘要：周期性分析SMCA算法简介算法介绍以时间顺序挖掘周期性的模式（即周期性分析）是一种重要的数据挖掘方式，在以前的研究中我们假设每个时间点只发生一个事件，然而在这篇文章中我们研究一种更普遍的模式：即在每个时间点可以发生多个事件。在这个算法中我们需要自己设置三个参数：min_rep, max_…

张乐

2016-04-05

01

数据挖掘

朴素贝叶斯分类和预测算法的原理及实现

决策树和朴素贝叶斯是最常用的两种分类算法，本篇文章介绍朴素贝叶斯算法。贝叶斯定理是以英国数学家贝叶斯命名，用来解决两个条件概率之间的关系问题。简单的说就是在已知P(A|B)时如何获得P(B|A)的概率。朴素贝叶斯（Naive Bayes）假设特征P(A)在特定结果P(B)下是独立的。 1. 概率基础…

蓝鲸

2016-04-04

00

数据挖掘

一篇文章透彻解读聚类分析及案例实操

摘要：本文主要是介绍一下SAS的聚类案例，希望大家都动手做一遍，很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 聚类分析介绍 1.1 基本概念聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组，而这些相似…