数据挖掘
-
产品策略研究期的数据分析与挖掘
摘要:《大嘴巴漫谈数据挖掘》系统而全面地描述了数据挖掘的基本概念、常用算法等。《大嘴巴漫谈数据挖掘(第2季产品篇)》是《大嘴巴漫谈数据挖掘》的姊妹篇,在前作的基础上,它以产品为核心,按照产品发展的过程,依次详细分析产品策略研究期、产品概念评估期、产品研发期、产品测试期、产品导入期、产品发展期、产品成熟期、产品衰退期这8个产品发展的必经阶段所必须做的数据挖掘工…
-
大嘴巴漫谈数据挖掘:维度角度辨特征,环比同比看趋势
外部调研结束后,接下来的内部数据分析则需由产品经理、行业专家和数据分析师共同配合完成。产品经理首先提出业务需求,并及时帮助数据分析师理解需求目标,然后数据分析师在充分掌握的基础上,将其转化为内部数据挖掘的分析目标,最后与行业专家确认所构建出的业务模型。同时,通过内部数据分析,产品经理还可以了解不同用户群体对产品的使用情况,以及从用户使用特征的角度来划分市场。…
-
搭建电商平台的标签系统?看这就够了
摘要:如何建立电商平台的标签系统? 期待该问题的优质回答,给所有需要设计标签系统的童鞋一个很好的指引,简要说明一下要做的事情: 1.电商系统的标签,可以支持前台分类的搜索(或者叫查询?) 2.电商系统的标签,可以支持某个关键词搜索出的产品的筛选 3.电商系统的标签,可以支持给商品、用户、供应商、产品、评价等多个维度大标签。 ▍陆志亚 上海商米科技 产品经理 …
-
解读芝麻信用与FICO评分的差异
自从听说阿里巴巴推出的芝麻信用评分可以帮助办理签证,小编就对这种评分产生了深厚的兴趣,何况它利用大数据分析的方法听上去也很酷,不知道你有没用过呢?今天,我们推送的文章就深度介绍了芝麻信用评分与经典的FICO评分之间的差异……
-
银行推荐系统在生活中的应用案例解析
介绍 日常生活中,推荐工作都是怎样开展的呢推荐来源于经验。假设现在有人需要你基于现实生活中的数据立刻作出推荐,你会怎样做呢首先,我们会感觉自己得像智能顾问一样聪明。其次,我们做的已经超出人类的能力范围了。因此,我们的目标就是建立智能软件,让它为我们提供值得信赖的推荐系统。 当我们访问亚马逊、Netflix、 imdb等许多网站时,我们的潜意识里已经接触到了一…
-
个性化推荐到底是不是个伪命题?
最近,有一位网友在微博上说,推荐是不是个伪命题连续几天试用了据说很好的某头条,某资讯以及某快报,感觉逃脱不了看什么就是什么的套路。也有人说,这是Exploitation & Exploration出了问题,没有很好得Exploration导致的结果。那么,个性化推荐到底是不是伪命题呢为什么很多推荐系统过了一段时间以后就老是推荐类似的东西呢本篇文章就要…
-
大嘴巴漫谈数据挖掘:定量分析助定性,分析结果有展示
定性研究结束后,随后的定量分析需要接触一定规模的用户,以此获取用户对产品的认知度等方面的信息,为了保证样本的代表性,通常采取电话访问的形式。 与试商用时期相比,产品上市后的用户数量会有所增加。如果成本允许,建议总样本规模尽可能达到600至800人左右,并按照用户黏性、订购方式分别配额。通常,访问800个用户,在95%的置信度下,可以确保误差在3.5%以内。 …
-
数据挖掘系列篇:Facebook内容排序算法研究
摘要:最近研究了下Facebook内容排序问题,这个在新浪微博、知乎内容排序这些场景下都应用到。主要是关于edgerank的算法讨论以及Facebook的AB test机制。 EdgeRank 是Facebook 在 F8 开发者大会上提出的对 fb 新鲜事 (Feeds) 排序的新算法, 用于区别默认的按时间逆序的 timeline。 要解决的问题就像@宋…
-
基于内容和用户画像的个性化推荐
基于内容和用户画像的个性化推荐,有两个实体:内容和用户。需要有一个联系这两者的东西,即为标签。内容转换为标签即为内容特征化,用户则称为用户特征化。因此,对于此种推荐,主要分为以下几个关键部分: 标签库 内容特征化 用户特征化 隐语义推荐 综合上面讲述的各个部分即可实现一个基于内容和用户画像的个性化推荐系统。如下图所示: 标签库 标签是联系用户与物品、内容以及…
-
“用户画像”如何应用于个性化运营
摘要:前些天听了Shadow老师的线上课程分享(视频地址: ),这个课程我觉得非常有意义,特别是对于我们这样想做个性化订制的精品导购平台来说,个性化运营尤其重要。所以今天把前些天上课的内容整理了一下,写出来与大家进行分享,希望大家批评指正。 要做个性化运营,首先要有用户画像,那么如何定位一个产品的用户画像呢?Shadow老师给我们分享了使用标签体系的方法来进…
-
数据挖掘:周期性分析SMCA算法简介
摘要:周期性分析SMCA算法简介 算法介绍 以时间顺序挖掘周期性的模式(即周期性分析)是一种重要的数据挖掘方式,在以前的研究中我们假设每个时间点只发生一个事件,然而在这篇文章中我们研究一种更普遍的模式:即在每个时间点可以发生多个事件。 在这个算法中我们需要自己设置三个参数:min_rep, max_dis, global_rep。分别代表“一个有效序列的最小…
-
朴素贝叶斯分类和预测算法的原理及实现
决策树和朴素贝叶斯是最常用的两种分类算法,本篇文章介绍朴素贝叶斯算法。贝叶斯定理是以英国数学家贝叶斯命名,用来解决两个条件概率之间的关系问题。简单的说就是在已知P(A|B)时如何获得P(B|A)的概率。朴素贝叶斯(Naive Bayes)假设特征P(A)在特定结果P(B)下是独立的。 1. 概率基础: 在开始介绍贝叶斯之前,先简单介绍下概率的基础知识。概率是…
-
一篇文章透彻解读聚类分析及案例实操
摘要:本文主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 聚类分析介绍 1.1 基本概念 聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作聚类。处于相同聚类中的数据实例彼此相同,处于不同聚类…
-
淘宝实战——教你数据挖掘好方法
摘要:下面通过4种对应的场景来帮助读者理解数据挖掘的4种任务。 (1)老板要求小白做一份市场分析——预测。 拿到市场分析的数据源后就要明确知道,分析市场最主要的价值就在于“先知”,即比竞争对手提前预知市场行情。因此接到市场分析的工作后,不用迷茫,预测是它的价值所在。 (2)老板要求小白对店铺的日常数据进行监控——异常检测。 平时监控店铺的数据时,如果一切正常…
-
如何做数据分析挖掘—以电信行业为例
摘要:本文以电信行业为例讲述如何做数据分析挖掘。 来源:豪研呓语