关联规则
-
关联分析在游戏行业中应用案例
背景:研究用户的历史付费行为,对付费用户购买的道具进行研究,发现道具之间的关联性,方便运营根据道具的关联性进行活动推广。 数据源:2016年3月28日——2016年4月4日一个自然周的付费数据。 数据字段:付费次数、付费人数、付费金额及占比、道具名称。 研究对象:2016年3月28日——2016年4月4日一个自然周的付费用户群。 一、数据探索 (1)购买次数…
-
搭建电商平台的标签系统?看这就够了
摘要:如何建立电商平台的标签系统? 期待该问题的优质回答,给所有需要设计标签系统的童鞋一个很好的指引,简要说明一下要做的事情: 1.电商系统的标签,可以支持前台分类的搜索(或者叫查询?) 2.电商系统的标签,可以支持某个关键词搜索出的产品的筛选 3.电商系统的标签,可以支持给商品、用户、供应商、产品、评价等多个维度大标签。 ▍陆志亚 上海商米科技 产品经理 …
-
3分钟了解个性化推荐算法
摘要:如果去商场里买东西,我并不愿意听导购小姐讲的话,但是电商网站上的推荐,我还真的愿意看一看。【猜你喜欢】,好,那你就猜猜吧。 推荐这种体验除了电商网站,还有新闻推荐、电台音乐推荐、搜索相关内容及广告推荐,基于数据的个性化推荐也越来越普遍了。今天就针对场景来说说这些不同的个性化推荐算法吧。 说个性化之前,先提一下非个性化。 非个性化的推荐也是很常见的,毕竟…
-
数据挖掘的常用方法、功能和一个聚类分析应用案例
摘要:笔者整理了数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科)。当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整。除此以外,笔者尝试学习了SMARTBI公司中的Smart Mining软件,并跟随其提供的示例教程进行了学习。为方便阅读,将其示例教程结合自己的体会作为文章的第三部分。 一、数据挖掘的常用方法 利用数据挖掘进行数据…
-
如何判断一笔交易是否属于欺诈 数据挖掘算法与现实生活中的应用案例
“如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘(Data Mining)的知识,你,或许会有柳暗花明的感觉。 的确,数据挖掘无处不在。它…
-
非一般的数据挖掘机:关联规则法
机器学习中的许多数据挖掘方法主要是针对数值型数据的,算法也很偏向数理方法(例如支持向量机)。而分类数据(非数值型数据),其本质不过是简单的计数,针对这类数据的一个简单实用的方法就是关联规则挖掘法,谷歌的MapReduce也为这类算法提供了很好的软件构架。下面我们就来讨论一下应用关联规则法的有趣实例。 关联规则法的核心在于研究一些经常相伴发生的事件之间的关系,…
-
数据挖掘必须要具备知识结构类型
一、概念/类描述 概念/类描述就是通过对某类对象关联数据的汇总,分析和比较,用汇总的简洁的精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为:特征性描述和区别性描述。 特征性描述:是指从与某类对象相关的一组数据中提取出关于这些对象的共同特征。生成一个类的特征性描述只涉及该类对象中所有对象的同性。。 区别性描述:描述两个或者更多不同类对…
-
数据挖掘案例:啤酒尿布的关联算法怎么来的?
故事背景: 在一家超市中,通过大数据分析发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品的销售数据曲线竟然初期的相似,于是就将尿布与啤酒摆在一起。没想到这一举措居然使尿布和啤酒的销量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实大数据案例。原来,美国的妇女通常在家照顾孩子,所 以她们经常会嘱咐丈夫在下班回家…
-
数据挖掘之七种常用的方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。
-
数据挖掘化功大法(3)——谈谈支持度和置信度
支持度,简单的字面理解就是支持的程度,一般以百分比表示。生活中常见的使用场合有投票、竞选、民意调查等,比如某校高一三班进行班委竞选,该班级共有学生50名,在班长一职的竞选中,张三得到40票。那么就可以说在该班班长竞选中,张三的支持度是:40/50*100%=80%。 该名词还常出现在数据挖掘的关联分析中,常跟 置信度(或可信性)一起出现。 如:某超市中有10…
-
数据挖掘:“啤酒+尿布”的关联规则是怎么来的?
关联,其实很简单,就是几个东西或者事件是经常同时出现的,“啤酒+尿布”就是非常典型的两个关联商品。
-
数据挖掘算法之-关联规则挖掘(Association Rule)
在数据挖掘的知识模式中,关联规则模式是比较重要的一种。关联规则的概念由Agrawal、Imielinski、Swami 提出,是数据中一种简单但很实用的规则。关联规则模式属于描述型模式,发现关联规则的算法属于无监督学习的方法。 一、关联规则的定义和属性 考察一些涉及许多物品的事务:事务1 中出现了物品甲,事务2 中出现了物品乙,事务3 中则同时出现了物品甲和…
-
电商数据挖掘之关联算法2:牛奶可以搭配哪些商品
牛奶可以搭配哪些商品?
-
电商数据挖掘之关联算法1:“啤酒+尿布”的关联规则是怎么来的?
“啤酒+尿布”的关联规则是怎么来的?