数据挖掘
-
应用数据挖掘进行客户关系管理
客户关系管理的目标是缩减销售周期和销售成本、增加收人、寻找扩展业务所需的新的市场和渠道、以及提高客户的价值、满意度、赢利性和忠实度。
-
大数据挖掘是个什么鬼?先搞定以下五大关系
数据科学家”作为一个新兴的名词,他们主要是采用科学方法、运用数据挖掘工具来做大数据洞察的工程师。一个优秀的数据科学家需要具备诸如数据采集、模型算法、数学软件、分析预测、市场应用等多方面的素质。如果你也想成为一名数据科学家,那么可以先从本文介绍的数据挖掘过程中的五个关系开始,一点点探索整个数据挖掘的蓝图。
-
趣味数据挖掘系列9:灯谜、外星殖民、愚公移山和进化计算
本文从《基因表达式编程》的课程PPT中取了一些素材,加以简化和趣味化,从猜谜出发,借用外星殖民的科幻,讨论了公式发现的进化算法,分析了其中的愚公移山思想,描述了进化计算的七个特征,为下篇博文做些概念的准备。
-
大数据架构师必读的NoSQL建模技术
本文从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术。
-
对于BI系统的建设,看看某UGC视频网站数据中心负责人怎么说?
本文将与读者们探讨分享笔者过去几年,在商业智能业务建设过程中所遇到的典型问题以及问题的解决思路。
-
大数据杂谈:大数据中的关联与因果
早早起来,磨刀烧水,“做掉”了这个扰民的始作俑者,联想起大数据中的关联和课题组前三个月前发表的关于因果挖掘的论文(计算机学报2014.12,文后可下载),写了这篇博文,借此科普一下因果与关联,写得比较匆忙,不当之处请博友们指正。
-
大嘴巴漫谈数据挖掘:聚类分析后安排,细分群组有特征
如前所述,用户细分包括前后两部分,即前一部分因子分析完成后,还要对获得的公共因子进行随后的聚类分析。 聚类分析按照相似度进行划分类别,相似度一般由数据对象间的距离远近来衡量。基于确定的业务需求和分析目标,可以从用户基本属性、用户使用行为两个方面选择变量,随后便要进一步明确样本数据的形式。 样本数据中性别、年龄及收入是离散变量,而使用频度和价值贡献是连续变量,…
-
趣味数据挖掘系列8:农村中学并迁选址、K-平均聚类及蛋鸡悖论
本文从农村中学并迁选址问题出发,介绍了数据挖掘十大算法中位居第二的K-平均聚类,后又借用牛顿迭代原理,议论蛋鸡悖论。
-
趣味数据挖掘系列7:团拜会与鸡尾酒会上的聚类
用异于传统的方式,从讲课PPT上取些素材(这样比较快),来说明聚类的一些概念,为下篇做些铺垫,下篇将通过通俗的例子说明一个著名的方法。
-
趣味数据挖掘系列5:听妈妈讲过去的故事,分房与分类
故事中没有月亮、云朵和晚风,却有关于数据挖掘中的分类技术的启示;虽然,现在不再分福利房了,但此故事既回顾历史,也解释了分类技术若干要点,有参考价值。
-
趣味数据挖掘系列4:巧挖科学博客之均击量公式,兼谈干预规则
为消除疲劳,现来一段有趣的、与博友的自尊心和荣誉感相关的博文,议题是:挖掘科学博客的平均点击量公式,以及提高平均点击量的方法。
-
趣味数据挖掘系列3:一篇 “它引” 上万的大牛论文 与 数据血统论
本文先通俗地介绍快速挖掘关联规则的Apriori算法,然后介绍发表这一算法的论文(它被引用了11480+次),最后关注此文的实际影响 与 传统影响因子的差距。
-
趣味数据挖掘系列2:烤鸭、面饼和甜面酱之朴素关联
此文从原讲课PPT中,取一些素材,来解释关联规则的挖掘思路和应用方法。
-
趣味数据挖掘系列1:被打”和“北大” 的关联
本文借此例来说明数据挖掘中关联规则中支持度、置信度和兴趣度概念,顺便对此事做个定量分析, 同时也作为趣味数据挖掘系列博文的开篇。
-
如何使用sklearn地进行数据挖掘?
使用sklearn进行数据挖掘。