数据挖掘
-
国外创业公司从Facebook网页挖掘私密数据
这是我在Tenant Assured上报告最初的样子,里面搜集了我的Facebook、Twitter、LinkedIn和Instagram数据。我已经修改了自己的个人邮箱和朋友信息。(Tenant Assured) 在反乌托邦科幻小说《玩家一号》(Ready Player One)中有这样的场景,剧…
-
大嘴巴漫谈数据挖掘:指标体系全涵盖,定量评测体验度
本文作者系统介绍了用户体验评测指标体系的构建。
-
征信业必将大有可为?从拒绝推断说起
看到这个题目,你可能想问:“拒绝推断”是什么?这样专业的术语,与征信业又有什么关系?本周,我们从一个模型的改进方案出发,向你展示完善的征信体系的重要性。
-
R语言对回归模型进行回归诊断
在R语言中,对数据进行回归建模是一件很简单的事情,一个lm()函数就可以对数据进行建模了,但是建模了之后大部分人很可能忽略了一件事情就是,对回归模型进行诊断,判断这个模型到低是否模型的假定;如果不符合假定,模型得到的结果和现实中会有巨大的差距,甚至一些参数的检验因此失效。
-
大嘴巴漫谈数据挖掘——经典案例赏析
本次分享会以产品为核心,按照产品发展的过程,依次详细分析产品策略研究期、产品概念评估期、产品研发期、产品测试期、产品导入期、产品发展期、产品成熟期、产品衰退期这8个产品发展的必经阶段所必须做的数据挖掘工作。针对产品每一阶段的不同特点,分享了数据挖掘的核心技能,并指出了每一阶段数据挖掘需要避免的坑。
-
趣味数据挖掘系列12:数据挖掘中的趣味哲学
想用趣味的方式给《趣味数据挖掘系列》做一个哲学的总结,哲学常较深奥,深则难得有趣。因为选题含原生态冲突,写起来就费思量。拟借用一个交通肇事频率分析的例子,又百语千言,颇难开头。硬着头皮Try,还是从故事讲起,很久很久以前,It was long long ago…
-
趣味数据挖掘系列11:十大算法展辉煌历史,十大问题引锦绣前程
这篇突出资料性,先说三十年的十大算法,看数据挖掘的史上辉煌,再叙七年前提出的十大问题,证数据挖掘专家不是砖家;
-
趣味数据挖掘系列10:基因表达式编程
在本系列之九的末尾提到,基因表达式编程GEP(Gene Expression Programming)是一种数据挖掘工具,是进化计算家族中较新的成员。
-
大嘴巴漫谈数据挖掘:用户体验不可缺,定性研究建指标
通常,用户使用产品前,鉴于对产品的认知和了解以及过往其他类似产品的使用经验,会对产品体验有所期望。当用户使用产品后,体验高于期望时,满意度会较高,反之则会较低。 简单地说,用户体验就是用户使用某个产品或者服务过程中的主观感受。良好的用户体验能够有效提升产品运营的质量,有利于维持用户黏性,提高用户忠诚…
-
用户画像三个层次的认知与实践
个人对用户画像的理解是三个层次,可以说是三个步骤吧,从群体用户的问卷调研、数据分析到具象的个性描述,再到抽象应用
-
应用数据挖掘进行客户关系管理
客户关系管理的目标是缩减销售周期和销售成本、增加收人、寻找扩展业务所需的新的市场和渠道、以及提高客户的价值、满意度、赢利性和忠实度。
-
大数据挖掘是个什么鬼?先搞定以下五大关系
数据科学家”作为一个新兴的名词,他们主要是采用科学方法、运用数据挖掘工具来做大数据洞察的工程师。一个优秀的数据科学家需要具备诸如数据采集、模型算法、数学软件、分析预测、市场应用等多方面的素质。如果你也想成为一名数据科学家,那么可以先从本文介绍的数据挖掘过程中的五个关系开始,一点点探索整个数据挖掘的蓝图。
-
趣味数据挖掘系列9:灯谜、外星殖民、愚公移山和进化计算
本文从《基因表达式编程》的课程PPT中取了一些素材,加以简化和趣味化,从猜谜出发,借用外星殖民的科幻,讨论了公式发现的进化算法,分析了其中的愚公移山思想,描述了进化计算的七个特征,为下篇博文做些概念的准备。
-
个性化推荐系统基本概念及5种常规算法初探
整理了一些推荐系统的基本概念以及一些有代表性的简单的算法,作为初探总结,也希望能抛砖引玉,给同样想入坑的伙伴们提供一些思路。
-
大嘴巴漫谈数据挖掘:聚类分析后安排,细分群组有特征
如前所述,用户细分包括前后两部分,即前一部分因子分析完成后,还要对获得的公共因子进行随后的聚类分析。 聚类分析按照相似度进行划分类别,相似度一般由数据对象间的距离远近来衡量。基于确定的业务需求和分析目标,可以从用户基本属性、用户使用行为两个方面选择变量,随后便要进一步明确样本数据的形式。 样本数据中…