数据挖掘模型
-
二分类模型中,如何应对分类自变量取值过多?
数据的世界是日益复杂的,大数据尤其如此。
-
东莞移动:“和信用分”用户信用体系
长期以来,东莞移动在大数据分析方面一直有很深入的研究与实践,这次他们将运营商大数据与用户信用结合起来,挖掘海量移动用户数据的附加价值。
-
大嘴巴漫谈数据挖掘:结构方程生模型,应用推广助运营
本文重点介绍了利用结构方程建模的方式构建用户体验分体系统,从而应用于运营的经验。
-
金融大数据信用评分模型解析
大数据征信:芝麻信用、腾讯信用和51信用卡等信用评分模型解析。
-
决策树算法真的越复杂越好吗?
对大数据感兴趣的你想必一定知道决策树这个名词吧,是不是也听说过其中各种复杂的组合算法呢?不过,在实际业务中,复杂的算法一定优于简单的算法吗?No……如果你觉得自己认识得还不够深入、全面,或者还缺乏实践的机会,请仔细阅读这篇专业长文。
-
K-Means聚类算法的原理及实现
K-Means是聚类算法中的一种,其中K表示类别数,Means表示均值。顾名思义K-Means是一种通过均值对数据点进行聚类的算法。K-Means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分。并通过划分后的均值迭代优化获得最优的聚类结果。 K值及初始质心 K值是聚类结果中类别的数量。简单的说就是我们希望将数据划分的类别数。K值决定了初始质…
-
解读芝麻信用与FICO评分的差异
自从听说阿里巴巴推出的芝麻信用评分可以帮助办理签证,小编就对这种评分产生了深厚的兴趣,何况它利用大数据分析的方法听上去也很酷,不知道你有没用过呢?今天,我们推送的文章就深度介绍了芝麻信用评分与经典的FICO评分之间的差异……
-
R语言构建配对交易量化模型
我们可以通过“统计套利”的方法,发现市场的无效性。
-
如何做数据分析挖掘—以电信行业为例
摘要:本文以电信行业为例讲述如何做数据分析挖掘。 来源:豪研呓语
-
FICO信用评分模型你知道多少?
说到中国的银行风控,大家可能都会想到两个概念,一个是央行的征信系统,还是一个就是美国的FICO。 FICO的信用评分系统究竟有多牛?为什么世界100强银行中,就有三分之二在使用它,为什么在美国没有FICO的信用评分卡就会寸步难行呢?为什么几乎全中国的银行都在使用这个洋玩意儿? 今天小编就来揭秘FICO的信用评分模型,看看它究竟有何特别之处? 众所周知,美国的…
-
如何做好数据挖掘与数据建模的9条经验总结
数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的…
-
机器学习和统计模型的差异
在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么? 这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者的区别似乎仅仅在于数据量和模型建立者的不同。这里有一张覆盖机器学习和统计模型的数据科学维恩图。 在这篇文章中,我将尽最大的努力来展示机器学习和统计模型的区别,同时也欢迎业界有经验的朋友对本文进行补充。…
-
以“草船借箭”为例,我们讲讲大数据建模
鲁迅评价诸葛亮“多智而近妖”,此话见诸《中国小说史略》,意思说诸葛亮足智多谋,像个妖怪。 而如今,从 大数据 的角度看,诸葛亮的足智多谋是因为他掌握了数据建模的办法。 今天,我们就来说说这诸葛先生的“数据建模”之道。 建模里的“模”是指模型。使材料成为一定形状的工具,就属于“模型”,这些模型看得见摸得着,叫做“具象模型”。但是也有些模型看不见摸不着,属于“抽…
-
新浪微博的推荐算法简述
在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的价值?效果如何衡量? 推荐系统诞生很早,但真正被大家所重视,缘起于以”facebook”为代表的社会化网络的兴起和以“淘宝“为代表的电商的繁荣,”选择“的时代已经来临,信息和物品的极大丰富,让用户如浩瀚宇宙中的小点,无所适从。推荐系统迎来…
-
如何构建用户画像的数据建模?
从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。…