数据挖掘
-
数据挖掘系列篇:总结职业
今天下半年计划把数据分析、数据挖掘、机器学习这些东西都撸一把,很可能以后就没有时间再来撸了。希望各位也能互相监督,看看今年过年之前能不能把之前的一系列的都整理一遍。还有个消息就是计划11月底会把《数据分析侠A的成长故事》截稿了,出版社已经联系了,而且提了很多宝贵的建议,这些我都接受了,到时候再扩充些内容,也欢迎大家多提提建议,不怕意见多。:D 好了,废话不多…
-
从定义到应用,数据挖掘的一次权威定义之旅
从定义到应用,数据挖掘的一次权威定义之旅 什么是数据挖掘 前两天看到群里有人问,什么是数据挖掘,现在就数据挖掘的概念做一下分析,并且尽量用大白话说一下数据挖掘到底是个啥东西,为啥大数据来了数据挖掘也火了(其实原来就挺火)。 先看一上概念: 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Dis…
-
数据挖掘与预测分析术语总结
数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。 分析型客户关系管理(Analytical CRM/aCRM): 用于支持决策,改善公司跟顾客的互动或提高互动的价值。针对有关顾客的知识,和如何与顾客有效接触的知识,进行收集、分析、应用。 大数据(Big Data): 大数据既是一个被滥用的流行语,也是一个当今社会的真…
-
大数据应用:信用评分及模型原理解析
虽然人人都可以通过对借款方在Lending Club和Prosper上的历史借贷数据进行分析,但我相信,了解消费信贷行为、评分机制和贷款决策背后的工作原理可以帮助投资人更好的在市场中进行决策,获得收益。 消费信贷一直是推动世界领先国家经济转型的主要力量。在过去的50年里,消费开支也因此有所增加。根据纽约联邦储备银行家庭债务和信用季度报告,2014年8月,消费…
-
数据挖掘之七种常用的方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。
-
我的数据挖掘之路——从菜鸟到实战
导读:作者wrchow是浙江大学计算机硕士,通过自己的努力终于拿到了心仪的offer(搜狗Web数据挖掘助理研究员),实现了从事互联网数据挖掘的梦 想。他对数据挖掘这个行业的兴趣,以及为了进入这个行业所做的准备和努力,非常值得想进入这一行业的在校生或朋友们参考。
-
统治世界的十大算法
软件正在统治世界。而软件的核心则是算法。算法千千万万,又有哪些算法属于 “皇冠上的珍珠” 呢?Marcos Otero 给出了他的看法。 什么是算法? 通俗而言,算法是一个定义明确的计算过程,可以一些值或一组值作为输入并产生一些值或一组值作为输出。因此算法就是将输入转为输出的一系列计算步骤。 —Thomas H. Cormen,Chales E. Leise…
-
腾讯防刷负责人:基于用户画像大数据的电商防刷架构
颜国平,腾讯云-天御系统研发负责人。 一直负责腾讯自有验证码、业务安全、防刷、账号安全等研发工作。 内部支持的产品(游戏、电商、腾讯投资的O2O企业)非常广泛。 在业务安全领域项目经验丰富,并且具备深度学习、大数据架构搭建等实战经验。 一、背景介绍 最近1~2年电商行业飞速发展,各种创业公司犹如雨后春笋大量涌现,商家通过各种活动形式的补贴来获取用户、培养用户…
-
如何系统地学习数据挖掘?
问题:如何系统地学习数据挖掘? 虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法..,感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据挖掘系统的学习过程是怎么样的,应该看那些书(中文最好) 回答者:Han Hsiao,发现隐藏的价值 数据挖掘:What?Why?…
-
美国大数据工程师面试攻略分享
美国大数据工程师面试攻略有哪些?
-
数据挖掘十大经典算法及各自优势
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十…
-
数据挖掘算法与生活中的应用案例
如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘的知识,你,或许会有柳暗花明的感觉。
-
数据挖掘的聚类算法有哪些,各有什么优势?
比较分类算法的话,大概考虑这几个维度:时间空间复杂度,鲁棒性,参数敏感性,处理不规则形状,适合的类数量,类间差异(范围大小,样本个数,形状差异) 可以参照一下sklearn网站给出的列表:2.3. Clustering 除了这些聚类方法以外,统计老师讲过一些传统的聚类方法,归属于系统聚类的范畴,先定义观测间的距离和类之间的距离计算方法,然后按照距离把最接近的…
-
点击流中的非结构化数据——文本挖掘应用实例
本篇介绍的是点击流中的非结构化数据的文本挖掘应用——当然,核心还是如何更好的应用这些非结构化数据。
-
数据挖掘从入门到进阶,要看什么书?
数据挖掘从入门到进阶,经典图书推荐!