预测分析
-
粗糙的贝叶斯转化概率预测模型
转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。本篇文章通过贝叶斯算法对网站中已经完成转化的历史用户数据进行分析,发现购买转化用户的特征,并通过交叉细分对不同用户购买转化的概率进行预测。 贝叶斯是分类和预测算法中的一种,我们在前面的文章中…
-
大数据:4步教你预测下一个“男神”
每一个爆红的“老公”后面,都有女人热气腾腾的爱情梦。梦想爱情,梦想完美的对象,并梦想被其至死不渝的追逐。 普通的霸道总裁已经不能满足观众了。上一个来自星星的都教授,不仅多金(攒了400多年钱),而且有文化(读了400多年书),还得有停止时间的超能力,才能戳中女性们越飞越高的粉红泡泡。 爆红的“新款”——是的你懂我在说谁。宋仲基在《太阳的后裔》中所塑造的军人形…
-
基于树的建模-完整教程(R & Python)
简介 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关系相当不错。他们善于解决手头的任何问题(分类或回归)。 决策树方法,随机森林,梯度增加被广泛用于各种数据科学问题。因此,对于每一个分析师(新鲜),重要的是要学习这些算法和用于建模。 决策树、随机森林、…
-
机器学习是如何预测《权利的游戏》中的叛徒的?
几个月之前,Airbnb发布了一篇博文,在这篇文章中作者向读者介绍了他们的数据科学家建立一个机器学习模型来保护自己的用户免遭来自恶意行为的欺诈危害。如果我们将具备这种功能的机器学习算法用到热播美剧《权利的游戏》当中,我们需要这种算法具备更加细致的模型才能分辨出剧中的人物到底是“善”还是“恶”。但是如果一个人的“善”与“恶”的本性与生俱来,那该怎么办如果他们的…
-
小李子拿下奥斯卡 盘点那些支持他的大数据们
“皇天不负小李!这回压力都在春上村树那里了!”第88届奥斯卡最佳男主角奖一公布,段子就铺天盖地而来,看来,大家为这一刻还真是准备多时。此次,莱昂 纳多·迪卡普里奥凭借在《荒野猎人》中的精彩表演终于拿回小金人,结束长达20年的陪跑生涯。不管你愿意不愿意,以后再也没有机会玩小李子和奥斯卡的梗 了。 比较有趣的是,此次大数据、人工智能们异常靠谱,基本给出的预测全部…
-
如何打造高性能大数据分析平台
摘要:本文将从技术无关的角度讨论一些提高性能的方法。下面我们将讨论一些能够应用在大数据分析系统不同阶段的技巧和准则(例如数据提取,数据清洗,处理,存储,以及介绍)。 大数据分析系统作为一个关键性的系统在各个公司迅速崛起。但是这种海量规模的数据带来了前所未有的性能挑战。同时,如果大数据分析系统无法在第一时间为运营决策提供关键数据,那么这样的大数据分析系统一文不…
-
大数据下客户金融产品购买概率预测
本文讨论用逻辑回归模型预测在金融市场情景下客户对金融产品的购买概率,以股票购买持仓概率作为研究对象。并探讨了TB级百万特征金融数据处理方法。 模型 基本假设:客户每日的持仓,是基于当时金融市场情景以及股票属性作出决策的独立事件。 该逻辑回归Logistic Regression模型简单描述如下: 客户购买持仓股票概率是指客户在指定日期购买持有指定股票的概率。…
-
跟数据科学家学习如何利用数据模型谈恋爱
男生和女生分别是来自不同星球的科学事实已经众所周知的了.男生们总是认为,女生们都是迷一样的生物,他们的情感状态浮动似乎是以秒单位在变化的,难以理解,更勿论预测了! 而女生们觉得男生都是没有感觉动物,完全不能理解什么叫感受-尽管已经告诉他们N次了!这种男女之间的根本差别,导致了他们之间的感情关系是受一种超级无敌复杂的系统所支配的. 不过,我们可以用一个叫隐式马…
-
数据挖掘与预测分析术语总结
数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。 分析型客户关系管理(Analytical CRM/aCRM): 用于支持决策,改善公司跟顾客的互动或提高互动的价值。针对有关顾客的知识,和如何与顾客有效接触的知识,进行收集、分析、应用。 大数据(Big Data): 大数据既是一个被滥用的流行语,也是一个当今社会的真…
-
基于贝叶斯生存分析的《冰与火之歌》人物死亡率分析
《冰与火之歌》书迷遍布全球。该小说凭借其丰富的人物设置受到广大书迷青睐。然而,在马丁( Martin )笔下,无论好人、坏人,主角、配角都难逃命运的捉弄。除不计其数的无名小卒外,马丁的世界里有916位有名字的角色,其中三分之一都已以各种方式结束了自己在小说中的生命。本文中,我们将进一步探究小说人物的死亡模式,建立贝叶斯生存模型来预测各角色的死亡概率。
-
数据挖掘过程中经常犯的11个错误
数据挖掘过程中绝不能犯这11大错误。