数据挖掘
-
大嘴巴漫谈数据挖掘:定量分析助定性,分析结果有展示
定性研究结束后,随后的定量分析需要接触一定规模的用户,以此获取用户对产品的认知度等方面的信息,为了保证样本的代表性,通常采取电话访问的形式。 与试商用时期相比,产品上市后的用户数量会有所增加。如果成本允许,建议总样本规模尽可能达到600至800人左右,并按照用户黏性、订购方式分别配额。通常,访问80…
-
数据面面观:关于数据挖掘和数据分析
1、 很多关于数据挖掘的帖子和文章都在强调工具、算法和架构等,但其实这些都不是数据挖掘的核心,数据挖掘的最重要的环节如下: 数据来源:通过无论是公开的数据还是合作方式、第三方的方式获得数据 获取标签:对标的物无论是用户、商品、文章分析,以获取足够定义这些标的物的标签,并对标签进行指标化和定义权重,通…
-
数据挖掘系列篇:Facebook内容排序算法研究
摘要:最近研究了下Facebook内容排序问题,这个在新浪微博、知乎内容排序这些场景下都应用到。主要是关于edgerank的算法讨论以及Facebook的AB test机制。 EdgeRank 是Facebook 在 F8 开发者大会上提出的对 fb 新鲜事 (Feeds) 排序的新算法, 用于区别…
-
简单粗暴的教你如何快速入坑数据分析?
技术控可以往底层走,做数据库开发或DM(编程的那种);往管理方向走要了解整个流程的基本技术,业务能力最重要。
-
【吐槽】不谈技术,闲话数据分析现状
写在前面 好久没写文章了,本人目前从事BI行业,主要做BO(报表展示)这一块,写这一篇文章主要是想分享一下自己的心得。本人不是大牛,基础小白,所以下面你会看到的更多是不经润色(不经大脑)的心得体会,而不是一堆NB轰轰的专业名称,算法,建模思想,分析思路等技术分享型文章。更多的是对这个职业的看法,技术…
-
基于内容和用户画像的个性化推荐
基于内容和用户画像的个性化推荐,有两个实体:内容和用户。需要有一个联系这两者的东西,即为标签。内容转换为标签即为内容特征化,用户则称为用户特征化。因此,对于此种推荐,主要分为以下几个关键部分: 标签库 内容特征化 用户特征化 隐语义推荐 综合上面讲述的各个部分即可实现一个基于内容和用户画像的个性化推…
-
大数据概念近乎透支,人工智能如何撩起下一波创业高潮?
摘要:大数据概念被热炒多年之后,我们是时候开始关注大数据与人工智能在具体领域中的应用问题。那么,目前大数据和人工智能领域还存在着哪些技术挑战如何找到大数据和人工智能的创业入口,利用数据挖掘和机器学习的能力创造出更大的商业价值 作为第四次工业革命的引领性领域,近年来的人工智能和大数据持续升温。最近的A…
-
“用户画像”如何应用于个性化运营
摘要:前些天听了Shadow老师的线上课程分享(视频地址: ),这个课程我觉得非常有意义,特别是对于我们这样想做个性化订制的精品导购平台来说,个性化运营尤其重要。所以今天把前些天上课的内容整理了一下,写出来与大家进行分享,希望大家批评指正。 要做个性化运营,首先要有用户画像,那么如何定位一个产品的用…
-
数据挖掘:周期性分析SMCA算法简介
摘要:周期性分析SMCA算法简介 算法介绍 以时间顺序挖掘周期性的模式(即周期性分析)是一种重要的数据挖掘方式,在以前的研究中我们假设每个时间点只发生一个事件,然而在这篇文章中我们研究一种更普遍的模式:即在每个时间点可以发生多个事件。 在这个算法中我们需要自己设置三个参数:min_rep, max_…
-
数字营销用户画像,与犯罪画像有哪些异曲同工之处?
摘要:现在有很多人对数字营销领域的“用户画像”报以怀疑的态度,可是你们为什么又那么喜欢看《犯罪现场》、《犯罪心理》等电视了,你们一定不知道这些电影里用到的一种手法,叫“犯罪心理画像”,其实和数字营销领域的“用户画像”,异曲同工。不信看下面吧! 正文 提到用户画像,好多人都听说过这个词,最初大家对它的…
-
R语言构建配对交易量化模型
我们可以通过“统计套利”的方法,发现市场的无效性。
-
数据分析告诉你,Papi酱的广告应该值多少钱?
2016年伴随网红这个词迅速蹿红,以及网红撬动资本时代到来,papi酱迅速走进资本圈视野,并开启了网红变现第一战:广告拍卖。外部盛传papi酱估值千万人民币的广告价值是否真如其所说?papi酱广告到底多少价值?用数据分析papi酱视频广告的价值。 一,papi酱媒体覆盖面及其构成1、papi酱累计播…
-
【SAS宏】拼手气红包该怎么抢?让微信红包的随机算法来告诉你
摘要:看到一篇讲微信拼手气红包算法的,又回想起今年抢红包屡败屡战,手气捉急,所以用SAS实现了一下抢红包算法,一探究竟。 推荐阅读:微信红包的随机算法是怎样实现的? 算法如下每个红包的金额在0.01和剩余平均值*2之间产生。 例如:发100块钱,总共10个红包,那么平均值应该是10块钱一个,那么第一…
-
SAS-EM 决策树操作案例
摘要:决策树主要用来描述将数据划分为不同组的规则。第一条规则首先将整个数据集划分为不同大小的子集,然后将另外的规则应用在子数据集中,数据集不同相应的规则也不同,这样就形成第二层数据集的划分。一般来说,一个子数据集或者被继续划分或者单独形成一个分组。 1 预测模型案例概述 一家金融服务公司为客户提供房…
-
朴素贝叶斯分类和预测算法的原理及实现
决策树和朴素贝叶斯是最常用的两种分类算法,本篇文章介绍朴素贝叶斯算法。贝叶斯定理是以英国数学家贝叶斯命名,用来解决两个条件概率之间的关系问题。简单的说就是在已知P(A|B)时如何获得P(B|A)的概率。朴素贝叶斯(Naive Bayes)假设特征P(A)在特定结果P(B)下是独立的。 1. 概率基础…