数据挖掘
-
一个资深数据人对数据挖掘的理解
在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸索和理解过程中,发现数据挖掘本身包含很多层次。并且模型本身也是存在传统和时髦之分的。本文就想聊聊这些话题。
-
用大数据挖掘普通人身上KOL的潜力,Robin8能让你在朋友圈里赚钱
不管是某两性类微信大号在每日推送的末尾突然来一段品牌露出,或者是某星座类微博大 V 总是在分析每日运势时插入一段营销软文,这些互联网中聚集了上百万粉丝的 KOL(意见领袖)早已在互联网中找到舒服的赚钱方式,可这放在普通人身上是否可以实现呢?一家公司想用数据分析的方式试试看。 Robin8 就是这样一个营销工具,在该平台上,普通人也可以利用自己的影响力帮助品牌…
-
非一般的数据挖掘机:关联规则法
机器学习中的许多数据挖掘方法主要是针对数值型数据的,算法也很偏向数理方法(例如支持向量机)。而分类数据(非数值型数据),其本质不过是简单的计数,针对这类数据的一个简单实用的方法就是关联规则挖掘法,谷歌的MapReduce也为这类算法提供了很好的软件构架。下面我们就来讨论一下应用关联规则法的有趣实例。 关联规则法的核心在于研究一些经常相伴发生的事件之间的关系,…
-
你用Python做过什么有趣的数据挖掘项目?
本文授权转载自知乎回答-何明科,作者:何明科系一面网络技术有限公司创始人。作者现身说法,用自己的创业历程举例说明:有钱很重要,有趣更重要。 第零步:原点,大数据与价值 大概一年多以前,和几个小伙伴均认同一个趋势:觉得通过技术手段获取网上越来越丰富的数据,并基于这些数据做分析及可视化,必能产生有价值的结果,帮助大家改善生活。(大数据被叫烂了,所以用低调的方式来…
-
数据挖掘系列篇:网易云音乐的个性化推荐漫谈
用过虾米、酷狗、QQ音乐、网易云音乐,个人感受网易云音乐在音乐推荐这块做的真心不错,特别是以“人”为角度的推荐,没有像虾米、酷狗推的那么乱。虾米还可以,但更多的是以歌搜歌的形式。刚注册了一个新的账号,避免有历史数据的干扰,听了一首周杰伦的《一路向北》和陈奕迅的《淘汰》,然后去个性化推荐里看到了蔡健雅的《红色高跟鞋》和曲婉婷的《承认》,给我的感觉还是比较惊喜,…
-
数据挖掘系列篇:今日头条的个性化推荐
摘要:今日头条作为一种新型的新闻阅读方式,已经将传统的新浪、腾讯、网易、搜狐这些新闻媒体以一种大数据+新闻内容的方式呈现给用户。上线没几年,用户量已经发展到3亿累计用户,日活奔着3000万去。看到这样的数据,小编还是比较震撼。这几乎是目前APP Top10的水平。所以有必要对今日头条好好研究下。 简单来看下今日头条这类的个性化推荐要实现大概是什么样的流程: …
-
大嘴巴漫谈数据挖掘:产品研发生原型,参与设计供方案
第三时期产品研发将针对第二时期筛选出的产品概念,按照以用户为中心的理念开始设计产品。首先根据目标用户的使用习惯并结合用户对产品的期望要求,设计出产品原型。然后基于用户对原型产品可用性的反馈评估,不断优化改进产品,以确保研发出的最终产品符合用户需要。 产品原型可以看做与用户沟通时使用的一种表现形式,诸如纸笔原型、线框图、产品测试版等,主要用来展现产品与用户之间…
-
大嘴巴漫谈数据挖掘:需求概念生产品,定性研究定类型
第二时期产品概念评估基于第一时期目标用户细分的基础上,通过挖掘具体的业务需求,从而进一步生成产品概念,即满足用户需求最初的产品设想。当然,也不是所有的产品概念都是有价值的,只有依托大量产品设想,针对已生成的产品概念,通过有效评估,选出其中最可能为用户所接受的。此处主要涉及需求程度和概念得分两个关键指标。 在整个概念评估时期,研究重点主要是挖掘用户需求,评估产…
-
大嘴巴漫谈数据挖掘:用户调查基样本,街头面访寻偏好
随后的定量分析以定性研究为基础,基于一定数量样本,对用户的行为和态度进行分析挖掘,细分出不同特征的用户群体,并加以描述。此处采用了一种叫街头面访的分析方法,即在一个相对固定、安静适宜的场所环境内,开展一个较长时间的访问。 接下来先要进行样本筛选及确定问卷结构。样本筛选主要是确定样本量和抽样方法,问卷结构则包括需要调研的各个方面,如生活轨迹、需求偏好等。 在样…
-
大嘴巴漫谈数据挖掘:策略研究找趋势,目标用户要细分
在产品设计阶段,第一时期策略研究从宏观角度对外部环境和内部情况加以分析,重点关注市场、技术等方面的发展与变化趋势,辅以用户细分研究,以此从中明确产品未来开发的相关策略。 借助企业内部和外部资料的收集处理,趋势分析能够帮助产品经理及时准确地了解行业发展趋势,为进一步的分析调研提供重要的参考依据。研究结果一般包括用户日常生活、社会经济发展、技术产业变革以及宏观竞…
-
如何利用数据挖掘构建用户画像
微博作为最大的中文社交媒体,拥有数以“PB”(1024 TB)计的用户信息,从海量的用户信息中发掘每个用户的社交特性、潜在能力及兴趣等信息,是微博为用户提供更加人性化服务的基础。微博大数据经过近两年不断地调整、磨合、优化,针对社交媒体特性,研发构建了一整套完整的用户画像体系。该体系涵盖能力标签、兴趣标签、关系及亲密度、信用质量和自然属性五大部分,完整而全面地…
-
懂你的推荐算法,推荐逻辑是怎样的?
作为一个喜欢思考人生的美男子,我时常感慨,现在这个年代,人们上网获取信息的成本真的好低。智能手机,人手一台,打开3G就能上网,百度一搜,什么都有。当然百度上搜出来的大多数可能并不是你想要的,但这并不妨碍上面的论点成立。也正是因为成本太低,人们反而不愿意主动取获取信息,于是各种各样的推荐系统有了大展身手的机会。 推荐在生活中是一个再平常不过的事情,你失业了,有…
-
基于日志文件的数据挖掘机理分析与研究
介绍了数据挖掘的定义,分析了日志数据面临的挑战及对其进行挖掘的原因。讨论了日志数据挖掘的需求,归纳了对日志数据挖掘的具体内容,总结了日志数据挖掘的具体应用。该研究对加强企事业单位计算机信息系统安全具有较强的指导意义。
-
浙江移动大数据核心建模能力自我掌控之路
随着大数据时代的到来,当前情况开始发生变化。大数据带来的影响,不仅仅是指技术革命带来的的数据爆炸,更是思维方式的一次革命:“数据使流程更加透明,有助于推动管理的扁平化,提升管理效率”
-
大嘴巴漫谈数据挖掘:产品运营靠分析,设计商用八时期
大数据时代,数据的分析及挖掘在企业的经营过程及业务管理中,逐步发挥出越来越显著的作用。无论是在产品的构想、原型设计阶段,还是在测试、上市商用后,用户需求与市场竞争环境都在每时每刻地不断发生变化。在这种情况下,就要秉承以用户为中心的理念,综合技术、市场两种驱动能力,以科学严谨的方法,准确有效地收集并分析用户订购及使用产品的评价、动机及行为等信息,为产品运营、业…