用户画像
-
京东打造风控“天网”,大数据让刷单无处遁形
摘要:现如今,网购已经成为人们生活中的重要消费习惯,然而因为商品看得见、摸不着,用户只能透过店铺信誉、成交量、买家评价等信息来判断店家是否“靠谱”。这些数据会形成用户对商家信赖度的重要影响,直接决定是否在该店铺进行消费。这些本应是真实体现商家经营状况的数据,却出现了大量的造假行为——雇人通过虚假交易换取虚假好评,让普通消费者的利益蒙受损失。 京东很早就提出了…
-
如何基于Spark进行用户画像?
摘要:从数据分析、机器学习和结果三方面详解利用高性能分布式计算平台解决现实问题的过程。 近期,comSysto公司分享了该公司研发团队利用Spark平台解决Kaggle竞赛问题的经历,为Spark等平台应用于数据科学领域提供了借鉴。 主办方提供了一个包含5万个匿名驾驶员线路的数据集,竞赛的目的是根据路线研发出一个驾驶类型的算法类签名,来表征驾驶员的特征。例如…
-
人格量化 —— 个人金融画像探索
摘要:本文主要探讨将行为金融学相关理论应用于个人客户金融画像构建。 一 原始数据 目前业界的个人金融画像主要在金融机构内部数据结合外部数据基础构建。如对原始数据进行特征提取,得到如下客户特征: 图一 (来源[7]) 在实施过程中可以为个人金融画像中每个人打上几千个标签。再结合具体场景如股票购买概率预测模型[7]中特征要求,应用于具体场景模型中。 实践中我们一…
-
互联网人群画像和你所不知道的真相(三)
人群画像的基础在于对个体的准确描述(profiling),如果个体描述不准确,人群画像也会有偏差。对每一个个体的描述,我们使用一种被称为“标签”的东西。
-
数据运营系列篇:个性化推荐进入场景推荐时代
做推荐系统应该来说也有段时间了,而运营过程中通过推荐智能貌似已经成了烂大街的套路,给你发条短信、推个push、打个小红点、发了广告banner,而作为用户现在也有些变化的麻木了,今天还和郭太讨论了这个事情,本来是找算法团队一起讨论如下做线下O2O场景的问题,聊了聊具体的需要哪些数据,怎么将这其中的数据串联起来,还原当时的用户场景。 数据质量上首先就遭到算法同…
-
互联网人群画像和你所不知道的真相(二)
Mobile端用户和跨终端(跨屏)的唯一身份识别问题,同样是理想和现实并存的故事
-
互联网人群画像和你所不知道的真相(一)
作为新时代互联网营销的关键部分,人群画像引起了诸多兴趣,近年颇为风靡。几乎所有的互联网广告供应商都不约而同的强调,他们有足够精确的人群画像数据,确保能够找到广告主真正的受众。但是事情果真如此吗?人群画像是否是一劳永逸的解决方案?本文尝试解答这些问题。
-
一个母婴电子商务网站的大数据平台及机器学习实践
母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化最快的领域,比如是用户处在怀孕当中,关心的是孕妈的一些问题,几个月以后,随着宝宝的落地,就会准备一些纸尿裤和奶粉,而且随着宝宝的长大,纸尿裤和奶粉的类型也会变化。第三个是移动化,一般有90%的…
-
通过“观数”实现“观人”,观数科技深挖社交数据实现用户精准画像
在一个数据缺乏的市场提供数据服务,是幸运也是不幸,幸运的是市场中充满了机会,不幸的是市场上缺乏基本的数据源。 这是国内每一家数据公司所面对的基本情况,因此到底是自己挖掘数据源,还是利用已有数据源来开发模型,就成为一个重要的选择。观数科技更倾向于前者,虽然观数也有模型类的产品,但其核心能力在于对社交数据的爬取和处理。 观数对于社交数据的处理有两个特点,其一是其…
-
如何利用数据挖掘构建用户画像
微博作为最大的中文社交媒体,拥有数以“PB”(1024 TB)计的用户信息,从海量的用户信息中发掘每个用户的社交特性、潜在能力及兴趣等信息,是微博为用户提供更加人性化服务的基础。微博大数据经过近两年不断地调整、磨合、优化,针对社交媒体特性,研发构建了一整套完整的用户画像体系。该体系涵盖能力标签、兴趣标签、关系及亲密度、信用质量和自然属性五大部分,完整而全面地…
-
一号店用户画像分析系统实践
电子商务是互联网应用中发展期最早且模式最为成熟的商业模式,其用户和业务所带来的数据规模不断扩大,如何从大数据获取更大的价值?如何开发出真正贴合用户实际需求的推荐系统?1月9日,在七牛云主办的架构师实践日——瞩目电商:从架构开发到系统优化专场沙龙,一号店架构师王富平为大家一一解答了这些问题。以下是他的演讲实录。 在开场之前,我想先引用梵高的一句话:“我想强调的…
-
如何构建用户画像模型(理论篇)
什么是用户画像 简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。 举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩…
-
浅谈产品分析的用户画像
摘要:浅谈所谓的产品「用户画像」 2015上半年,我国网民已达到6.68亿,年底肯定能够顺利突破7亿,其中使用手机上网人群占整体88.9%。不同于传统PC上网,每个家庭共用一台设备,手机上网存在着独特性、唯一性和私密性的特点,每个人的手机都是一套独特的生态系统。因此,将有相同特征的用户抽象成一个代表,可以极大方便开发者研究用户构成和分布,精准定义用户。这也是…
-
数据分析系列篇:电商中数据分析应用
谈到零售,以淘宝、天猫、京东、Amazon为代表的电商公司,与大数据、数据分析保持着密不可分的关联。而他们的数据分析应用都有哪些呢? 1.网站分析(流量分析) 记得很久之前蓝鲸写过新手如何学习网站分析,现在也回顾下。 Web分析人员应该具备的5个基本素质 1. 需要了解互联网。2. 你需要知道一些网页技术的基本概念。3. 你需要会用一些最基本的工具。4. 你…
-
数据挖掘系列:用户画像之用户标签
摘要:用户画像(User Profile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。 微博作为最大的中文社交媒体,拥有数以“PB”(1024 TB)计的用户信息,从海量的用户信息中发掘每个用户的社交特性、潜在能力及兴趣等信息,是微博为用户提供更…