数据中台
-
前优酷土豆大数据平台研发负责人杨大海:建立统一数据平台的重要性
对于一个外行人或刚入门的人来说,建立一个数据平台就是搭一个Hadoop集群而已。但基于这个集群,想要把它很好的用起来会暴露很多的问题。那么针对这些问题就需要研发很多系统来应对,所以建立统一数据平台是非常重要的。
-
大数据即服务(BDaaS):大数据行业的下一个热门
我们有软件即服务(SaaS)、平台即服务(PaaS)和数据即服务(DaaS),现在把它们全部揉杂在一起,再将所涉及的数据量大幅增加,就有了大数据即服务(BDaaS)。
-
如何用大数据优化技术提高LinkedIn内容运营效果数十倍
我将和大家一起从LinkedIn的战略开始,认识一下LinkedIn内容运营的历史地位和作用,分享如何运用大数据优化内容运营效果数十倍的成功经验。
-
支持关系型数据库及NoSQL的统一数据建模方案
现如今,NoSQL数据库与关系型数据库往往并存于企业的数据架构中。但是在NoSQL的数据管理方面,还缺乏像管理关系型数据那样成熟的方法与工具。
-
实现R与Hadoop联合作业的三种方法
为了满足用R语言处理pb量级数据的需求,我们需要把它和Hadoop联合起来使用。本文的目的就是阐述实现二者联合作业的不同技术。
-
基于Spark的文本情感分析
本文描述了基于 Spark 如何构建一个文本情感分析系统
-
大数据架构师必读的NoSQL建模技术
本文从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术。
-
揭秘eBay四大系统 从行为数据中寻找价值
eBay目前整体有四大系统,其中三个为生产系统,一个为测试开发系统。生产系统包括:第一,保存交易型数据和用户数据的企业及数据仓库(Enterprise Data Warehouse);第二,Teradata为eBay特别定制的分析系统,主要进行非结构化的用户行为数据处理;第三,专门为数据分析师使用,方便快速找到想要的数据。
-
以手机淘宝为例的推荐算法浅析
在信息时代的今天,大数据为用户获取方方面面的信息提高了效率,更可以智能的帮助用户从海量内容中快速找到想要阅读的信息,或者从海量商品中快速找到想要购买的商品。
-
如何搭建公司内部的数据平台
何为数据产品?从广义上讲,一切以数据作为驱动或者核心的都叫数据产品(例如数据报表平台、DMP、搜索与精准化产品、风控产品等等),从狭义上讲,就是公司的内部数据平台。
-
金融大数据信用评分模型解析
大数据征信:芝麻信用、腾讯信用和51信用卡等信用评分模型解析。
-
生活中的大数据技术:Map-Reduce的直观解释
在谷歌之前,人们就不知不觉地用了映射-归约技术,如机场分发登机牌,银行取号排队,流水作业阅卷,不过,要说清楚“映射向何方,归约在何处”,还有一点挑战,Let me try。
-
运行于云端的Hadoop——数据即服务的论证
在云端中运行一个高性能的大数据架构(如Hadoop和Spark)到底是否可行呢?
-
大数据分析界的“神兽”Apache Kylin有多牛?
Apache Kylin,中文名麒(shen)麟(shou) 是Hadoop动物园的重要成员。Apache Kylin是一个开源的分布式分析引擎,最初由eBay开发贡献至开源社区。
-
码农的良心推荐:9个最佳的大数据处理编程语言
大数据的浪潮仍在继续。它渗透到了几乎所有的行业,信息像洪水一样地席卷企业,使得软件越发庞然大物,比如Excel看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所未有的巨大。