数据中台
-
隐藏在Uber里的大数据与小盲点
隐藏在Uber里的大数据与小盲点?
-
携程基于Storm的实时大数据平台实践
本文讲解了携程在实时数据平台的一些实践,按照时间顺序来说明我们是怎么一步一步构建起这个实时数据平台的,目前有一些什么新的尝试,未来的方向是怎么样的,希望对需要构建实时数据平台的公司和同学有所借鉴。 为什么要做实时数据平台 首先先介绍一下背景,为什么我们要做这个数据平台其实了解携程的业务的话,就会知道携程的业务部门是非常多的,除了酒店和机票两大业务之外,有近2…
-
大数据实时查询计算产品Presto的技术内幕
无论是对多数据源支持,还是高性能、易用性、可扩展性等方面, Presto都是大数据实时查询计算产品中的佼佼者。
-
在选择数据库的路上,我们遇到过哪些坑?(2)
你会怎么选择数据库,是关系数据库、XML 数据库、资源描述框架(RDF),还是图形数据库?
-
在选择数据库的路上,我们遇到过哪些坑?(1)
你会怎么选择数据库,是关系数据库、XML 数据库、资源描述框架(RDF),还是图形数据库?
-
教你手撕鬼子!从抗日武装的发展谈到数据治理
要想做好数据分析工作,绝对离不开数据治理打下的良好基础。本期我们邀请团队内的资深高层数据专家,带你从管理者的视角,全面而深入地了解数据治理的问题。
-
宋洪鑫:美团点评数据仓库开发模式演进
我今天的演讲主题是美团点评数据仓库开发模式演进,将美团从零开始一点一滴去建设数据仓库的全部过程展现出来。
-
美团大数据平台架构实践
谢语宸是来自美团的大数据构建平台的架构师。他在QCon2016北京站分享了一些整体上构建大数据平台的方法,除了聚焦在某一个点上的还有构建整体的大数据,以及各种各样技术的应用,希望能给大家一些关于大数据方面的启迪。
-
Hadoop家族——Mahout学习路线图
前言 Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌握,最值得学习的一个项目之一。 Mahout为数据分析人员,解决了大数据的门槛;为算法工程师,提供基础的算法库;为Hadoop开发人员,提供了数据建模的标准;为…
-
Hadoop家族——Hive学习路线图
前言 Hive是Hadoop家族中一款数据仓库产品,Hive最大的特点就是提供了类SQL的语法,封装了底层的MapReduce过程,让有SQL基础的业务人员,也可以直接利用Hadoop进行大数据的操作。就是这一个点,解决了原数据分析人员对于大数据分析的瓶颈。 让我们把Hive的环境构建起来,帮助非开发人员也能更好地了解大数据。 目录 Hive介绍 Hive学…
-
Hadoop家族学习路线图
前言 使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成功,更引发了它本身的加速发展。现在Hadoop家族产品,已经达到20个了之多。 有必要对自己的知识做一个整理了,把产品和技术都串起来。不仅能加深印象,更可以对以后的技术方向,技术选型做好基础准…
-
SQL VS. NoSQL:你需要知道些什么?
在本文中,我们将概述SQL和NoSQL之间的区别,各种NoSQL技术之间的差异,然后探讨一下RDBMS是否真的过时了。
-
硅谷资深工程师带你聊聊数据库那些事
作为两大主流开源数据库,MySQL 和 Postgres 的 “战争” 从来没有停止过,虽然硝烟不似程序语言之间的斗争那么浓烈。
-
LinkedIn文本分析平台:主题挖掘的四大技术步骤
LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节。LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题、用户的热点话题和痛点,能够做出改善产品、提高用户体验等重要的商业决定。下面是整理后的技术要点。
-
易观CTO郭炜:从0到N建立高性价比的大数据平台
怎么样从0到N来建一个大数据平台?