大数据技术
-
Uber的大数据之道:Spark已经是“必备神器了”
这一篇来自于Uber数据架构组,他们负责人Chandar说:Spark 已经是“必备神器了”。
-
Hadoop学习资源集合
Hadoop是一个由Apache基金会所开发的开源分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储。
-
满满干货的大数据技术个人博客集合
数据科学领域的相关技术,近两年发展迅猛。有时仅凭个人的经验很难解决一些问题。互联网上遍布各类文章和资源,在学习时应该集万家之长,注重实践,并善于总结。同上面各博客的博主一样为知识的开源做一份贡献,让知识广为传播。
-
Apache六大尚未广为人知的大数据项目
世界各地无数的组织,他们使用的数据现在日益庞大而复杂,使用传统的数据处理程序已无法再进行优化分析及获得洞察。而这正是的新一代的大数据应用程序要解决的问题。
-
【邀请函】我是大数据科学家,我在这,您在哪?(2016年6月18日)
大数据如何促使传统金融机构升级转型?大数据如何提升金融风控能力?大数据如何助力精准营销?
-
“大数据院士”鄂维南: 完美的数据永远等不来
“完美的数据永远是等不来的,碎片化的数据也可以整合起来做分析,做数据分析的出发点是有多少数据可以做多少事。”
-
数据少帅周涛:你也可以成为数据魔法师
拥有大数据的理念,能够掌握数据和运用数据的人,就是下一个时代的魔法师,反之,你就成了麻瓜!
-
窥探大数据应用的未来发展方向
大数据应用的下一阶段发展方向在哪里?
-
百度张琪:大数据时代的数据仓储
乔丹为耐克代言说的是Just do IT而不是Just do DT
-
新知:数据“可听化”时代
数据可视化分析仍是主流,但听觉可能是人类最没有被充分开发的感官。
-
海云数据荣获2015-2016年度大数据领军企业奖
5月12日,2016中国大数据技术与应用推进大会在北京召开,海云数据荣获2015到2016年度大数据领军企业奖。
-
Spark性能优化指南——高级篇
前言 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。 数据倾斜调优 调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解…
-
数据挖掘,想说爱你并不容易
基于大数据技术能带来哪些新的应用类型,进而为客户带来新的价值增长点?要回答这个问题,有关数据挖掘方面的讨论是一个不可回避的,但是数据挖掘,在应用层面引起的争议也是非常大的。
-
你不需要Hadoop做数据分析的10个理由
为你的业务使用大数据技术是一个非常有吸引力的事情,现在Apache Hadoop使得它更加吸引人了。
-
【实战】利用MapReduce分析明星微博数据
互联网时代的到来,使得名人的形象变得更加鲜活,也拉近了明星和粉丝之间的距离。歌星、影星、体育明星、作家等名人通过互联网能够轻易实现和粉丝的互动,赚钱也变得前所未有的简单。