大数据
-
Spark性能优化指南——高级篇
前言 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。 数据倾斜调优 调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解…
-
摸象大数据CEO高鹏:大数据应用更重要的是实现人与人的匹配
摸象大数据其实是一个基于大数据的超级消费推荐引擎系统,聚焦“剁手女”人群,通过大数据实现用户、商品、服务三者之间的最优链接。在摸象大数据CEO高鹏看来,大数据应用领域更重要的是实现人与人的匹配
-
DTCC2016中国数据库技术大会在京举行(2016年5月12日-14日)
2016第七届中国数据库技术大会(DTCC)将如约于2016年5月12日-14日再度震撼来袭。
-
勾勒物联网与大数据的数据中心路线图
对于大数据的潜力,已经是毫无争议的议题,报告也同样鼓吹物联网,指出它将连接从我们的手机、我们的汽车到我们的家用电器等一切的一切。硬件、软件和专业服务的供应商已经加入进来,大家都想在由物联网这些技术方法将产生的潜在收益中分得一块大蛋糕。
-
傅一平:“数据化”与“差不多”先生,浅谈数据量化决策
量化是减少不确定性,优化问题的有效手段,是解决我们传统文化中“差不多”毛病的武器,在大数据时代,不仅仅是数据的质变和技术上的革命,更是数据思维方式上的革命
-
大数据入门的四个必备常识
大数据入门的四个必备常识,看完这篇文章让你对大数据入门有一个清晰的认知。
-
史上最全的“大数据”学习资源(下)
为了帮助大家更好深入了解大数据,云栖社区组织翻译了GitHub Awesome Big Data资源,供大家参考。本资源类型主要包括:大数据框架、论文等实用资源集合。
-
史上最全的“大数据”学习资源(上)
为了帮助大家更好深入了解大数据,云栖社区组织翻译了GitHub Awesome Big Data资源,供大家参考。本资源类型主要包括:大数据框架、论文等实用资源集合。
-
从无到有,如何21天搭建一个推荐系统
本文来自《大数据专场:阿里云数加平台》,阿里云技术专家郑重(卢梭)题为“21天搭建推荐系统”的重要演讲。
-
人工智能大拿解答机器学习30个问答
作者早先的一篇关于语言概率模型的论文开创了神经网络做语言模型的先河,启发了一系列关于 NLP 的文章,进而在工业界产生重大影响。此外,他的小组开发了 Theano 平台。以下是人工智能大拿解答机器学习30个问答。
-
鲍忠铁:浅谈数据分析和数据建模
本文大部分内容来源于 Bart Baesens 所著《Analysis in a Big Data World:The Essential Guide to DataScience and its Applications》。中文书名为《大数据分析数据科学应用场景与实践精髓》柯晓燕张纪元翻译
-
2016全球大数据战略版图剖析(8):数据资源/API篇
为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。
-
2016全球大数据战略版图剖析(7):跨基础设施/分析篇
为了更好的使大家了解行业现状,我们整理出了2016大数据版图英文对应公司的中文介绍,以飨读者。若与前文重复,则不再列出。
-
奇云诺德CEO罗奇斌:解读测序密码与基因大数据
解读测序密码是开启大健康领域的钥匙,高通量基因测序为快速迈入精准医疗时代提供了希望,但测序只是第一步,仅仅是得到了基因数据而已,还需要精准解读隐藏在基因大数据中的密码,才能真正揭示发病根源。
-
金融业如何构建新一代大数据运营中心?
近几年各行各业对大数据技术的应用越来越多,但凡有财力的企业都跃跃欲试,更何况是“手握重金”的金融行业。金融业如何利用大数据进行精准营销?如何构建新一代大数据运营中心?