分布式系统
-
Hadoop分布式文件系统详解
本文介绍了Hadoop分布式式文件系统原理以及Hadoop读写流程
-
大数据管理平台Apache Geode 分布式系统内部结构剖析
文|杨旭钧 Apache Geode于去年11月从Apache孵化器毕业成为顶级项目,是一个相当成熟、强健的的数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用。Geode自身功能比较多,首先它是一个基于JVM的NoSQL分布式数据处理平台,同时集中间件、缓存、消息队列、事件处理引擎、NoSQL数据库于一身的分布式内存数据处理平台。可用来进…
-
基于Storm构建分布式实时处理应用初探
作者:唐洁 最近利用闲暇时间,又重新研读了一下Storm。认真对比了一下Hadoop,前者更擅长的是,实时流式数据处理,后者更擅长的是基于HDFS,通过MapReduce方式的离线数据分析计算。对于Hadoop,本身不擅长实时的数据分析处理。两者的共同点都是分布式架构,而且都类似有主/从关系的概念。 本文我不会具体阐述Storm集群和Zookeeper集群如…
-
Hadoop科普贴:常见的问题解答
这里为大家分享Hadoop集群设置中经常出现的一些问题。
-
你真的理解分布式系统吗?
经常听到”分布式系统“,”分布式计算“,”分布式算法“。分布式的具体含义是什么?
-
大数据实时查询计算产品Presto的技术内幕
无论是对多数据源支持,还是高性能、易用性、可扩展性等方面, Presto都是大数据实时查询计算产品中的佼佼者。
-
运行于云端的Hadoop——数据即服务的论证
在云端中运行一个高性能的大数据架构(如Hadoop和Spark)到底是否可行呢?
-
互利科技CEO林坦:机器学习在日志数据中的应用
机器,该如何进行信息交换?所交换的信息,又是什么样子的?人工智能如何运用在机器的信息处理上?机器最终可否实现自我修复?
-
大数据,从打好分布式系统的基础开始
分布式系统是大数据的基础,大数据是分布式系统的最佳实践。本文将介绍分布式系统对数据的基本处理方法,包括数据的分布方式和对数据副本进行控制的协议和算法。这些算法也是大数据各类组件技术的基础。 分布式系统定义 分布式系统是若干独立计算机的集合,但这些计算机系统集合从用户的使用角度来说,则是一个单一的应用系统。组建一个分布式系统具备五个关键目标: 资源的可访问性:…
-
其实Hadoop不是解决大数据问题的唯一方案
Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。