大数据系统
-
数据仓库搭建必知的知识点
1.数据仓库概念 (1)数据仓库是为企业所有决策制定过程,提供所有系统数据支持的战略集合。(2)通过对数据仓库中数据的分析,可以帮助企业,改进业…
-
如何学习数据库系统知识?
如何学习数据库系统知识。在这个之外的学习途径,我首先推荐看斯坦福大学的数据库系统实现这本书是数据库系统实现里面的经典的经典了。
-
支付风控数据仓库建设
作者|凤凰牌老熊 这篇文章是支付风控系统设计的第二篇,重点介绍支持支付风控的数据仓库建设。关于支付系统在风控上的具体需求,参见上一篇文章支付风控场景分析。 支付系统的风控分析需要大量的数据支撑。本文从名单、画像和图谱三个层面,分析在支付系统建设的不同阶段如何建立支持风控计算的数据仓库,详细介绍从什么地方采集数据、如何采集数据、以及如何存储这些数据。 支付风控…
-
洞察数据,洞见未来——6.15流计算杭州峰会重磅来袭
流计算团队将于6月15日(13:10-17:00点)在西溪园区举办阿里云流计算杭州峰会,聚焦实时大数据处理,邀请阿里云流计算客户和阿里集团内客户深入分享基于阿里云进行大数据处理的解决方案、最佳实践、开发实战等内容,并侧重交流阿里云流计算产品以及业务场景,解决遇到的计算难题。
-
领诚科技大数据日志分析解决方案
日志分析,并非大数据“雕虫技” 经过长期的信息化建设,企业积攒了成百上千套系统,每天产生海量的日志信息数据。然而,大量的日志信息往往被遗弃、或存放历史库中,未能有效发挥其价值。部分企业逐步意识到日志信息的重要性,部署了Tivoli等管理系统,但这种传统解决方案,对半结构和非结构化数据适应性极差,且局限于历史数据的统计展示,对日志数据的获取、使用和价值发挥均存…
-
Yahoo开源实时大数据处理服务系统Vespa
Yahoo开源实时大数据处理服务系统Vespa。
-
基于Storm构建分布式实时处理应用初探
作者:唐洁 最近利用闲暇时间,又重新研读了一下Storm。认真对比了一下Hadoop,前者更擅长的是,实时流式数据处理,后者更擅长的是基于HDFS,通过MapReduce方式的离线数据分析计算。对于Hadoop,本身不擅长实时的数据分析处理。两者的共同点都是分布式架构,而且都类似有主/从关系的概念。 本文我不会具体阐述Storm集群和Zookeeper集群如…
-
盘点困扰企业关于大数据的五个误解
只要部署了正确的工具和策略,大数据能够为企业带来很多机会,下面让我们来看看困扰着企业的5个大数据误解。