数据挖掘化功大法（10）——HP Vertica

考虑到企业数据仓库的重要战略意义(EDWs)和每年投入的巨额维护和扩展费用，如何容易地访问这些大量信息资产是非常迫切的需求。然而，许多EDWs成为自己成功的受害者。随着时间的推移，用户获取新问题答案的需要导致EDWs包含的数据量和复杂数据类型发生迅速增长，同时也带来更多的并发和复杂分析的压力。如果企业级数据仓库变得无法应付这种变化，或者服务水平协议(SLA)不能满足用户的要求,企业则往往不得不进行昂贵的数据库重新设计或硬件平台迁移扩容项目，这往往需要持续好多个月以及带来大量成本损失。即使如此新的架构也往往由于数据量增加得太快(目前已经有大量的客户从TB向PB级别扩展)，而导致系统不得不进行更多的优化，这些优化需要占用大量的磁盘存储，带来了存储浪费和I/O瓶颈的问题。因此如何解决在以往EDWs架构保持不变的状况下来满足新的实时性分析应用的需要成为技术创新的重要领域。Vertica正是这一领域的积极创新先锋。

下面这篇文章对vertica和inforbright进行了对比：

http://blog.csdn.net/zyz511919766/article/details/27682709

下面是关于建库和建表的示例：

http://www.cnblogs.com/jyzhao/p/3779045.html

关于管理部分可以参考：

http://www.cnblogs.com/jyzhao/p/3798363.html

实测的过亿条数据，在单表查询的情况下，性能非常理想，推荐一下!

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。