俄罗斯搜索巨头Yandex分拆数据库业务ClickHouse,获5000万美元A轮融资

俄罗斯搜索巨头 Yandex 本周宣布,它已将其面向列的分布式分析数据库 ClickHouse 分拆为自己的公司。总部位于纽约市的 ClickHouse Inc. 还获得了 5000 万美元的 A 系列资金,以启动其业务。

俄罗斯搜索巨头 Yandex 本周宣布,它已将其面向列的分布式分析数据库 ClickHouse 分拆为自己的公司。 总部位于纽约市的 ClickHouse Inc. 还获得了 5000 万美元的 A 系列资金,以启动其业务。

总部位于莫斯科的 Yandex 于 2009 年开始开发 ClickHouse 数据库,几年后投入使用,作为其 Yandex.Metrica 网络分析服务的 OLAP 后端。 该数据库的主要优势是能够以相对较低的延迟大规模连续处理大量数据,这仍然是具有大数据需求的组织面临的技术挑战。

通过将数据存储在预先聚合的列中并使用其他技术(包括压缩、向量计算和线性扩展能力等),ClickHouse 能够达到更高的性能水平。根据 Yandex 的说法,ClickHouse 每秒能够扫描数亿行(代表数十 GB),这使用户能够以亚秒级延迟对 PB 级数据集运行 SQL 查询。该公司声称,这比传统数据库快 100 到 1,000 倍。

“ClickHouse 最显着的优势是其极高的查询处理速度和数据存储效率,”米洛维多夫写道。 “在上一代数据仓库中,没有预聚合就无法运行交互式查询;或者您无法在提供交互式查询时实时插入新数据;或者您不能只存储所有数据。使用 ClickHouse,您可以根据需要保留所有记录,并跨数据进行交互式实时报告。”

俄罗斯搜索巨头Yandex分拆数据库业务ClickHouse,获5000万美元A轮融资

ClickHouse 的历史(来源:ClickHouse)

让 ClickHouse 如此快速的秘诀是什么?根据 ClickHouse 网站的“独特功能”部分,该数据库避免存储额外值并将数据存储为主键,正如“真正的”面向列的数据库所做的那样,这是其优势的关键方面。 (看到公司承认其方法的缺点也令人耳目一新,包括没有成熟的交易和不支持更新,除了一些批量更新和删除功能以符合 GDPR。)

根据米洛维多夫的说法,没有一件事。 “……[T] 这里没有单一的‘银弹’,”他写道。 “主要优势是关注最极端生产工作负载的细节。”

在 Yandex.Metrica 实施 ClickHouse 后不久,它就被 Yandex 的大部分机构采用,Yandex 是欧洲最大的互联网公司,拥有 14,000 多名员工。那时,米洛维多夫说他知道需要更广泛地采用该软件。

“也许 ClickHouse 太好了,不能只在 Yandex 内部运行?”他在博客中写道。 “做开源很难,但它是一个巨大的胜利。虽然维护流行的开源产品需要付出巨大的努力和责任,但对我们来说,收益大于所有成本。”

2016 年,Yandex 发布了 ClickHouse 作为使用 Apache License 2.0 的开源产品。据 Yandex 称,这导致了全球数千家公司的指数增长和采用,包括优步、康卡斯特、eBay 和思科。

一些客户采用的故事令人信服。例如,优步采用 ClickHouse 作为其核心日志记录平台,每秒处理来自数千个服务的数百万个日志,代表服务中的数 PB 数据。根据其 2021 年 2 月的文章,Clickhouse 的性能比其 ELK(Elastic、Logstash、Kibana)实现提高了 10 倍。

与此同时,Spotify 使用 ClickHouse 在其基于 Google Cloud 的日志管理系统中为其 A/B 测试方案提供支持,该系统取代了 2,500 个节点的 Hadoop 集群。该公司需要能够每秒运行数百个查询,代表每天数千亿行。在选择 ClickHouse 而不是 BigQuery 时,它引用了架构的简单性、一组全面的内置函数和聚合以及 Superset 集成等原因。

德意志银行采用 ClickHouse 作为其数据仓库的基础,该数据仓库服务于各种用例,包括合规性、风险、交易和了解您的客户计划。根据这份介绍,该银行尝试了多个其他数据库,包括 KDB+、Vertica、Hive 和 Spark。今天,它决定结合 Spark、Alpakka、Kafka、Tableau、RShiny 和 Clickhouse 来支持其查询。

ClickHouse 联合创始人兼产品和工程总裁 Yury Izrailevsky 说:“公司部署 ClickHouse 的方式非常引人注目,而且充分说明了这项技术的实力。”在 ClickHouse 领导产品开发。 “组建 ClickHouse Inc. 将使我们能够专注于使产品更加强大,尤其是在部署在云环境中时。”

Milovidov 和 Izrailevsky 加入了硅谷资深人士 Aaron Katz 的行列,他是这家纽约市公司的首席执行官兼联合创始人。 Index Ventures 的合伙人 Mike Volpi 与 Benchmark 共同牵头,在 ClickHouse 中看到了一些让他想起其他高飞技术公司的东西。

“我们一直是 Index 数据基础设施的早期信徒和投资者,并且很幸运能与 Elastic、Confluent 和 Datadog 等领先企业合作,”沃尔皮说。 “鉴于其令人印象深刻的采用率和社区嗡嗡声,显然 ClickHouse 具有类似的令人兴奋的发展轨迹。”

来自:datanami,作者:Alex Woodie,由数据分析网编译
英文原文:https://www.datanami.com/2021/09/24/speedy-column-store-clickhouse-spins-out-from-yandex-raises-50m/

本文由 数据分析网 编辑发布,内容观点不代表本站立场,转载或内容合作请联系我们,本文链接:https://www.afenxi.com/107427.html 。

(1)
大数据精选的头像大数据精选编辑
上一篇 2021-10-12 08:44
下一篇 2021-10-13 08:18

相关文章

关注我们
关注我们
分享本页
返回顶部