George Fraser(左)和 Taylor Brown 于 2012 年在旧金山共同创立了 Fivetran
Fivetran今天在企业数据集成领域迈出了一大步,宣布了由 Andreessen Horowitz 牵头的 5.65 亿美元融资,并计划以 7 亿美元收购变更数据捕获 (CDC) 供应商 HVR。此举使这家崭露头角的 ETL 公司能够代表其客户进一步访问存储在本地数据库和 ERP 系统中的 EB 级数据。
C 轮融资和收购使Fivetran处于下一代数据集成和提取、转换和加载 (ETL) 功能的最前沿。这家位于加利福尼亚州奥克兰市已有 9 年历史的公司通过简化从源系统(主要是在云上运行的 SaaS 应用程序)中提取数据并将其加载到基于云的数据仓库中的管道的设置过程而取得了成功。今天的新闻将有助于扩大 Fivetran 在本地系统中的足迹,包括位于成熟企业核心的 ERP 应用程序。
HVR 的软件将有助于获取企业应用程序中的本地数据,而这些数据仍然没有得到充分利用。根据 Fivetran 引用的 Gartner 报告,97% 的公司数据未使用,其中大部分位于Oracle、SAP和其他公司的本地数据库和 ERP 系统中。
“HVR 花了几十年的时间组建团队和技术来解决最困难的数据管道问题:为世界上最大的企业复制关键任务数据库管理系统,”Fivetran 首席执行官乔治弗雷泽今天在一篇博客文章中表示。“这些系统包含最有价值的业务数据,但它们最难与之交互,正是因为它们对任务至关重要。HVR 的技术可以实现轻足迹、低延迟和高吞吐量的组合,这是其他任何地方都找不到的。”
Fraser 说,HVR 的技术补充了 Fivetran 的专业知识,后者主要专注于 SaaS 应用程序。“Fivetran 花了数年时间学习现代企业使用的数百种 SaaS 工具的复杂性,”他继续说道。“我们运营的托管服务对用户隐藏了这些工具的复杂性,并为分析师提供了一个简单的、随时可以查询的模式。”
HVR被列为Gartner的2021魔力象限数据集成,同一象限为Fivetran(见我们对报告的书面记录利基玩家在这里)。“HVR 专注于 CDC 市场,”Gartner 分析师在报告中写道。“这使 HVR 能够在这个领域引入强大的产品功能。”
Gartner 宣布 HVR 能够读取在线和存档日志,以及匹配源表和目标表以进行数据验证。分析师小组强调了 HVR 对基于代理和无代理选项的支持,这让 HVR 能够处理混合和多云部署。还提到了HVR的数据压缩能力,有利于大批量复制,以及HVR对数据库表、JSON、Parquet、Avro、CSV和XML、HVR的支持。
Gartner 报告中特别值得注意的是 HVR 对复杂数据转换的支持——包括在行级转换数据的能力、对“存根”缺失值的支持、修复异常值和字符集转换。考虑到 Fivetran 传统上专注于 ELT 流程,即在数据登陆后由数据库或数据仓库处理转换,这也有助于 Fivetran 构建其在 ELT 中的能力。
如前所述,HVR 专注于 CDC,它使公司能够实时或接近实时地快速复制对生产数据库所做的更改。传统的关系数据库通常旨在维护状态,而不是公开事件日志,这一事实使得 Apache Kafka 等实时流技术如此流行。(另一方面,在像 Kafka 这样的实时流系统中缺乏维护状态的能力,引发了围绕 Kafa 构建类似于数据库的东西的需求。平衡有状态数据和事件数据的需求并不容易,尤其是大规模,妥协是常态。)
拥有大约 400 个客户的 HVR CDC 的单一关注似乎使其与 Fivetran 非常契合,因为其他原因。例如,Gartner 指出 HVR 缺乏对复杂 ETL 工作负载的支持,包括支持数据复制以外的数据交付方式的能力。
本文由 数据分析网 编辑发布,内容观点不代表本站立场,转载或内容合作请联系我们,本文链接:https://www.afenxi.com/107063.html 。