TigerGraph 今天宣布,其最新版本的并行图数据库可以完全由 Kubernetes 控制。在 3.2 版本中,该公司还增加了根据需要向上和向下扩展数据库的能力,加强了对数据库集群跨区域复制的支持,并将数据科学用例的图算法数量增加了一倍。它还报告了新商业智能基准的结果。
自从四年前出现了一个图形数据库,该数据库可以在多达 1,000 个节点的集群上本地扩展,TigerGraph一直在推动属性图数据库可以做的事情的界限。凭借其“图 3.0”方法,该方法结合了原生图存储的优势以及使用新数据不断刷新数据库的能力(困扰其他图数据库参与者的常见瓶颈),创始人兼首席执行官 Yu Xu 旨在解决最大的图挑战。
今天,该公司希望随着 TigerGraph 3.2 版的推出,将这种横向扩展的故事提升一个档次。这个故事的主要内容是它对 Kubernetes 的支持。在该产品的先前版本中,只有一个数据库节点可以在 Kubernetes 上运行,这显然限制了它的实用性。该公司负责产品和创新的副总裁 Jay Yu 表示,通过新版本,该公司正在提供“全面的集群支持”。“您可以使用 Kubernetes 来管理 TigerGraph 集群,”他说。
TigerGraph 3.2 版本提供跨区域数据库复制
其他操作改进包括使用单个命令调整集群大小的能力,这与 Kubernetes 支持无关。它还提供跨区域复制,这将使客户能够将集群镜像到地理位置偏远的另一个集群。用户还可以直接控制大查询的资源分配。
“我们之前支持一个区域内的多区域高可用性,而不是跨区域读取复制,”Yu 说。“现在使用 [this] 配置,您可以在另一个区域设置主集群的完整只读副本。更新实时(受物理网络速度限制)复制到远程区域。远程区域的副本处于活动状态,可以进行只读查询。”
为了证明 TigerGraph 的可扩展性,该公司针对关联数据基准委员会的社交网络基准 (LDBC-SNB) 30TB BI SF-30K 基准运行其数据库。TigerGraph 表示,它通过包含超过 700 亿个节点和超过 5000 亿条边的图满足了基准测试对商业智能的苛刻要求。
LDBC-SNB BI 基准测试侧重于“使用微批次插入/删除操作接触图的大部分的聚合和连接繁重的复杂查询”尚未最终确定,LNBC 网站显示尚未提交正式结果任何供应商。Yu 说 LDBC 正在对 TigerGraph 的提交进行认证,他预计这将需要几个月的时间。
“世界上没有其他供应商以这种规模完成了这个新的 BI 基准测试(版本 0.4.0),”Yu 说。“请注意,这个 BI 基准测试有一个微批量更新,它模拟了一个真实的生产环境,其中图形将在晚上通过每日增量更新而发生变化。”
Yu 说,TigerGraph 与 LDBC SNB 工作组密切合作,以生成这个规模的数据集。他说,这些小组从比例因子 10k 开始,然后工作到 30k。Yu 说,TigerGraph 在此过程中报告了错误,并与 LDBC SNB 工作组合作修复它们。“据我们所知,我们还没有听到有人尝试这种规模,”他补充道。
该公司还将平台随附的数据科学算法数量增加了一倍,达到 50 多种。其中包括像 Node2Vec 这样的算法,这是斯坦福大学用于图表征学习的算法框架;FastRP 是一种节点嵌入算法,其创建者声称比 Node2Vec 快 4,000 倍。
Yu 表示,TigerGraph 客户对数据科学用例的兴趣显着增加。“现在几乎每个客户都在询问某种形式的图数据科学:传统算法,如中心性或社区检测,或图机器学习算法,如图嵌入或图神经网络,”他说。“他们看到了改进欺诈检测的用例,在复杂情况下或在配置文件信息有限时改进建议,并对其关键业务运营进行建模和预测。
该公司声称其数据库内方法有好处。TigerGraph 说,通过直接在图形数据库中运行数据科学算法,它消除了将数据移出数据库来运行算法的需要。该公司表示,TigerGraph 的并行特性还使算法能够作为一个单元一次运行多达数百 TB,从而使用户受益。由于 Tigergraphs 数据库内图数据科学库中的开源算法都使用图 SQL (GSQL),因此它们与 TigerGraph 数据库上的用户编写算法使用相同的语言。
另外,TigerGraph 3.2 版本还为查询语言带来了 30 多个内置函数,支持变量定义、灵活的查询函数参数分配、灵活的查询函数返回和查询函数重载。
本文由 数据分析网 编辑发布,内容观点不代表本站立场,转载或内容合作请联系我们,本文链接:https://www.afenxi.com/107996.html 。