图形数据库明确表示节点之间的连接,与关系数据库相比,它在分析网络(计算机,人,地理或其他方面)时效率更高。 这为图形数据库提供了诸如欺诈检测和推荐系统之类的应用程序的支持。

图数据库的主要优势之一是能够运行图计算算法。 这些用于无法很好地适应关系数据库的任务,例如图搜索,寻路,中心性,PageRank和社区检测。 分析算法(OLAP和HTAP)图形数据库主要支持图形算法,尽管某些事务性(OLTP)图形数据库(例如Neo4j)也支持它们。

[同样在InfoWorld上: 最佳的分布式关系数据库 | 最好的分布式NoSQL数据库 ]

这里讨论的所有图形数据库都具有良好的水平可伸缩性。 有些还支持只读副本,全局分发和自动水平分片。

亚马逊海王星

Amazon Neptune是具有ACID属性和即时一致性的完全托管事务(OLTP)图数据库服务,其核心是专用的高性能图数据库引擎,该引擎经过优化,可存储数十亿个关系并以毫秒为单位查询图潜伏。 Neptune支持两种最流行的开源图形查询语言:Apache TinkerPop Gremlin和W3C SPARQL。

[ 点击此处注册免费的三个小时的Kubernetes入门课程,该课程由Pluralsight和InfoWorld提供。 ]

Neptune数据库群集在三个可用区中的六个数据副本中可以具有高达64 TB的自动扩展存储,如果您通过在其他区域中使用只读副本来实现高可用性,则可以拥有更多的自动扩展存储。 Neptune自动检测数据库崩溃,并通常在30秒或更短的时间内重新启动,而无需执行崩溃恢复或重建数据库高速缓存,因为该高速缓存与数据库进程隔离,并且可以在重新启动后幸免。 如果整个主实例发生故障,Neptune将自动故障转移到最多15个只读副本之一。 备份将连续流式传输到Amazon S3。

您可以通过修改实例或为避免停机而增加或缩小Neptune群集,方法是添加所需大小的实例,并在迁移数据副本并将新实例提升为主要实例后关闭旧实例。 Neptune VM实例的大小范围从db.r4.large(两个vCPU和16 GiB的RAM)到db.r4.8xlarge(32 vCPU和244 GiB的RAM),为Neptune提供了16倍的动态写入范围和256x的动态范围。读取(计算只读副本)。

阅读我对Amazon Neptune的评论。

安索图

AnzoGraph是一个大规模并行的内存中OLAP图形数据库,可与企业数据源一起使用,并并行处理RDF和CSV格式的数据加载。 AnzoGraph可以部署在单节点沙箱中,也可以部署在具有生产所需数量的节点的群集中。 AnzoGraph具有ACID事务属性。

AnzoGraph使用W3C标准的RDF三重和四重数据以及SPARQL 1.1查询。 它支持标记的属性图作为RDF存储的一部分,符合建议的RDF *和SPARQL *标准,并且对SPARQL进行了扩展,以支持图算法,推理,窗口集合,BI函数和命名视图。 计划支持Neo4j兼容的OpenCypher语言和Neo4j协议Bolt。

AnzoGraph具有高性能的图形查询执行能力和可扩展性,可扩展到数十亿甚至数万亿个三元组,并且不需要数据库脱机即可实现快速并行数据加载。 AnzoGraph集群可以部署在CentOS,Kubernetes和AWS上。 AnzoGraph的Google Cloud Platform和Azure部署通常被视为Kubernetes部署。 AnzoGraph已证明在综合基准测试中可扩展到40个节点。

阅读我对AnzoGraph的评论

Neo4j

Neo4j是具有某些OLAP功能的可伸缩OLTP图形数据库。 Neo4j是最初的图形数据库,于1999年首次创建,并继续保持市场领先地位。

虽然开源Neo4j Community Edition仅限于一台服务器,但Neo4j Enterprise Edition允许您根据性能需要向群集添加任意数量的节点。

Neo4j 高可用性群集中的每个节点都包含数据库和群集管理组件,并且可以通过负载平衡器访问该群集。 完整图将复制到群集的每个实例,每个HA群集的读取容量会随着服务器实例的数量线性增加。 Neo4j可以每秒提交数万次写入,同时保持完全的ACID事务。

在Neo4j 因果群集中,将读写服务器的核心群集与一个或多个异步更新的只读副本群集组合在一起。 任何应用程序都可以保证因果一致性,这意味着即使硬件和网络出现故障,也可以保证至少读取自己的写入内容。 因果群集中的已读取副本可以在地理上进行分布,以提高副本附近用户的查询性能。

阅读我对Neo4j的评论

虎图

TigerGraph是一个实时的本地并行HTAP图形数据库,可用于在云中或本地部署。 TigerGraph支持ACID属性,具有内置的数据压缩功能,可以自动在集群中对图形进行分区,并且声称比竞争对手更快。 它使用一种消息传递体系结构,该体系结构固有地是并行的,并且可以随数据的大小扩展。

TigerGraph旨在能够执行深度链接分析以及实时在线交易处理和大容量数据加载。 通过“深层链接分析”,TigerGraph表示跟踪从顶点到整个图形的三个或更多跃点之间的关系并分析结果。

虽然已经广泛采用了几种开源图形查询语言,例如Cypher,Gremlin和SPARQL,但是TigerGraph具有新的查询语言GSQL。 GSQL结合了类似SQL的查询语法和类似Cypher的图形导航,以及过程编程和用户定义的功能。 TigerGraph可以为从Neo4j数据库迁移的人们将Cypher转换为GSQL。

TigerGraph的托管云产品目前处于预览阶段。 TigerGraph在使用八台机器运行读写集群时已显示出6.7倍的加速,但未提及任何有关只读副本或地理分布的信息。

阅读我对TigerGraph的评论

From: https://www.infoworld.com/article/3408787/the-best-graph-databases.html

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐