five

LDBC SNB

收藏
github2024-10-28 更新2024-11-28 收录
下载链接:
https://github.com/swstarlab-infolab/ldbc-complex-benchmark
下载链接
链接失效反馈
官方服务:
资源简介:
LDBC SNB是一个用于图数据管理技术的标准基准测试数据集,旨在模拟社交网络网站的所有方面,作为现代图应用中最具代表性和相关性的用例之一。

LDBC SNB is a standard benchmark dataset for graph data management technologies, designed to simulate all aspects of social networking websites and serving as one of the most representative and relevant use cases in modern graph applications.
创建时间:
2024-10-28
原始信息汇总

Chimera LDBC SNB 演示

LDBC SNB

  • 描述: Linked Data Benchmark Council’s Social Network Benchmark (LDBC SNB) 是一个图数据管理技术的标准基准测试。
  • 设计目的: 模拟社交网络网站的所有方面,作为现代图应用的代表性用例。

数据模型

1. 图数据模型

  • 图数据模型: 展示了LDBC SNB数据集在图数据模型中的结构。
  • 图示: 图数据模型

2. 关系数据模型

  • 关系数据模型: 展示了LDBC SNB数据集在关系数据模型中的结构。
  • 图示: 关系数据模型

查询

  • 支持的查询语言: SQL 和 Cypher。
  • 示例查询: 展示了IC2查询,用于获取特定用户的朋友最近创建的20条消息。

客户端接口

  • 支持的客户端API: 基于postgresql,支持所有postgresql-compatible的客户端API。
  • 示例连接: 展示了通过psql CLI进行连接的示例。

入门指南

0. 环境要求

  • 推荐环境:
    • Bash
    • Java 8
    • Docker 19+
    • postgresql-client

1. 设置

  • 克隆项目: bash git clone --recurse-submodules git@github.com:swstarlab-infolab/ldbc-complex-benchmark.git

  • 安装依赖: bash ./setup/install_dependencies.sh

2. 加载数据

  • 加载数据: bash ./scripts/setdb.sh init 0.1 /mnt/disk1/ldbcsnb-demo

    bash ./scripts/setdb.sh recycle 0.1 /mnt/disk1/ldbcsnb-demo

  • 注意事项: 数据目录需要有足够的空间。

3. 查询数据

  • 支持的查询: IC2, IC4, IC8, IC12, IS1, IS3, IS4, IS5。
  • 示例查询: bash export PGPASSWORD=mysecretpassword psql -h localhost -U postgres -d ldbcsnb -f queries/IC2.sql
搜集汇总
数据集介绍
main_image_url
构建方式
LDBC SNB数据集的构建基于社交网络的实际操作场景,旨在模拟现代图数据库应用的代表性用例。该数据集通过精心设计的图数据模型和关系数据模型,分别呈现社交网络的结构和关系。图数据模型通过节点和边的形式展示社交网络中的实体和关系,而关系数据模型则通过表格形式记录这些信息。这种双模型的设计不仅增强了数据集的灵活性,还为不同类型的查询处理提供了支持。
使用方法
使用LDBC SNB数据集时,用户可以通过Chimera数据库进行数据加载和查询。首先,用户需要设置环境并安装必要的依赖项,然后通过脚本加载数据集。数据集支持多种查询类型,包括图查询和关系查询,用户可以通过psql CLI或其他兼容的客户端API进行查询操作。查询结果可以通过标准的SQL或Cypher语法获取,支持混合查询以满足复杂需求。
背景与挑战
背景概述
LDBC SNB(Linked Data Benchmark Council’s Social Network Benchmark)是由Linked Data Benchmark Council创建的一个标准基准测试数据集,专门用于评估图数据管理技术的性能。该数据集旨在模拟社交网络平台的运营,涵盖了社交网络应用中最具代表性和相关性的各个方面。LDBC SNB的创建旨在为图数据库和相关技术提供一个标准化的测试平台,从而推动该领域的发展和优化。
当前挑战
LDBC SNB在构建过程中面临的主要挑战包括数据模型的复杂性和多样性,需要在图数据模型和关系数据模型之间进行有效转换。此外,数据集的规模和复杂性使得数据加载和查询处理成为一项技术难题。在查询处理方面,支持多种查询语言(如SQL和Cypher)以及混合查询(如SQL/PGQ)增加了系统的复杂性和实现难度。同时,确保数据集在不同规模和配置下的性能一致性也是一大挑战。
常用场景
经典使用场景
LDBC SNB数据集的经典使用场景主要集中在社交网络分析领域,特别是用于评估和优化图数据库和图处理系统的性能。通过模拟社交网络中的用户交互和信息传播,该数据集能够帮助研究人员和开发者测试和比较不同图数据库的查询效率、扩展性和容错能力。例如,IC2查询展示了如何检索特定用户的朋友在特定时间范围内发布的最新消息,这对于社交网络平台的实时推荐和信息流优化具有重要意义。
解决学术问题
LDBC SNB数据集解决了图数据管理技术中的多个关键学术问题,包括图数据库的查询优化、数据模型选择、以及大规模图数据的存储和处理。通过提供一个真实且复杂的社交网络数据模型,该数据集使得研究人员能够深入探讨图数据库在处理复杂查询时的性能瓶颈和优化策略。此外,LDBC SNB还促进了图数据库标准化和互操作性的研究,为图数据管理技术的发展提供了坚实的基础。
实际应用
在实际应用中,LDBC SNB数据集被广泛用于社交网络平台的性能测试和优化。例如,社交网络公司可以利用该数据集来评估其数据库系统在处理大规模用户数据和复杂查询时的表现,从而优化用户体验和系统稳定性。此外,LDBC SNB还被用于金融风控、网络安全等领域的图数据分析,帮助识别和预防潜在的风险和威胁。
数据集最近研究
最新研究方向
在社交网络数据管理领域,LDBC SNB数据集的研究正朝着优化图数据库查询性能和混合数据模型处理能力的方向发展。随着社交网络应用的复杂性增加,研究人员致力于提升图数据库在处理大规模社交网络数据时的效率和准确性。此外,结合图数据模型和关系数据模型的混合查询技术,如Cypher与SQL的结合,成为当前研究的热点,旨在解决传统单一数据模型在处理复杂查询时的局限性。这些研究不仅推动了社交网络数据管理技术的前沿发展,也为实际应用中的性能优化提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作