five

kunishou/tpch_tables_scale_1

收藏
Hugging Face2024-01-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kunishou/tpch_tables_scale_1
下载链接
链接失效反馈
官方服务:
资源简介:
polars-tpch数据集用于评估polars的性能,基于TPC-H标准。TPC-H是一个决策支持基准,包含一系列业务导向的即席查询和并发数据修改,旨在测试‘真实’工作流程的性能。该基准展示了决策支持系统如何检查大量数据、执行高度复杂的查询并回答关键业务问题。

polars-tpch数据集用于评估polars的性能,基于TPC-H标准。TPC-H是一个决策支持基准,包含一系列业务导向的即席查询和并发数据修改,旨在测试‘真实’工作流程的性能。该基准展示了决策支持系统如何检查大量数据、执行高度复杂的查询并回答关键业务问题。
提供机构:
kunishou
原始信息汇总

polars-tpch 数据集概述

数据集描述

polars-tpch 数据集用于评估 polars 库的性能。该数据集包含 TPC 标准化的查询和数据,旨在测试“真实”工作流程的性能。

TPC-H 数据集

TPC-H 是一个决策支持基准测试,包含一系列面向业务的即席查询和并发数据修改。这些查询和填充数据库的数据被选为具有广泛的业界相关性。该基准测试展示了检查大量数据、执行高度复杂查询并提供关键业务问题答案的决策支持系统。

数据生成

项目设置

  1. 克隆仓库: shell git clone https://github.com/pola-rs/tpch.git cd tpch/tpch-dbgen

  2. 构建 tpch-dbgen: shell make

注意事项

  • 在 MacOS 上,make 命令可能会在编译时出现错误,提示找不到 malloc.h 文件。解决方法是将 #include <malloc.h> 改为 #include <sys/malloc.h>,并重新运行 make 命令。

执行

  1. 切换到仓库根目录: shell cd ../ ./run.sh

  2. 该脚本将执行以下操作:

    • 创建一个新的虚拟环境并安装所有必需的依赖项。
    • 生成用于基准测试的数据。
    • 运行基准测试套件。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作