kunishou/tpch_tables_scale_1
收藏Hugging Face2024-01-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kunishou/tpch_tables_scale_1
下载链接
链接失效反馈官方服务:
资源简介:
polars-tpch数据集用于评估polars的性能,基于TPC-H标准。TPC-H是一个决策支持基准,包含一系列业务导向的即席查询和并发数据修改,旨在测试‘真实’工作流程的性能。该基准展示了决策支持系统如何检查大量数据、执行高度复杂的查询并回答关键业务问题。
polars-tpch数据集用于评估polars的性能,基于TPC-H标准。TPC-H是一个决策支持基准,包含一系列业务导向的即席查询和并发数据修改,旨在测试‘真实’工作流程的性能。该基准展示了决策支持系统如何检查大量数据、执行高度复杂的查询并回答关键业务问题。
提供机构:
kunishou
原始信息汇总
polars-tpch 数据集概述
数据集描述
polars-tpch 数据集用于评估 polars 库的性能。该数据集包含 TPC 标准化的查询和数据,旨在测试“真实”工作流程的性能。
TPC-H 数据集
TPC-H 是一个决策支持基准测试,包含一系列面向业务的即席查询和并发数据修改。这些查询和填充数据库的数据被选为具有广泛的业界相关性。该基准测试展示了检查大量数据、执行高度复杂查询并提供关键业务问题答案的决策支持系统。
数据生成
项目设置
-
克隆仓库: shell git clone https://github.com/pola-rs/tpch.git cd tpch/tpch-dbgen
-
构建 tpch-dbgen: shell make
注意事项
- 在 MacOS 上,
make命令可能会在编译时出现错误,提示找不到malloc.h文件。解决方法是将#include <malloc.h>改为#include <sys/malloc.h>,并重新运行make命令。
执行
-
切换到仓库根目录: shell cd ../ ./run.sh
-
该脚本将执行以下操作:
- 创建一个新的虚拟环境并安装所有必需的依赖项。
- 生成用于基准测试的数据。
- 运行基准测试套件。



