five

STATS

收藏
arXiv2021-09-15 更新2024-06-21 收录
下载链接:
https://relational.fit.cvut.cz/dataset/Stats
下载链接
链接失效反馈
官方服务:
资源简介:
STATS数据集是由阿里巴巴集团创建的复杂真实世界数据集,包含8个表和71个数值/分类属性,主要用于用户贡献内容的统计堆栈交换网络。该数据集具有大规模、复杂分布、丰富的连接模式和多样化的工作负载等特点,适用于评估基数估计方法在实际DBMS中的性能。数据集的访问地址为https://relational.fit.cvut.cz/dataset/Stats,可用于研究和开发基数估计技术,以提高查询优化器的性能。

The STATS dataset is a complex real-world dataset created by Alibaba Group. It contains 8 tables and 71 numerical/categorical attributes, and is primarily used for statistical analysis of the Stack Exchange network's user-contributed content. This dataset features large scale, complex data distributions, rich connection patterns and diverse workloads, making it suitable for evaluating the performance of cardinality estimation methods in practical DBMS. The access URL of the dataset is https://relational.fit.cvut.cz/dataset/Stats, and it can be utilized for research and development of cardinality estimation techniques to enhance the performance of query optimizers.
提供机构:
阿里巴巴集团
创建时间:
2021-09-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作