five

Foodmart, Mongo zips

收藏
github2017-11-10 更新2024-05-31 收录
下载链接:
https://github.com/tzolov/calcite-test-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Foodmart数据集来自Mondrian演示,Mongo zips数据集截至2015年1月25日。

Foodmart数据集源自Mondrian演示,Mongo zips数据集截至2015年1月25日。
创建时间:
2017-11-09
原始信息汇总

数据集概述

数据集列表

  • Foodmart:来自Mondrian演示的数据集,用于MySQL数据库。
  • Mongo zips:MongoDB数据集,包含截至2015年1月25日的数据。

数据库列表

  • Apache Geode:端口10334。
  • Apache Cassandra:端口9042。
  • Druid:端口8082。
  • H2:存储在h2/target文件夹。
  • HSQLDB:存储在hsqldb/target文件夹。
  • MongoDB:端口27017。
  • MySQL:端口3306。
  • PostgreSQL:端口5432。

数据集使用示例

  • MongoDB - Zips数据:通过MongoDB shell访问,显示名为zips的集合。
  • MongoDB - Foodmart数据:通过MongoDB shell访问,显示多个集合,如accountagg_c_10_sales_fact_1997等。
  • MySQL - Foodmart数据:通过MySQL命令行访问,显示多个表,如accountagg_c_10_sales_fact_1997等。
  • PostgreSQL - Foodmart数据:通过psql访问,显示多个表,如accountagg_c_10_sales_fact_1997等。

数据集访问方法

  • Apache Geode:通过gfsh命令行工具连接并管理。
  • Apache Cassandra:通过cqlsh命令行工具连接并管理。
  • Druid:通过curl命令发送JSON查询请求。
  • MongoDB:通过mongo命令行工具连接并管理。
  • MySQL:通过mysql命令行工具连接并管理。
  • PostgreSQL:通过psql命令行工具连接并管理。
搜集汇总
数据集介绍
main_image_url
构建方式
Foodmart, Mongo zips数据集的构建是通过Vagrant脚本在虚拟机中预装数据库的方式实现的。该虚拟机包含了Apache Geode、Apache Cassandra、Druid等多种数据库,以及MongoDB、MySQL、PostgreSQL等实例。用户通过执行`mvn install`命令下载基础镜像并安装所有数据库,构建出适用于测试Apache Calcite的集成开发环境。
使用方法
使用该数据集时,用户首先需要确保满足Java、Maven 3.0.4、Vagrant、Virtual Box等环境要求。通过执行`mvn install`命令初始化虚拟机,然后可以通过SSH连接到虚拟机进行各种数据库操作。具体的数据库访问方法在README文件中有详细说明,包括如何连接、启动和关闭数据库,以及如何通过不同的数据库客户端工具进行数据查询。
背景与挑战
背景概述
Foodmart数据集源自Mondrian demo,Mongo zips数据集则来源于MongoDB的官方教程。这两个数据集均被用于Apache Calcite项目的测试,Apache Calcite是一个动态数据管理系统,它支持多种数据源和查询语言。Foodmart数据集模拟了一个超市的销售数据,而Mongo zips数据集包含美国邮政编码的聚合数据。这些数据集的创建旨在为开发人员提供一个易于配置的虚拟机环境,以便测试和评估Apache Calcite的功能和性能。自Mongo zips数据集的最后更新日期为2015年1月25日起,这些数据集已被广泛应用于数据库管理和数据分析领域,对相关技术研究和开发产生了积极影响。
当前挑战
在数据集的构建和使用过程中,研究人员面临了多方面的挑战。首先,确保数据集的准确性和一致性是一项关键挑战,因为这直接关系到后续数据分析的结果。其次,构建一个能够轻松配置和使用的虚拟机环境,以便于在不同数据库系统上测试Apache Calcite的功能,也是一个技术挑战。此外,数据集的维护和更新,以及确保与Apache Calcite项目的兼容性,都是需要持续关注和解决的问题。
常用场景
经典使用场景
Foodmart和Mongo zips数据集被广泛运用于数据库系统的测试与评估。其中Foodmart数据集源自Mondrian演示,适用于测试SQL查询优化器和OLAP系统的性能;Mongo zips数据集则用于MongoDB的聚合查询框架测试。这两个数据集在Apache Calcite项目中作为标准测试数据,以验证不同数据库系统的兼容性和Calcite的查询处理能力。
解决学术问题
该数据集解决了数据库系统性能评估和查询优化器测试中的实际问题,为学术界提供了一个统一的测试平台,有助于研究者在不依赖特定数据库系统的情况下,比较和评估不同数据库技术在处理复杂查询时的效率和效果。
实际应用
在实际应用中,这些数据集可用于数据库系统的教学、开发与性能调优。通过对这些数据集的查询和操作,开发者能够更好地理解数据库系统的行为特征,从而优化系统设计,提升数据处理和分析的效率。
数据集最近研究
最新研究方向
Foodmart和Mongo zips数据集作为Apache Calcite测试平台的一部分,其最新研究方向主要集中在数据库集成、查询优化及数据处理效率的提升。研究者们致力于探索如何通过Calcite这一分布式计算引擎,实现对多源异构数据的统一查询和管理。在此领域,研究的热点事件包括数据集的实时更新与同步,以及如何在保持查询性能的同时,优化数据存储结构。这些研究对于推动大数据技术在电子商务、物流和地理信息系统等领域的应用具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作