five

Postgres Sample Databases

收藏
github2024-03-14 更新2024-05-31 收录
下载链接:
https://github.com/aa8y/docker-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
包含多个样本数据库,如dellstore2, iso3166, sportsdb, usda, world,用于PostgreSQL数据库的测试和练习。

本数据集汇集了诸如dellstore2、iso3166、sportsdb、usda及world等多样化的样本数据库,旨在为PostgreSQL数据库的测试与实训提供丰富的资源。
创建时间:
2017-07-19
原始信息汇总

Docker Dataset 概述

数据集描述

数据集内容

  • 当前包含的数据集来自 Postgres Sample Databases,具体包括:
    • dellstore2 (标记为 dellstore)
    • iso3166
    • sportsdb
    • usda
    • world

数据库支持

  • 目前仅支持 PostgreSQL 数据库。
  • 使用 alpine 版本的官方镜像作为基础镜像,以保持镜像的轻量化。

标签

  • 可用的标签包括:dellstore, iso3166, sportsdb, usda, world, alllatest
  • alllatest 标签指向包含所有数据集的同一镜像。
  • 其他标签对应于包含单个数据集的镜像。

已移除的数据集

  • pagila 标签已被移除,因其与任何版本的 Postgres 不兼容。

使用方法

启动容器

bash docker run -d --name pg-ds-<tag> aa8y/postgres-dataset:<tag>

访问数据库

bash docker exec -it pg-ds-<tag> psql -d <db_name>

  • <tag> 为上述提到的标签之一。
  • <db_name> 为数据集名称。

构建自定义镜像

bash docker build -t aa8y/postgres-dataset:some --build-arg DATASETS=dellstore,world .

  • 可选择性地包含部分数据集。

未来计划

  • 计划添加对其他数据库如 MySQL 的支持。
  • 计划增加 french-towns-communes-francais 数据集。
  • 寻找并添加更多免费数据源。
搜集汇总
数据集介绍
main_image_url
构建方式
Postgres Sample Databases数据集的构建基于Docker技术,旨在为用户提供预填充的样本数据库。通过使用PostgreSQL的官方`alpine`版本作为基础镜像,确保了镜像的轻量化。数据集从PostgreSQL的样本数据库中选择,包括`dellstore2`、`iso3166`、`sportsdb`、`usda`和`world`等,并通过FTP源进行数据加载。每个数据集被独立加载到各自的数据库中,用户可以根据需求选择单个数据集或包含所有数据集的镜像。
特点
该数据集的特点在于其多样性和实用性。它涵盖了多个领域的样本数据,如零售、体育、地理和农业等,能够满足不同场景下的需求。数据集以Docker镜像的形式提供,便于快速部署和使用。每个数据集被独立加载到数据库中,用户可以根据需要选择特定的数据集或使用包含所有数据集的镜像。此外,数据集的设计考虑了兼容性和稳定性,确保用户在使用过程中不会遇到数据不一致或兼容性问题。
使用方法
使用Postgres Sample Databases数据集的方法简单直观。用户可以通过Docker命令启动容器,并选择相应的标签来加载特定的数据集。例如,使用`docker run -d --name pg-ds-<tag> aa8y/postgres-dataset:<tag>`命令启动容器,并通过`docker exec -it pg-ds-<tag> psql -d <db_name>`命令访问数据库。用户还可以使用`docker-compose`进行更复杂的部署。此外,支持用户自定义镜像,通过`docker build`命令构建包含特定数据集的镜像,进一步满足个性化需求。
背景与挑战
背景概述
Postgres Sample Databases数据集由PostgreSQL社区于2010年代初期创建,旨在为数据库开发者和研究人员提供预填充的样本数据,以便进行SQL查询练习、数据库测试等任务。该数据集的核心研究问题在于如何为不同应用场景提供结构化和多样化的数据支持,涵盖了从电子商务到地理信息等多个领域。其主要研究人员和贡献者包括PostgreSQL社区的开发者和数据科学家,他们通过持续更新和维护,确保了数据集的实用性和时效性。该数据集在数据库教学、测试和开发中发挥了重要作用,成为PostgreSQL生态系统中的重要资源。
当前挑战
Postgres Sample Datasets在解决数据库测试和教学需求时面临多重挑战。首先,数据集的多样性和复杂性要求其能够覆盖广泛的领域,如电子商务、体育、地理等,这对数据的收集和结构化提出了较高要求。其次,在构建过程中,数据集需要与不同版本的PostgreSQL兼容,这导致了技术实现上的复杂性,例如Pagila数据集因兼容性问题被移除。此外,数据集的维护和更新需要持续投入,以确保数据的准确性和时效性。最后,如何扩展数据集以支持更多数据库类型(如MySQL)也是未来需要解决的重要挑战。
常用场景
经典使用场景
Postgres Sample Databases数据集在数据库学习和开发中扮演着重要角色,尤其是在SQL查询练习和数据库测试中。通过提供预填充的虚拟数据,该数据集使得开发者和学习者能够在不依赖真实数据的情况下,进行高效的数据库操作实践。无论是初学者还是经验丰富的开发者,都可以利用这些数据集进行复杂的查询优化、性能测试以及数据库设计验证。
解决学术问题
该数据集解决了数据库研究中常见的实验数据匮乏问题。在学术研究中,研究者往往需要大量且多样化的数据来验证其理论模型或算法。Postgres Sample Databases提供了多个领域的样本数据,如零售、体育、地理等,使得研究者能够在不同场景下进行实验,从而提升研究的普适性和可信度。此外,这些数据集还为数据库教学提供了丰富的案例,帮助学生更好地理解数据库系统的实际应用。
衍生相关工作
Postgres Sample Databases的广泛应用催生了许多相关的研究和开发工作。例如,基于该数据集的研究成果在数据库优化、数据挖掘和机器学习等领域得到了广泛应用。此外,许多开源项目和工具也依赖于这些数据集进行开发和测试,如数据库管理工具、数据可视化工具等。这些工作不仅推动了数据库技术的发展,也为相关领域的研究提供了宝贵的资源。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作