five

severo/dummy_public_renamed

收藏
Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/severo/dummy_public_renamed
下载链接
链接失效反馈
官方服务:
资源简介:
该小型数据集包含了从1510年至1900年间的数字化书籍中提取的前100个装饰图像的缩略图。这些图像是从49,455本数字化书籍中算法提取的,涵盖了哲学、历史、诗歌和文学等多个主题领域。数据集由Hugging Face的Sylvain Lesage创建,主要用于Daniel van Strien的图像搜索教程的演示。数据集遵循CC0 1.0许可。
提供机构:
severo
原始信息汇总

数据集概述

数据集描述

  • 名称: Digitised Books - Images identified as Embellishments. c. 1510 - c. 1900. JPG
  • 概要: 该数据集包含100个缩略图,这些缩略图是从1510年至1900年间出版的书籍中提取的装饰性图像。数据集用于复制Daniel van Strien的教程Using 🤗 datasets for image search

数据集结构

数据实例

  • 内容: 每个实例包含一个图像缩略图、文件名以及图像所在书籍的出版年份。

  • 示例:

    { fname: 000811462_05_000205_1_The Pictorial History of England being a history of the people as well as a hi_1855.jpg, year: 1855, path: embellishments/1855/000811462_05_000205_1_The Pictorial History of England being a history of the people as well as a hi_1855.jpg, img: ... }

数据字段

  • fname: 图像文件名。
  • year: 书籍出版年份,字符串格式。
  • path: 图像的本地路径。
  • img: 图像的缩略图,最大高度和宽度为224像素。

数据分割

  • 分割方式: 单一的train分割,共100行。

数据集创建

来源数据

  • 初始数据收集: 图像从49,455本数字化书籍中算法收集,这些书籍共计65,227卷(25+百万页),出版于1510年至1900年间。
  • 数据格式: JPEG格式。
  • 数据生产者: 英国图书馆、英国图书馆实验室、Adrian Edwards(策展人)、Neil Fitzgerald(贡献者ORCID)。

许可证

  • 许可证: CC0 1.0 Universal Public Domain。

使用数据时的注意事项

  • 数据集目的: 验证Daniel van Strien的教程中描述的过程,并展示图像数据集的数据集查看器
  • 数据集限制: 这是一个玩具数据集,用于教程演示和数据集查看器的展示。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作