severo/dummy_public_renamed
收藏Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/severo/dummy_public_renamed
下载链接
链接失效反馈官方服务:
资源简介:
该小型数据集包含了从1510年至1900年间的数字化书籍中提取的前100个装饰图像的缩略图。这些图像是从49,455本数字化书籍中算法提取的,涵盖了哲学、历史、诗歌和文学等多个主题领域。数据集由Hugging Face的Sylvain Lesage创建,主要用于Daniel van Strien的图像搜索教程的演示。数据集遵循CC0 1.0许可。
提供机构:
severo
原始信息汇总
数据集概述
数据集描述
- 名称: Digitised Books - Images identified as Embellishments. c. 1510 - c. 1900. JPG
- 概要: 该数据集包含100个缩略图,这些缩略图是从1510年至1900年间出版的书籍中提取的装饰性图像。数据集用于复制Daniel van Strien的教程Using 🤗 datasets for image search。
数据集结构
数据实例
-
内容: 每个实例包含一个图像缩略图、文件名以及图像所在书籍的出版年份。
-
示例:
{ fname: 000811462_05_000205_1_The Pictorial History of England being a history of the people as well as a hi_1855.jpg, year: 1855, path: embellishments/1855/000811462_05_000205_1_The Pictorial History of England being a history of the people as well as a hi_1855.jpg, img: ... }
数据字段
fname: 图像文件名。year: 书籍出版年份,字符串格式。path: 图像的本地路径。img: 图像的缩略图,最大高度和宽度为224像素。
数据分割
- 分割方式: 单一的train分割,共100行。
数据集创建
来源数据
- 初始数据收集: 图像从49,455本数字化书籍中算法收集,这些书籍共计65,227卷(25+百万页),出版于1510年至1900年间。
- 数据格式: JPEG格式。
- 数据生产者: 英国图书馆、英国图书馆实验室、Adrian Edwards(策展人)、Neil Fitzgerald(贡献者ORCID)。
许可证
- 许可证: CC0 1.0 Universal Public Domain。
使用数据时的注意事项
- 数据集目的: 验证Daniel van Strien的教程中描述的过程,并展示图像数据集的数据集查看器。
- 数据集限制: 这是一个玩具数据集,用于教程演示和数据集查看器的展示。



