museado/smithsonian-data
收藏Hugging Face2025-12-11 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/museado/smithsonian-data
下载链接
链接失效反馈官方服务:
资源简介:
这是一个预处理的数据集,来自史密森尼开放访问计划,涵盖了史密森尼学会博物馆和档案馆的数百万件物品的元数据。原始数据分散在255个单独的.txt文件中,此数据集将每个单位的数据整合到一个.jsonl.gz文件中,以便于下载和处理。数据集的文件格式为JSONL.GZ,每个文件对应一个史密森尼单位。数据集的使用方法、数据格式、来源、许可证和维护者信息也在README中提供。
Pre-processed data dumps from the Smithsonian Open Access initiative, covering millions of objects across Smithsonian Institution museums and archives. The raw data is split across 255 individual .txt files per unit. This dataset consolidates each units data into a single .jsonl.gz file for easier downloading and processing. The datasets file format is JSONL.GZ, with each file corresponding to a Smithsonian unit. The README also provides information on usage, data format, source, license, and maintainer.
提供机构:
museado



