five

RevolutionCrossroads/loc_chronicling_america_1770-1810

收藏
Hugging Face2025-12-23 更新2026-01-03 收录
下载链接:
https://hf-mirror.com/datasets/RevolutionCrossroads/loc_chronicling_america_1770-1810
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来自美国国会图书馆的Chronicling America数字收藏,是国家数字报纸计划(NDNP)的一部分。数据集包含1770年至1810年间出版的报纸的页面级记录,包括图像、OCR文本和出版物元数据。它为纪念美国成立250周年,为研究、机器学习和公共历史项目提供了基础。数据集由史密森尼学会的数字与创新办公室准备,用于支持文化遗产与人工智能交叉领域的研究和实验。

A dataset drawn from the Library of Congress Chronicling America digital collection, part of the National Digital Newspaper Program (NDNP). This dataset includes page-level records with images, OCR text, and publication metadata for newspapers published between 1770 and 1810. It provides a foundation for research, machine learning, and public history projects in honor of the 250th anniversary of the United States. The dataset was prepared by the Smithsonian Institutions Office of Digital & Innovation to support research and experimentation at the intersection of cultural heritage and artificial intelligence.
提供机构:
RevolutionCrossroads
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作