five

BHL Optical Character Recognition (OCR) - Full Text Export (new)

收藏
smithsonian.figshare.com2024-08-16 更新2025-03-25 收录
下载链接:
https://smithsonian.figshare.com/articles/dataset/BHL_Optical_Character_Recognition_OCR_-_Full_Text_Export_new_/21422193/12
下载链接
链接失效反馈
官方服务:
资源简介:
The dataset contains a full export of the 60+ million  pages of OCR content in the Biodiversity Heritage Library, for items  hosted by BHL.  For contextual information and key definitions about this dataset see the Biodiversity Heritage Library Open Data Collection and the data dictionary below. Data Dictionary: s.si.edu/bhlocrtxt Release Date: the 17th of each month Frequency: Monthly  bureauCode: 452:11  Access Level: public

本数据集囊括了生物多样性文化遗产图书馆(BHL)托管项下超过六千万页的 OCR 内容全文导出。有关本数据集的背景信息和关键定义,请参阅生物多样性文化遗产图书馆开放数据集及下述数据字典。 数据字典:s.si.edu/bhlocrtxt 发布日期:每月十七日 更新频率:每月 机构代码:452:11 访问级别:公开
提供机构:
smithsonian.figshare.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作