lodeawb/wbfns
收藏Hugging Face2024-02-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lodeawb/wbfns
下载链接
链接失效反馈官方服务:
资源简介:
wbfns 2018数据集包含42个公开可用的世界银行文档文本,这些文档与营养和食品安全相关,发布于2018年。所有文档均从世界银行项目API公开获取。数据集的主要用途是用于非常短的文本摘要任务。数据集的结构包括多个字段,如文档ID、行政区域、涉及的国家、文档类型、主题、发布日期、主要文档类型、PDF和TXT版本的公共URL、友好标题URL、项目ID、替代URL以及文档文本内容。数据集的创建目的是作为文本摘要的简短示例练习。
wbfns 2018数据集包含42个公开可用的世界银行文档文本,这些文档与营养和食品安全相关,发布于2018年。所有文档均从世界银行项目API公开获取。数据集的主要用途是用于非常短的文本摘要任务。数据集的结构包括多个字段,如文档ID、行政区域、涉及的国家、文档类型、主题、发布日期、主要文档类型、PDF和TXT版本的公共URL、友好标题URL、项目ID、替代URL以及文档文本内容。数据集的创建目的是作为文本摘要的简短示例练习。
提供机构:
lodeawb
原始信息汇总
数据集卡片 for wbfns 2018
数据集详情
数据集描述
42份世界银行关于营养和食品安全的相关文档,发布于2018年。所有文档均可从世界银行项目API公开获取,链接为:https://documents.worldbank.org/en/publication/documents-reports/api
- 许可证: MIT
数据集结构
- "id":世界银行文档ID号。
- "admreg":行政区域。
- "count":文档覆盖的国家或地区。
- "docty":文档类型,如Project Paper或Working Paper。
- "theme":文档涉及的主题,以逗号分隔的列表。
- "docdt":文档发布日期。
- "majdocty":根据主要用途划分的文档类型,如Project Documents。
- "pdfurl":文档PDF版本的公开URL。
- "txturl":文档TXT版本的公开URL。
- "url_friendly_title":文档所在的主公开URL。
- "projectid":世界银行项目ID。
- "url":文档所在的备用主公开URL。
- "doc-text":"txturl"内容。
数据集用途
旨在用于非常短的文本摘要任务。
超出范围的用途
不适用于其他任何用途。
数据集创建
策划理由
作为文本摘要的短样本练习材料。
数据集卡片联系
lodea@worldbank.org



