five

devinitorg/iati-policy-markers

收藏
Hugging Face2024-08-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/devinitorg/iati-policy-markers
下载链接
链接失效反馈
官方服务:
资源简介:
International Aid Transparency Initiative (IATI) Policy Marker Dataset是一个多功能数据集,包含发布到IATI的所有活动标题和描述文本,并附有政策标记的元数据。该数据集支持多种语言(如英语、法语、西班牙语、德语),并包含多个特征列,如iati_identifier、reporting_org_ref、text、languages等。数据集还提供了关于不同政策标记的布尔值和显著性评分。数据集的大小在100K到1M之间,主要用于文本分类任务。
提供机构:
devinitorg
原始信息汇总

数据集概述

数据集名称

  • 名称: International Aid Transparency Initiative (IATI) Policy Marker Dataset

数据集描述

  • 描述: 包含所有活动标题和描述文本,以及发布到IATI的元数据政策标记。

数据集特征

  • 特征列表:
    • iati_identifier: 字符串
    • reporting_org_ref: 字符串
    • text: 字符串
    • languages: 字符串
    • activity_dates: 字符串
    • gender_equality_signutrition_sig: 浮点数或整数
    • gender_equalitynutrition: 布尔值

数据集大小

  • 大小类别: 100K<n<1M
  • 下载大小: 291318657字节
  • 数据集大小: 822695360字节
  • 训练集大小: 872067个示例,822695360字节

数据集语言

  • 支持语言: 英语、法语、西班牙语、德语

数据集许可证

  • 许可证: Apache-2.0

数据集任务类别

  • 任务类别: 文本分类

数据集使用示例

  • 示例代码: 用于加载和处理数据集的Python代码示例,展示了如何筛选与性别平等相关的数据,并进行数据分割。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作