five

albertmartinez/OSDG

收藏
Hugging Face2024-07-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/albertmartinez/OSDG
下载链接
链接失效反馈
官方服务:
资源简介:
OSDG社区数据集(OSDG-CD)是一个用于文本分类任务的数据集,包含多个配置版本,每个版本都有训练集和测试集。数据特征包括文本和标签,标签对应联合国可持续发展目标(SDGs)的16个类别。数据集的大小、下载大小、示例数量等信息也详细列出。

The OSDG Community Dataset (OSDG-CD) is a dataset for text classification tasks, containing multiple configuration versions, each with a training set and a test set. The data features include text and labels, with labels corresponding to the 16 categories of the United Nations Sustainable Development Goals (SDGs). The dataset size, download size, number of examples, and other information are also detailed.
提供机构:
albertmartinez
原始信息汇总

OSDG Community Dataset (OSDG-CD) 概述

数据集基本信息

  • 许可证: MIT
  • 任务类别: 文本分类
  • 数据集版本: 多个版本,包括 2021-09-30, 2022-01-01, 2022-04-01, 2022-07-01, 2023-04-01, 2023-07-01, 2023-10-01, 2024-01-01 和 21-09-30

数据集特征

  • 特征:
    • text: 数据类型为字符串
    • labels: 数据类型为分类标签,包含以下类别:
      • sdg1, sdg2, sdg3, sdg4, sdg5, sdg6, sdg7, sdg8, sdg9, sdg10, sdg11, sdg12, sdg13, sdg14, sdg15, sdg16

数据集分割

  • 训练集测试集 的详细信息如下:
版本 训练集字节数 训练集示例数 测试集字节数 测试集示例数 下载大小 数据集大小
2021-09-30 13585523 22484 5846952 9636 11747290 19432475
2022-01-01 13647767 22551 5843697 9666 11789200 19491464
2022-04-01 13670249 22628 5891776 9699 11817202 19562025
2022-07-01 13730108 22701 5893778 9730 11853594 19623886
2023-04-01 18649432 29182 7985978 12507 16132200 26635410
2023-07-01 18779769 29445 8074396 12620 16268745 26854165
2023-10-01 18888491 29648 8140119 12707 16375556 27028610
2024-01-01 19029441 29844 8161474 12791 16469769 27190915
21-09-30 13704368 22628 5857657 9699 11816358 19562025

数据集配置

  • 数据文件路径: 每个版本的数据集文件路径格式为 <版本>/train-*<版本>/test-*
  • 默认配置: 2024-01-01 版本为默认配置

标签信息

  • 标签名称: sdg1 到 sdg16,共16个类别

数据集标签

  • 标签: SDG
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作