albertmartinez/OSDG
收藏Hugging Face2024-07-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/albertmartinez/OSDG
下载链接
链接失效反馈官方服务:
资源简介:
OSDG社区数据集(OSDG-CD)是一个用于文本分类任务的数据集,包含多个配置版本,每个版本都有训练集和测试集。数据特征包括文本和标签,标签对应联合国可持续发展目标(SDGs)的16个类别。数据集的大小、下载大小、示例数量等信息也详细列出。
The OSDG Community Dataset (OSDG-CD) is a dataset for text classification tasks, containing multiple configuration versions, each with a training set and a test set. The data features include text and labels, with labels corresponding to the 16 categories of the United Nations Sustainable Development Goals (SDGs). The dataset size, download size, number of examples, and other information are also detailed.
提供机构:
albertmartinez
原始信息汇总
OSDG Community Dataset (OSDG-CD) 概述
数据集基本信息
- 许可证: MIT
- 任务类别: 文本分类
- 数据集版本: 多个版本,包括 2021-09-30, 2022-01-01, 2022-04-01, 2022-07-01, 2023-04-01, 2023-07-01, 2023-10-01, 2024-01-01 和 21-09-30
数据集特征
- 特征:
- text: 数据类型为字符串
- labels: 数据类型为分类标签,包含以下类别:
- sdg1, sdg2, sdg3, sdg4, sdg5, sdg6, sdg7, sdg8, sdg9, sdg10, sdg11, sdg12, sdg13, sdg14, sdg15, sdg16
数据集分割
- 训练集 和 测试集 的详细信息如下:
| 版本 | 训练集字节数 | 训练集示例数 | 测试集字节数 | 测试集示例数 | 下载大小 | 数据集大小 |
|---|---|---|---|---|---|---|
| 2021-09-30 | 13585523 | 22484 | 5846952 | 9636 | 11747290 | 19432475 |
| 2022-01-01 | 13647767 | 22551 | 5843697 | 9666 | 11789200 | 19491464 |
| 2022-04-01 | 13670249 | 22628 | 5891776 | 9699 | 11817202 | 19562025 |
| 2022-07-01 | 13730108 | 22701 | 5893778 | 9730 | 11853594 | 19623886 |
| 2023-04-01 | 18649432 | 29182 | 7985978 | 12507 | 16132200 | 26635410 |
| 2023-07-01 | 18779769 | 29445 | 8074396 | 12620 | 16268745 | 26854165 |
| 2023-10-01 | 18888491 | 29648 | 8140119 | 12707 | 16375556 | 27028610 |
| 2024-01-01 | 19029441 | 29844 | 8161474 | 12791 | 16469769 | 27190915 |
| 21-09-30 | 13704368 | 22628 | 5857657 | 9699 | 11816358 | 19562025 |
数据集配置
- 数据文件路径: 每个版本的数据集文件路径格式为
<版本>/train-*和<版本>/test-* - 默认配置: 2024-01-01 版本为默认配置
标签信息
- 标签名称: sdg1 到 sdg16,共16个类别
数据集标签
- 标签: SDG



