GIZ/sector_data
收藏Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/GIZ/sector_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由GIZ Data Service Center整理,用于对给定文本进行多标签部门分类。源数据来自Climatewatchdata和Tracs(GIZ)。数据集包含约10k条数据,平均文本长度为50个单词,语言为英语。包含的部门有:农业、建筑、沿海地区、灾害风险管理(DRM)、全经济范围、能源、环境、健康、工业、LULUCF/林业、社会发展、交通、城市、废物、水。由于部门表示不平衡(真实类别),添加了一些额外的列来表示一些信息。
该数据集由GIZ Data Service Center整理,用于对给定文本进行多标签部门分类。源数据来自Climatewatchdata和Tracs(GIZ)。数据集包含约10k条数据,平均文本长度为50个单词,语言为英语。包含的部门有:农业、建筑、沿海地区、灾害风险管理(DRM)、全经济范围、能源、环境、健康、工业、LULUCF/林业、社会发展、交通、城市、废物、水。由于部门表示不平衡(真实类别),添加了一些额外的列来表示一些信息。
提供机构:
GIZ
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 文本分类
- 语言: 英语
- 数据集大小: 10K<n<100K
- 标签: 气候、政策
数据集详情
- 数据集大小: 约10k
- 平均文本长度: 50字
- 语言: 英语
包含的部门
- 农业
- 建筑
- 沿海区域
- 灾害风险管理(DRM)
- 经济总体
- 能源
- 环境
- 健康
- 工业
- LULUCF/林业
- 社会发展
- 交通
- 城市
- 废物
- 水
部门分类
- set0: 农业, 能源, LULUCF/林业, 水, 环境
计数 > 2000 - set1: 社会发展, 交通, 城市, 经济总体, 灾害风险管理(DRM)
2000 > 计数 > 1000 - set2: 沿海区域, 建筑, 健康, 废物, 工业
计数 < 1000



