eci-io/climate-evaluation
收藏Hugging Face2024-03-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eci-io/climate-evaluation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于ClimateGPT论文中的气候评估,包含多个子数据集:cdp_qa、climate_eng、climate_stance、climatext、exams、exeter和translated_exams。每个子数据集都有详细的配置信息,包括特征(如问题、答案、标签等)、数据类型、数据集大小、下载大小以及训练、验证和测试集的分割情况。这些数据集主要用于文本分类和多选任务。
该数据集用于ClimateGPT论文中的气候评估,包含多个子数据集:cdp_qa、climate_eng、climate_stance、climatext、exams、exeter和translated_exams。每个子数据集都有详细的配置信息,包括特征(如问题、答案、标签等)、数据类型、数据集大小、下载大小以及训练、验证和测试集的分割情况。这些数据集主要用于文本分类和多选任务。
提供机构:
eci-io
原始信息汇总
数据集概述
数据集配置
1. cdp_qa
- 特征:
question: 字符串answer: 字符串label: 类别标签,名称包括 0 和 1idx: 整数 (int32)
- 分割:
train: 397518015 字节, 548155 样本validation: 58167638 字节, 78876 样本test: 66654435 字节, 92652 样本
- 下载大小: 512401333 字节
- 数据集大小: 522340088 字节
2. climate_eng
- 特征:
text: 字符串label: 类别标签,名称包括 0, 1, 2, 3, 4idx: 整数 (int32)
- 分割:
train: 625518 字节, 2871 样本validation: 78234 字节, 354 样本test: 81454 字节, 355 样本
- 下载大小: 743756 字节
- 数据集大小: 785206 字节
3. climate_stance
- 特征:
text: 字符串label: 类别标签,名称包括 0, 1, 2idx: 整数 (int32)
- 分割:
train: 625518 字节, 2871 样本validation: 78234 字节, 354 样本test: 81454 字节, 355 样本
- 下载大小: 743756 字节
- 数据集大小: 785206 字节
4. climatext
- 特征:
text: 字符串label: 类别标签,名称包括 0, 1idx: 整数 (int32)
- 分割:
train: 847902 字节, 6000 样本validation: 48406 字节, 300 样本test: 260912 字节, 1600 样本
- 下载大小: 1385322 字节
- 数据集大小: 1157220 字节
5. exams
- 特征:
subject: 字符串question_stem: 字符串choices: 字符串answerKey: 类别标签,名称包括 A, B, C, Didx: 整数 (int32)
- 分割:
test: 165711 字节, 484 样本
- 下载大小: 157661 字节
- 数据集大小: 165711 字节
6. exeter
- 特征:
text: 字符串label: 类别标签,名称包括 0, 1idx: 整数 (int32)
- 分割:
train: 7495896 字节, 23436 样本validation: 837247 字节, 2605 样本test: 1053039 字节, 2904 样本
- 下载大小: 9071528 字节
- 数据集大小: 9386182 字节
7. translated_exams
- 特征:
subject: 字符串question_stem: 字符串choices: 字符串answerKey: 类别标签,名称包括 A, B, C, Didx: 整数 (int32)
- 分割:
test: 132380 字节, 484 样本
- 下载大小: 125236 字节
- 数据集大小: 132380 字节



