five

eci-io/climate-evaluation

收藏
Hugging Face2024-03-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eci-io/climate-evaluation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于ClimateGPT论文中的气候评估,包含多个子数据集:cdp_qa、climate_eng、climate_stance、climatext、exams、exeter和translated_exams。每个子数据集都有详细的配置信息,包括特征(如问题、答案、标签等)、数据类型、数据集大小、下载大小以及训练、验证和测试集的分割情况。这些数据集主要用于文本分类和多选任务。

该数据集用于ClimateGPT论文中的气候评估,包含多个子数据集:cdp_qa、climate_eng、climate_stance、climatext、exams、exeter和translated_exams。每个子数据集都有详细的配置信息,包括特征(如问题、答案、标签等)、数据类型、数据集大小、下载大小以及训练、验证和测试集的分割情况。这些数据集主要用于文本分类和多选任务。
提供机构:
eci-io
原始信息汇总

数据集概述

数据集配置

1. cdp_qa

  • 特征:
    • question: 字符串
    • answer: 字符串
    • label: 类别标签,名称包括 0 和 1
    • idx: 整数 (int32)
  • 分割:
    • train: 397518015 字节, 548155 样本
    • validation: 58167638 字节, 78876 样本
    • test: 66654435 字节, 92652 样本
  • 下载大小: 512401333 字节
  • 数据集大小: 522340088 字节

2. climate_eng

  • 特征:
    • text: 字符串
    • label: 类别标签,名称包括 0, 1, 2, 3, 4
    • idx: 整数 (int32)
  • 分割:
    • train: 625518 字节, 2871 样本
    • validation: 78234 字节, 354 样本
    • test: 81454 字节, 355 样本
  • 下载大小: 743756 字节
  • 数据集大小: 785206 字节

3. climate_stance

  • 特征:
    • text: 字符串
    • label: 类别标签,名称包括 0, 1, 2
    • idx: 整数 (int32)
  • 分割:
    • train: 625518 字节, 2871 样本
    • validation: 78234 字节, 354 样本
    • test: 81454 字节, 355 样本
  • 下载大小: 743756 字节
  • 数据集大小: 785206 字节

4. climatext

  • 特征:
    • text: 字符串
    • label: 类别标签,名称包括 0, 1
    • idx: 整数 (int32)
  • 分割:
    • train: 847902 字节, 6000 样本
    • validation: 48406 字节, 300 样本
    • test: 260912 字节, 1600 样本
  • 下载大小: 1385322 字节
  • 数据集大小: 1157220 字节

5. exams

  • 特征:
    • subject: 字符串
    • question_stem: 字符串
    • choices: 字符串
    • answerKey: 类别标签,名称包括 A, B, C, D
    • idx: 整数 (int32)
  • 分割:
    • test: 165711 字节, 484 样本
  • 下载大小: 157661 字节
  • 数据集大小: 165711 字节

6. exeter

  • 特征:
    • text: 字符串
    • label: 类别标签,名称包括 0, 1
    • idx: 整数 (int32)
  • 分割:
    • train: 7495896 字节, 23436 样本
    • validation: 837247 字节, 2605 样本
    • test: 1053039 字节, 2904 样本
  • 下载大小: 9071528 字节
  • 数据集大小: 9386182 字节

7. translated_exams

  • 特征:
    • subject: 字符串
    • question_stem: 字符串
    • choices: 字符串
    • answerKey: 类别标签,名称包括 A, B, C, D
    • idx: 整数 (int32)
  • 分割:
    • test: 132380 字节, 484 样本
  • 下载大小: 125236 字节
  • 数据集大小: 132380 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作