five

denizyuret-shallowai/hyperchat_dpo_v1_acc

收藏
Hugging Face2024-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/denizyuret-shallowai/hyperchat_dpo_v1_acc
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: arc_challenge features: - name: text dtype: string - name: label dtype: int64 splits: - name: train num_bytes: 154863 num_examples: 1119 - name: test num_bytes: 168287 num_examples: 1172 download_size: 185156 dataset_size: 323150 - config_name: gsm8k features: - name: text dtype: string - name: label dtype: int64 splits: - name: train num_bytes: 1843061 num_examples: 7473 - name: test num_bytes: 332380 num_examples: 1319 download_size: 1238317 dataset_size: 2175441 - config_name: hellaswag features: - name: text dtype: string - name: label dtype: int64 splits: - name: train num_bytes: 9306142 num_examples: 39905 - name: test num_bytes: 2406485 num_examples: 10042 download_size: 6912830 dataset_size: 11712627 - config_name: winogrande features: - name: text dtype: string - name: label dtype: int64 splits: - name: train num_bytes: 26448285 num_examples: 40398 - name: test num_bytes: 825719 num_examples: 1267 download_size: 14360443 dataset_size: 27274004 configs: - config_name: arc_challenge data_files: - split: train path: arc_challenge/train-* - split: test path: arc_challenge/test-* - config_name: gsm8k data_files: - split: train path: gsm8k/train-* - split: test path: gsm8k/test-* - config_name: hellaswag data_files: - split: train path: hellaswag/train-* - split: test path: hellaswag/test-* - config_name: winogrande data_files: - split: train path: winogrande/train-* - split: test path: winogrande/test-* ---
提供机构:
denizyuret-shallowai
原始信息汇总

数据集详情

arc_challenge

  • 特征:
    • text: 类型为 string
    • label: 类型为 int64
  • 分割:
    • train: 字节数为 154863, 样本数为 1119
    • test: 字节数为 168287, 样本数为 1172
  • 下载大小: 185156 字节
  • 数据集大小: 323150 字节
  • 数据文件:
    • train: arc_challenge/train-*
    • test: arc_challenge/test-*

gsm8k

  • 特征:
    • text: 类型为 string
    • label: 类型为 int64
  • 分割:
    • train: 字节数为 1843061, 样本数为 7473
    • test: 字节数为 332380, 样本数为 1319
  • 下载大小: 1238317 字节
  • 数据集大小: 2175441 字节
  • 数据文件:
    • train: gsm8k/train-*
    • test: gsm8k/test-*

hellaswag

  • 特征:
    • text: 类型为 string
    • label: 类型为 int64
  • 分割:
    • train: 字节数为 9306142, 样本数为 39905
    • test: 字节数为 2406485, 样本数为 10042
  • 下载大小: 6912830 字节
  • 数据集大小: 11712627 字节
  • 数据文件:
    • train: hellaswag/train-*
    • test: hellaswag/test-*

winogrande

  • 特征:
    • text: 类型为 string
    • label: 类型为 int64
  • 分割:
    • train: 字节数为 26448285, 样本数为 40398
    • test: 字节数为 825719, 样本数为 1267
  • 下载大小: 14360443 字节
  • 数据集大小: 27274004 字节
  • 数据文件:
    • train: winogrande/train-*
    • test: winogrande/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作