five

Asap7772/persona_gpt4_paired_margin1_tuplesplit_filtered

收藏
Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Asap7772/persona_gpt4_paired_margin1_tuplesplit_filtered
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: x dtype: string - name: yw dtype: string - name: yl dtype: string - name: scorew dtype: int64 - name: scorel dtype: int64 - name: genw dtype: string - name: genl dtype: string - name: scorer dtype: string - name: scorer_id dtype: int64 - name: scorerw_id dtype: int64 - name: scorerl_id dtype: int64 - name: __index_level_0__ dtype: int64 splits: - name: train num_bytes: 745859160.6778679 num_examples: 229770 - name: test num_bytes: 426426297.26807016 num_examples: 131317 - name: test_1 num_bytes: 27466145 num_examples: 8485 - name: test_5 num_bytes: 25665099 num_examples: 8069 - name: test_4 num_bytes: 28943967 num_examples: 8928 - name: test_11 num_bytes: 26453550 num_examples: 8182 - name: test_12 num_bytes: 26308374 num_examples: 8162 - name: test_0 num_bytes: 30076907 num_examples: 8767 - name: test_13 num_bytes: 27453106 num_examples: 8258 - name: test_6 num_bytes: 28209781 num_examples: 8805 - name: test_7 num_bytes: 26481766 num_examples: 8300 - name: test_3 num_bytes: 26443874 num_examples: 8346 - name: test_15 num_bytes: 29134535 num_examples: 8696 - name: test_16 num_bytes: 27412742 num_examples: 8620 - name: test_9 num_bytes: 27358083 num_examples: 8639 - name: test_2 num_bytes: 26416968 num_examples: 8240 - name: test_10 num_bytes: 26492814 num_examples: 8099 - name: test_8 num_bytes: 28638098 num_examples: 8585 - name: test_14 num_bytes: 27649388 num_examples: 8509 download_size: 461041316 dataset_size: 1638890654.945938 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: test_1 path: data/test_1-* - split: test_5 path: data/test_5-* - split: test_4 path: data/test_4-* - split: test_11 path: data/test_11-* - split: test_12 path: data/test_12-* - split: test_0 path: data/test_0-* - split: test_13 path: data/test_13-* - split: test_6 path: data/test_6-* - split: test_7 path: data/test_7-* - split: test_3 path: data/test_3-* - split: test_15 path: data/test_15-* - split: test_16 path: data/test_16-* - split: test_9 path: data/test_9-* - split: test_2 path: data/test_2-* - split: test_10 path: data/test_10-* - split: test_8 path: data/test_8-* - split: test_14 path: data/test_14-* ---
提供机构:
Asap7772
原始信息汇总

数据集特征

  • 名称: x
    • 数据类型: string
  • 名称: yw
    • 数据类型: string
  • 名称: yl
    • 数据类型: string
  • 名称: scorew
    • 数据类型: int64
  • 名称: scorel
    • 数据类型: int64
  • 名称: genw
    • 数据类型: string
  • 名称: genl
    • 数据类型: string
  • 名称: scorer
    • 数据类型: string
  • 名称: scorer_id
    • 数据类型: int64
  • 名称: scorerw_id
    • 数据类型: int64
  • 名称: scorerl_id
    • 数据类型: int64
  • 名称: index_level_0
    • 数据类型: int64

数据集分割

  • 名称: train
    • 字节数: 745859160.6778679
    • 样本数: 229770
  • 名称: test
    • 字节数: 426426297.26807016
    • 样本数: 131317
  • 名称: test_1
    • 字节数: 27466145
    • 样本数: 8485
  • 名称: test_5
    • 字节数: 25665099
    • 样本数: 8069
  • 名称: test_4
    • 字节数: 28943967
    • 样本数: 8928
  • 名称: test_11
    • 字节数: 26453550
    • 样本数: 8182
  • 名称: test_12
    • 字节数: 26308374
    • 样本数: 8162
  • 名称: test_0
    • 字节数: 30076907
    • 样本数: 8767
  • 名称: test_13
    • 字节数: 27453106
    • 样本数: 8258
  • 名称: test_6
    • 字节数: 28209781
    • 样本数: 8805
  • 名称: test_7
    • 字节数: 26481766
    • 样本数: 8300
  • 名称: test_3
    • 字节数: 26443874
    • 样本数: 8346
  • 名称: test_15
    • 字节数: 29134535
    • 样本数: 8696
  • 名称: test_16
    • 字节数: 27412742
    • 样本数: 8620
  • 名称: test_9
    • 字节数: 27358083
    • 样本数: 8639
  • 名称: test_2
    • 字节数: 26416968
    • 样本数: 8240
  • 名称: test_10
    • 字节数: 26492814
    • 样本数: 8099
  • 名称: test_8
    • 字节数: 28638098
    • 样本数: 8585
  • 名称: test_14
    • 字节数: 27649388
    • 样本数: 8509

数据集大小

  • 下载大小: 461041316
  • 数据集大小: 1638890654.945938

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
        • 路径: data/train-*
      • 分割: test
        • 路径: data/test-*
      • 分割: test_1
        • 路径: data/test_1-*
      • 分割: test_5
        • 路径: data/test_5-*
      • 分割: test_4
        • 路径: data/test_4-*
      • 分割: test_11
        • 路径: data/test_11-*
      • 分割: test_12
        • 路径: data/test_12-*
      • 分割: test_0
        • 路径: data/test_0-*
      • 分割: test_13
        • 路径: data/test_13-*
      • 分割: test_6
        • 路径: data/test_6-*
      • 分割: test_7
        • 路径: data/test_7-*
      • 分割: test_3
        • 路径: data/test_3-*
      • 分割: test_15
        • 路径: data/test_15-*
      • 分割: test_16
        • 路径: data/test_16-*
      • 分割: test_9
        • 路径: data/test_9-*
      • 分割: test_2
        • 路径: data/test_2-*
      • 分割: test_10
        • 路径: data/test_10-*
      • 分割: test_8
        • 路径: data/test_8-*
      • 分割: test_14
        • 路径: data/test_14-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作