five

Asap7772/persona_gpt4_paired_margin1_tuplesplit

收藏
Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Asap7772/persona_gpt4_paired_margin1_tuplesplit
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: x dtype: string - name: yw dtype: string - name: yl dtype: string - name: scorew dtype: int64 - name: scorel dtype: int64 - name: genw dtype: string - name: genl dtype: string - name: scorer dtype: string - name: scorer_id dtype: int64 - name: scorerw_id dtype: int64 - name: scorerl_id dtype: int64 - name: __index_level_0__ dtype: int64 splits: - name: train num_bytes: 1865865944.6597834 num_examples: 574758 - name: test num_bytes: 466468109.3402167 num_examples: 143690 - name: test_1 num_bytes: 27466145 num_examples: 8485 - name: test_5 num_bytes: 25665099 num_examples: 8069 - name: test_4 num_bytes: 28943967 num_examples: 8928 - name: test_11 num_bytes: 26453550 num_examples: 8182 - name: test_12 num_bytes: 26308374 num_examples: 8162 - name: test_0 num_bytes: 30076907 num_examples: 8767 - name: test_13 num_bytes: 27453106 num_examples: 8258 - name: test_6 num_bytes: 28209781 num_examples: 8805 - name: test_7 num_bytes: 26481766 num_examples: 8300 - name: test_3 num_bytes: 26443874 num_examples: 8346 - name: test_15 num_bytes: 29134535 num_examples: 8696 - name: test_16 num_bytes: 27412742 num_examples: 8620 - name: test_9 num_bytes: 27358083 num_examples: 8639 - name: test_2 num_bytes: 26416968 num_examples: 8240 - name: test_10 num_bytes: 26492814 num_examples: 8099 - name: test_8 num_bytes: 28638098 num_examples: 8585 - name: test_14 num_bytes: 27649388 num_examples: 8509 download_size: 790513203 dataset_size: 2798939251.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: test_1 path: data/test_1-* - split: test_5 path: data/test_5-* - split: test_4 path: data/test_4-* - split: test_11 path: data/test_11-* - split: test_12 path: data/test_12-* - split: test_0 path: data/test_0-* - split: test_13 path: data/test_13-* - split: test_6 path: data/test_6-* - split: test_7 path: data/test_7-* - split: test_3 path: data/test_3-* - split: test_15 path: data/test_15-* - split: test_16 path: data/test_16-* - split: test_9 path: data/test_9-* - split: test_2 path: data/test_2-* - split: test_10 path: data/test_10-* - split: test_8 path: data/test_8-* - split: test_14 path: data/test_14-* ---
提供机构:
Asap7772
原始信息汇总

数据集概述

数据集特征

  • x: 数据类型为字符串。
  • yw: 数据类型为字符串。
  • yl: 数据类型为字符串。
  • scorew: 数据类型为整数64位。
  • scorel: 数据类型为整数64位。
  • genw: 数据类型为字符串。
  • genl: 数据类型为字符串。
  • scorer: 数据类型为字符串。
  • scorer_id: 数据类型为整数64位。
  • scorerw_id: 数据类型为整数64位。
  • scorerl_id: 数据类型为整数64位。
  • index_level_0: 数据类型为整数64位。

数据集划分

  • train: 包含574758个样本,占用空间1865865944.6597834字节。
  • test: 包含143690个样本,占用空间466468109.3402167字节。
  • test_1: 包含8485个样本,占用空间27466145字节。
  • test_5: 包含8069个样本,占用空间25665099字节。
  • test_4: 包含8928个样本,占用空间28943967字节。
  • test_11: 包含8182个样本,占用空间26453550字节。
  • test_12: 包含8162个样本,占用空间26308374字节。
  • test_0: 包含8767个样本,占用空间30076907字节。
  • test_13: 包含8258个样本,占用空间27453106字节。
  • test_6: 包含8805个样本,占用空间28209781字节。
  • test_7: 包含8300个样本,占用空间26481766字节。
  • test_3: 包含8346个样本,占用空间26443874字节。
  • test_15: 包含8696个样本,占用空间29134535字节。
  • test_16: 包含8620个样本,占用空间27412742字节。
  • test_9: 包含8639个样本,占用空间27358083字节。
  • test_2: 包含8240个样本,占用空间26416968字节。
  • test_10: 包含8099个样本,占用空间26492814字节。
  • test_8: 包含8585个样本,占用空间28638098字节。
  • test_14: 包含8509个样本,占用空间27649388字节。

数据集大小

  • 下载大小: 790513203字节。
  • 数据集大小: 2798939251.0字节。

数据文件配置

  • config_name: default
  • data_files: 针对每个划分(train, test, test_1, ..., test_14),指定了相应的文件路径模式,如data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作