Asap7772/persona_gpt4_paired_margin1_tuplesplit
收藏Hugging Face2024-04-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Asap7772/persona_gpt4_paired_margin1_tuplesplit
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: x
dtype: string
- name: yw
dtype: string
- name: yl
dtype: string
- name: scorew
dtype: int64
- name: scorel
dtype: int64
- name: genw
dtype: string
- name: genl
dtype: string
- name: scorer
dtype: string
- name: scorer_id
dtype: int64
- name: scorerw_id
dtype: int64
- name: scorerl_id
dtype: int64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 1865865944.6597834
num_examples: 574758
- name: test
num_bytes: 466468109.3402167
num_examples: 143690
- name: test_1
num_bytes: 27466145
num_examples: 8485
- name: test_5
num_bytes: 25665099
num_examples: 8069
- name: test_4
num_bytes: 28943967
num_examples: 8928
- name: test_11
num_bytes: 26453550
num_examples: 8182
- name: test_12
num_bytes: 26308374
num_examples: 8162
- name: test_0
num_bytes: 30076907
num_examples: 8767
- name: test_13
num_bytes: 27453106
num_examples: 8258
- name: test_6
num_bytes: 28209781
num_examples: 8805
- name: test_7
num_bytes: 26481766
num_examples: 8300
- name: test_3
num_bytes: 26443874
num_examples: 8346
- name: test_15
num_bytes: 29134535
num_examples: 8696
- name: test_16
num_bytes: 27412742
num_examples: 8620
- name: test_9
num_bytes: 27358083
num_examples: 8639
- name: test_2
num_bytes: 26416968
num_examples: 8240
- name: test_10
num_bytes: 26492814
num_examples: 8099
- name: test_8
num_bytes: 28638098
num_examples: 8585
- name: test_14
num_bytes: 27649388
num_examples: 8509
download_size: 790513203
dataset_size: 2798939251.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: test_1
path: data/test_1-*
- split: test_5
path: data/test_5-*
- split: test_4
path: data/test_4-*
- split: test_11
path: data/test_11-*
- split: test_12
path: data/test_12-*
- split: test_0
path: data/test_0-*
- split: test_13
path: data/test_13-*
- split: test_6
path: data/test_6-*
- split: test_7
path: data/test_7-*
- split: test_3
path: data/test_3-*
- split: test_15
path: data/test_15-*
- split: test_16
path: data/test_16-*
- split: test_9
path: data/test_9-*
- split: test_2
path: data/test_2-*
- split: test_10
path: data/test_10-*
- split: test_8
path: data/test_8-*
- split: test_14
path: data/test_14-*
---
提供机构:
Asap7772
原始信息汇总
数据集概述
数据集特征
- x: 数据类型为字符串。
- yw: 数据类型为字符串。
- yl: 数据类型为字符串。
- scorew: 数据类型为整数64位。
- scorel: 数据类型为整数64位。
- genw: 数据类型为字符串。
- genl: 数据类型为字符串。
- scorer: 数据类型为字符串。
- scorer_id: 数据类型为整数64位。
- scorerw_id: 数据类型为整数64位。
- scorerl_id: 数据类型为整数64位。
- index_level_0: 数据类型为整数64位。
数据集划分
- train: 包含574758个样本,占用空间1865865944.6597834字节。
- test: 包含143690个样本,占用空间466468109.3402167字节。
- test_1: 包含8485个样本,占用空间27466145字节。
- test_5: 包含8069个样本,占用空间25665099字节。
- test_4: 包含8928个样本,占用空间28943967字节。
- test_11: 包含8182个样本,占用空间26453550字节。
- test_12: 包含8162个样本,占用空间26308374字节。
- test_0: 包含8767个样本,占用空间30076907字节。
- test_13: 包含8258个样本,占用空间27453106字节。
- test_6: 包含8805个样本,占用空间28209781字节。
- test_7: 包含8300个样本,占用空间26481766字节。
- test_3: 包含8346个样本,占用空间26443874字节。
- test_15: 包含8696个样本,占用空间29134535字节。
- test_16: 包含8620个样本,占用空间27412742字节。
- test_9: 包含8639个样本,占用空间27358083字节。
- test_2: 包含8240个样本,占用空间26416968字节。
- test_10: 包含8099个样本,占用空间26492814字节。
- test_8: 包含8585个样本,占用空间28638098字节。
- test_14: 包含8509个样本,占用空间27649388字节。
数据集大小
- 下载大小: 790513203字节。
- 数据集大小: 2798939251.0字节。
数据文件配置
- config_name: default
- data_files: 针对每个划分(train, test, test_1, ..., test_14),指定了相应的文件路径模式,如
data/train-*。



