Asap7772/persona_gpt4_paired_filtered
收藏Hugging Face2024-03-22 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Asap7772/persona_gpt4_paired_filtered
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: x
dtype: string
- name: yw
dtype: string
- name: yl
dtype: string
- name: scorew
dtype: int64
- name: scorel
dtype: int64
- name: genw
dtype: string
- name: genl
dtype: string
- name: scorer
dtype: string
- name: scorer_id
dtype: int64
- name: scorerw_id
dtype: int64
- name: scorerl_id
dtype: int64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 334725349
num_examples: 103517
- name: test
num_bytes: 37179654
num_examples: 11501
- name: test_questions
num_bytes: 43453069
num_examples: 13615
download_size: 109473351
dataset_size: 415358072
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: test_questions
path: data/test_questions-*
---
数据集详情:
特征列表:
- 特征名:x,数据类型:字符串
- 特征名:yw,数据类型:字符串
- 特征名:yl,数据类型:字符串
- 特征名:scorew,数据类型:64位整数
- 特征名:scorel,数据类型:64位整数
- 特征名:genw,数据类型:字符串
- 特征名:genl,数据类型:字符串
- 特征名:scorer,数据类型:字符串
- 特征名:scorer_id,数据类型:64位整数
- 特征名:scorerw_id,数据类型:64位整数
- 特征名:scorerl_id,数据类型:64位整数
- 特征名:__index_level_0__,数据类型:64位整数
数据集拆分:
- 拆分名:train(训练集),占用字节数:334725349,样本总数:103517
- 拆分名:test(测试集),占用字节数:37179654,样本总数:11501
- 拆分名:test_questions(测试问题集),占用字节数:43453069,样本总数:13615
下载总大小:109473351
数据集总占用大小:415358072
数据集配置:
- 配置名称:default(默认配置),数据文件:
- 对应拆分:train,路径:data/train-*
- 对应拆分:test,路径:data/test-*
- 对应拆分:test_questions,路径:data/test_questions-*
提供机构:
Asap7772
原始信息汇总
数据集概述
数据集特征
- x: 数据类型为字符串
- yw: 数据类型为字符串
- yl: 数据类型为字符串
- scorew: 数据类型为整数
- scorel: 数据类型为整数
- genw: 数据类型为字符串
- genl: 数据类型为字符串
- scorer: 数据类型为字符串
- scorer_id: 数据类型为整数
- scorerw_id: 数据类型为整数
- scorerl_id: 数据类型为整数
- index_level_0: 数据类型为整数
数据集分割
-
train:
- 数据量: 334725349 字节
- 样本数: 103517
-
test:
- 数据量: 37179654 字节
- 样本数: 11501
-
test_questions:
- 数据量: 43453069 字节
- 样本数: 13615
数据集大小
- 下载大小: 109473351 字节
- 数据集总大小: 415358072 字节
数据文件配置
- default 配置:
- train: 文件路径为
data/train-* - test: 文件路径为
data/test-* - test_questions: 文件路径为
data/test_questions-*
- train: 文件路径为



