xDAN-datasets/Maggen-Reflection-3.1-70b-50k-filtered-scored
收藏Hugging Face2024-09-13 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/xDAN-datasets/Maggen-Reflection-3.1-70b-50k-filtered-scored
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: created
dtype: int64
- name: response
dtype: string
- name: pre_query_template
dtype: string
- name: instruction
dtype: string
- name: gen_input_configs
dtype: string
- name: gen_response_configs
dtype: string
- name: raw_instruction
dtype: string
- name: id
dtype: int64
- name: instruction_sanitize_class_num
dtype: int64
- name: scores
dtype: string
- name: model_name
dtype: string
splits:
- name: train
num_bytes: 301918940
num_examples: 36884
download_size: 52263085
dataset_size: 301918940
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
DatasetDict({
train: Dataset({
features: ['created', 'response', 'pre_query_template', 'instruction', 'gen_input_configs', 'gen_response_configs', 'raw_instruction', 'id', 'instruction_sanitize_class_num', 'scores', 'model_name'],
num_rows: 36884
})
})
每个唯一值的计数:
scores
[9.0] 9469
[7.0] 6224
[10.0] 6009
[6.0] 4003
[8.0] 3149
[5.0] 2578
[4.0] 2575
[3.0] 1566
[2.0] 1051
[1.0] 209
[] 51
数据集信息:
特征列表:
- 名称:created,数据类型:64位整数(int64)
- 名称:response,数据类型:字符串(string)
- 名称:pre_query_template,数据类型:字符串(string)
- 名称:instruction,数据类型:字符串(string)
- 名称:gen_input_configs,数据类型:字符串(string)
- 名称:gen_response_configs,数据类型:字符串(string)
- 名称:raw_instruction,数据类型:字符串(string)
- 名称:id,数据类型:64位整数(int64)
- 名称:instruction_sanitize_class_num,数据类型:64位整数(int64)
- 名称:scores,数据类型:字符串(string)
- 名称:model_name,数据类型:字符串(string)
数据集划分:
- 划分名称:train(训练集),字节大小:301918940,样本量:36884
下载大小:52263085,数据集总大小:301918940
配置项:
- 配置名称:default(默认配置),数据文件:
- 对应划分:train(训练集),文件路径:data/train-*
数据集字典(DatasetDict):
训练集:数据集对象(Dataset),包含特征:['创建时间', '模型回复', '前置查询模板', '指令', '生成输入配置', '生成回复配置', '原始指令', '标识符ID', '指令标准化类别数', '评分', '模型名称'],总样本行数为36884
各评分唯一值计数统计:
[9.0]:9469条
[7.0]:6224条
[10.0]:6009条
[6.0]:4003条
[8.0]:3149条
[5.0]:2578条
[4.0]:2575条
[3.0]:1566条
[2.0]:1051条
[1.0]:209条
无评分:51条
提供机构:
xDAN-datasets



