five

xDAN-datasets/Maggen-Reflection-3.1-70b-50k-filtered-scored

收藏
Hugging Face2024-09-13 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/xDAN-datasets/Maggen-Reflection-3.1-70b-50k-filtered-scored
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: created dtype: int64 - name: response dtype: string - name: pre_query_template dtype: string - name: instruction dtype: string - name: gen_input_configs dtype: string - name: gen_response_configs dtype: string - name: raw_instruction dtype: string - name: id dtype: int64 - name: instruction_sanitize_class_num dtype: int64 - name: scores dtype: string - name: model_name dtype: string splits: - name: train num_bytes: 301918940 num_examples: 36884 download_size: 52263085 dataset_size: 301918940 configs: - config_name: default data_files: - split: train path: data/train-* --- DatasetDict({ train: Dataset({ features: ['created', 'response', 'pre_query_template', 'instruction', 'gen_input_configs', 'gen_response_configs', 'raw_instruction', 'id', 'instruction_sanitize_class_num', 'scores', 'model_name'], num_rows: 36884 }) }) 每个唯一值的计数: scores [9.0] 9469 [7.0] 6224 [10.0] 6009 [6.0] 4003 [8.0] 3149 [5.0] 2578 [4.0] 2575 [3.0] 1566 [2.0] 1051 [1.0] 209 [] 51

数据集信息: 特征列表: - 名称:created,数据类型:64位整数(int64) - 名称:response,数据类型:字符串(string) - 名称:pre_query_template,数据类型:字符串(string) - 名称:instruction,数据类型:字符串(string) - 名称:gen_input_configs,数据类型:字符串(string) - 名称:gen_response_configs,数据类型:字符串(string) - 名称:raw_instruction,数据类型:字符串(string) - 名称:id,数据类型:64位整数(int64) - 名称:instruction_sanitize_class_num,数据类型:64位整数(int64) - 名称:scores,数据类型:字符串(string) - 名称:model_name,数据类型:字符串(string) 数据集划分: - 划分名称:train(训练集),字节大小:301918940,样本量:36884 下载大小:52263085,数据集总大小:301918940 配置项: - 配置名称:default(默认配置),数据文件: - 对应划分:train(训练集),文件路径:data/train-* 数据集字典(DatasetDict): 训练集:数据集对象(Dataset),包含特征:['创建时间', '模型回复', '前置查询模板', '指令', '生成输入配置', '生成回复配置', '原始指令', '标识符ID', '指令标准化类别数', '评分', '模型名称'],总样本行数为36884 各评分唯一值计数统计: [9.0]:9469条 [7.0]:6224条 [10.0]:6009条 [6.0]:4003条 [8.0]:3149条 [5.0]:2578条 [4.0]:2575条 [3.0]:1566条 [2.0]:1051条 [1.0]:209条 无评分:51条
提供机构:
xDAN-datasets
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作