UCLA-AGI/data-mistral-7b-instruct-sppo-iter3
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/UCLA-AGI/data-mistral-7b-instruct-sppo-iter3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于训练模型,包含多个特征,如prompt_id、prompt、probability、rm_scores以及多个generate字段,每个generate字段包含content和role信息。数据集分为训练集,包含19996个样本。数据集的下载大小为157001213字节,实际大小为277691022字节。
该数据集主要用于训练模型,包含多个特征,如prompt_id、prompt、probability、rm_scores以及多个generate字段,每个generate字段包含content和role信息。数据集分为训练集,包含19996个样本。数据集的下载大小为157001213字节,实际大小为277691022字节。
提供机构:
UCLA-AGI
原始信息汇总
数据集概述
数据集信息
特征
- prompt_id: 字符串类型
- prompt: 字符串类型
- probability: 序列类型,包含浮点数
- rm_scores: 序列类型,包含浮点数
- generate_0: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- generate_1: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- generate_2: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- generate_3: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- generate_4: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
数据分割
- train: 包含19996个样本,占用277691022字节
数据集大小
- 下载大小: 157001213字节
- 数据集大小: 277691022字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



