andrewsiah/MetaLearningRewardDatabase
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/andrewsiah/MetaLearningRewardDatabase
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,主要涉及prompt、response和reward的配对数据,以及person_weight和person_id等特征。数据集的结构表明它可能用于训练模型,特别是与对话生成和奖励机制相关的任务。数据集的训练集包含10个样本,总大小为731711字节。
The dataset includes various features such as person_weight, multiple prompts (prompt_1 to prompt_45), corresponding responses (response_1 to response_45), and rewards for each response (reward_1 to reward_45). Additional attributes like length and person_id are also included. The dataset is split into a training set (train) with 10 examples, and metadata about the download and actual size of the dataset is provided.
提供机构:
andrewsiah
原始信息汇总
数据集概述
数据集特征
- person_weight: 数据类型为
float64。 - prompt_1 至 prompt_45: 数据类型为
string。 - response_1 至 response_45: 数据类型为
string。 - reward_1 至 reward_45: 数据类型为
float64。 - length: 数据类型为
float64。 - person_id: 数据类型为
int64。
数据集划分
- train:
- 数据量: 731711 字节
- 示例数量: 10
数据集大小
- 下载大小: 1099141 字节
- 数据集大小: 731711 字节



