RLHFlow/prompt-collection-v0.1
收藏Hugging Face2024-05-08 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/RLHFlow/prompt-collection-v0.1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了来自多个子集的提示信息,包括UltraFeedback、HelpSteer、OpenOrca Pairs、UltraInteract、DIBT 10K Prompts Ranked和Capybara Preferences等。数据集的结构包括数据集名称、上下文、上下文消息和ID等字段,并提供了训练集的划分信息,如大小和样本数量。
提供机构:
RLHFlow
原始信息汇总
数据集信息
特征
- dataset: 数据集名称,数据类型为字符串。
- context: 上下文信息,数据类型为字符串。
- context_messages: 上下文消息列表,包含以下字段:
- content: 消息内容,数据类型为字符串。
- role: 角色,数据类型为字符串。
- id: 标识符,数据类型为字符串。
数据分割
- train: 训练集,包含658972830.7925905字节的数据和179465个样本。
数据大小
- download_size: 下载大小为227400162字节。
- dataset_size: 数据集大小为658972830.7925905字节。
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



