five

VMware/open-instruct-v1-oasst-dolly-hhrlhf

收藏
Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VMware/open-instruct-v1-oasst-dolly-hhrlhf
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是OpenAssistant/oasst1的过滤子集和Mosaic-dolly-hhrlhf的训练分割的组合。数据集包含三列:instruction(自然语言指令,不含任何提示模板)、alpaca_prompt(指令的Alpaca提示模板版本)和response(对指令的响应)。数据集可用于商业目的,但需遵循许可条款。
提供机构:
VMware
原始信息汇总

数据集卡片 "open-instruct-v1-oasst-dolly-hhrlhf"

数据集概述

该数据集是以下几个数据集的组合:

  1. OpenAssistant/oasst1 的筛选子集
  2. Mosaic-dolly-hhrlhf 的训练集(包含 Databricks dolly-15k 数据集和 Anthropics HH-RLHF 的筛选子集)

数据集结构

数据集包含以下三列:

  1. instruction: 自然语言指令,不包含任何提示模板(从 Mosaic-dolly-hhrlhf 的 alpaca 格式中提取)
  2. alpaca_prompt: 指令的 Alpaca 提示模板版本
  3. response: 对指令的响应

数据集信息

  • 特征:
    • name: Unnamed: 0 dtype: int64
    • name: alpaca_prompt dtype: string
    • name: response dtype: string
    • name: instruction dtype: string
  • 分割:
    • name: train num_bytes: 60252132 num_examples: 62971
  • 下载大小: 33232110
  • 数据集大小: 60252132

许可证

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作