VMware/open-instruct-v1-oasst-dolly-hhrlhf
收藏Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VMware/open-instruct-v1-oasst-dolly-hhrlhf
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是OpenAssistant/oasst1的过滤子集和Mosaic-dolly-hhrlhf的训练分割的组合。数据集包含三列:instruction(自然语言指令,不含任何提示模板)、alpaca_prompt(指令的Alpaca提示模板版本)和response(对指令的响应)。数据集可用于商业目的,但需遵循许可条款。
提供机构:
VMware
原始信息汇总
数据集卡片 "open-instruct-v1-oasst-dolly-hhrlhf"
数据集概述
该数据集是以下几个数据集的组合:
- OpenAssistant/oasst1 的筛选子集
- Mosaic-dolly-hhrlhf 的训练集(包含 Databricks dolly-15k 数据集和 Anthropics HH-RLHF 的筛选子集)
数据集结构
数据集包含以下三列:
- instruction: 自然语言指令,不包含任何提示模板(从 Mosaic-dolly-hhrlhf 的 alpaca 格式中提取)
- alpaca_prompt: 指令的 Alpaca 提示模板版本
- response: 对指令的响应
数据集信息
- 特征:
- name: Unnamed: 0 dtype: int64
- name: alpaca_prompt dtype: string
- name: response dtype: string
- name: instruction dtype: string
- 分割:
- name: train num_bytes: 60252132 num_examples: 62971
- 下载大小: 33232110
- 数据集大小: 60252132
许可证
- 可用于商业用途,只要遵守许可证条款。
- 数据集中某些类别的材料来自以下来源,根据 CC BY-SA 3.0 许可证授权:
- Wikipedia(多个页面)- https://www.wikipedia.org/
- Databricks - https://www.databricks.com
- Mosaic ML - https://www.mosaicml.com/
- VMware



