dariolopez/gpt-j-oasst1-es
收藏Hugging Face2023-04-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dariolopez/gpt-j-oasst1-es
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是OpenAssistant Conversations Dataset (OASST)的一个子集,专门针对西班牙语进行了过滤。数据集按照instruction - output的模式格式化,并选择了人类排名最高的输出。此外,只选择了树形对话的第一层。数据集包含3909行数据,每行数据由指令和输出组成。
提供机构:
dariolopez
原始信息汇总
数据集概述
数据集名称
OpenAssistant Conversations Spanish Dataset (OASST1-es) for GPT-j
数据集来源
Subset of the original OpenAssistant Conversations Dataset (OASST).
数据集特征
- features:
- name: instruction
- dtype: string
- name: output
- dtype: string
- name: instruction
数据集结构
- splits:
- name: train
- num_bytes: 4445880
- num_examples: 3909
- name: train
数据集大小
- download_size: 2580076
- dataset_size: 4445880
数据集语言
- language: es
数据集类别
- size_categories: 1K<n<10K
数据集许可证
- license: apache-2.0



