bertin-project/oasst2_es_instruct_hf
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/bertin-project/oasst2_es_instruct_hf
下载链接
链接失效反馈官方服务:
资源简介:
这是从OpenAssistant/oasst2数据集中提取的西班牙语子集。数据集已从`2023-11-05_oasst2_ready.trees.jsonl.gz`文件中提取,并解析了所有对话树,转换为适合HuggingFace使用的格式,以便使用`apply_chat_template`功能。数据集包含16200个训练样本,文件大小为24937103字节。数据集的特征包括instruction(包含content和role两个字段)、lang和source。
这是从OpenAssistant/oasst2数据集中提取的西班牙语子集。数据集已从`2023-11-05_oasst2_ready.trees.jsonl.gz`文件中提取,并解析了所有对话树,转换为适合HuggingFace使用的格式,以便使用`apply_chat_template`功能。数据集包含16200个训练样本,文件大小为24937103字节。数据集的特征包括instruction(包含content和role两个字段)、lang和source。
提供机构:
bertin-project
原始信息汇总
数据集概述
基本信息
- 语言: 西班牙语 (es)
- 许可证: Apache 2.0
- 数据集大小: 10K<n<100K
数据集结构
特征
- instruction:
- content: 字符串类型
- role: 字符串类型
- lang: 字符串类型
- source: 字符串类型
分割
- train:
- num_bytes: 24937103
- num_examples: 16200
文件信息
- download_size: 8896739
- dataset_size: 24937103
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
标签
- human-feedback



