Iker/InstructTranslation-EN-ES-Raw
收藏Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/Iker/InstructTranslation-EN-ES-Raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自teknium/OpenHermes-2.5的提示和答案,使用GPT-4-0125-preview翻译成西班牙语。数据集旨在用于训练模型将指令从英语翻译成西班牙语。数据集包含一个conversation字段,其中包含英语指令/答案,以及translation字段,其中包含翻译后的文本。example_no和conversation_no对应于OpenHermes-2.5中的原始示例ID和对话编号。提示标记为human,答案标记为gpt。
该数据集包含来自teknium/OpenHermes-2.5的提示和答案,使用GPT-4-0125-preview翻译成西班牙语。数据集旨在用于训练模型将指令从英语翻译成西班牙语。数据集包含一个conversation字段,其中包含英语指令/答案,以及translation字段,其中包含翻译后的文本。example_no和conversation_no对应于OpenHermes-2.5中的原始示例ID和对话编号。提示标记为human,答案标记为gpt。
提供机构:
Iker
原始信息汇总
数据集概述
基本信息
- 语言: 英语和西班牙语
- 许可证: Apache 2.0
- 数据规模: 1K<n<10K
- 任务类别: 翻译、文本生成、文本到文本生成
数据集详情
- 特征:
example_no: 示例编号,数据类型为int64conversation_no: 对话编号,数据类型为int64from: 来源,数据类型为stringconversation: 对话内容,数据类型为stringtranslation: 翻译内容,数据类型为string
- 分割:
train: 训练集,包含1459个示例,总字节数为1942006
- 下载大小: 1038931字节
- 数据集大小: 1942006字节
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集描述
该数据集包含从teknium/OpenHermes-2.5翻译成西班牙语的提示和答案,使用GPT-4-0125-preview进行翻译。数据集旨在用于训练模型将英语指令翻译成西班牙语。数据集包含英语指令/答案的conversation字段和翻译文本的translation字段。example_no和conversation_no对应OpenHermes-2.5中的原始示例ID和对话编号。提示标记为human,答案标记为gpt。



