five

Iker/InstructTranslation-EN-ES-Raw

收藏
Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/Iker/InstructTranslation-EN-ES-Raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自teknium/OpenHermes-2.5的提示和答案,使用GPT-4-0125-preview翻译成西班牙语。数据集旨在用于训练模型将指令从英语翻译成西班牙语。数据集包含一个conversation字段,其中包含英语指令/答案,以及translation字段,其中包含翻译后的文本。example_no和conversation_no对应于OpenHermes-2.5中的原始示例ID和对话编号。提示标记为human,答案标记为gpt。

该数据集包含来自teknium/OpenHermes-2.5的提示和答案,使用GPT-4-0125-preview翻译成西班牙语。数据集旨在用于训练模型将指令从英语翻译成西班牙语。数据集包含一个conversation字段,其中包含英语指令/答案,以及translation字段,其中包含翻译后的文本。example_no和conversation_no对应于OpenHermes-2.5中的原始示例ID和对话编号。提示标记为human,答案标记为gpt。
提供机构:
Iker
原始信息汇总

数据集概述

基本信息

  • 语言: 英语和西班牙语
  • 许可证: Apache 2.0
  • 数据规模: 1K<n<10K
  • 任务类别: 翻译、文本生成、文本到文本生成

数据集详情

  • 特征:
    • example_no: 示例编号,数据类型为int64
    • conversation_no: 对话编号,数据类型为int64
    • from: 来源,数据类型为string
    • conversation: 对话内容,数据类型为string
    • translation: 翻译内容,数据类型为string
  • 分割:
    • train: 训练集,包含1459个示例,总字节数为1942006
  • 下载大小: 1038931字节
  • 数据集大小: 1942006字节

配置

  • 默认配置:
    • 数据文件路径: data/train-*

数据集描述

该数据集包含从teknium/OpenHermes-2.5翻译成西班牙语的提示和答案,使用GPT-4-0125-preview进行翻译。数据集旨在用于训练模型将英语指令翻译成西班牙语。数据集包含英语指令/答案的conversation字段和翻译文本的translation字段。example_noconversation_no对应OpenHermes-2.5中的原始示例ID和对话编号。提示标记为human,答案标记为gpt

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作