five

meenham/MSC_korean

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/meenham/MSC_korean
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于英语到韩语的翻译任务,数据规模在1K到10K之间。数据来源于论文《Beyond Goldfish Memory: Long-Term Open-Domain Conversation》中的MSC数据,具体使用了第四会话的训练/验证/测试数据集。翻译工作主要使用GPT-3.5-turbo完成,其中66条数据使用了GPT-4进行翻译。

该数据集主要用于英语到韩语的翻译任务,数据规模在1K到10K之间。数据来源于论文《Beyond Goldfish Memory: Long-Term Open-Domain Conversation》中的MSC数据,具体使用了第四会话的训练/验证/测试数据集。翻译工作主要使用GPT-3.5-turbo完成,其中66条数据使用了GPT-4进行翻译。
提供机构:
meenham
原始信息汇总

数据集概述

许可证

  • Apache 2.0

任务类别

  • 翻译

语言

  • 韩语

数据规模

  • 1K<n<10K

数据详情

  • 来源
    • MSC数据来自论文《Beyond Goldfish Memory: Long-Term Open-Domain Conversation》
    • 包含session 4的训练/验证/测试数据集
  • 翻译
    • 主要使用GPT-3.5-turbo
    • 初始66条数据使用GPT-4(从session_4_train开始,之后切换到GPT-3.5)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作