five

kunishou/ApolloCorpus-ja

收藏
Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/kunishou/ApolloCorpus-ja
下载链接
链接失效反馈
官方服务:
资源简介:
ApolloCorpus-ja是一个多语言医疗数据集,包含525k的指令调优数据,是通过自动翻译将ApolloCorpus数据集翻译成日语得到的。ApolloCorpus是一个开源数据集,仅包含经过筛选的高质量数据。目前,翻译的对象文件是medicalPaper_en_qa.json,由于翻译质量的问题,目前只翻译了英语数据集。用户在使用该数据集时要注意翻译错误,特别是在医疗领域的LLM应用中。

ApolloCorpus-ja是一个多语言医疗数据集,包含525k的指令调优数据,是通过自动翻译将ApolloCorpus数据集翻译成日语得到的。ApolloCorpus是一个开源数据集,仅包含经过筛选的高质量数据。目前,翻译的对象文件是medicalPaper_en_qa.json,由于翻译质量的问题,目前只翻译了英语数据集。用户在使用该数据集时要注意翻译错误,特别是在医疗领域的LLM应用中。
提供机构:
kunishou
原始信息汇总

ApolloCorpus-ja 数据集概述

数据集描述

  • 名称: ApolloCorpus-ja
  • 类型: 自动翻译的医疗指令调优数据集
  • 规模: 525k 数据量
  • 原始数据来源: ApolloCorpus
  • 语言: 日本語(源自英语数据集的自动翻译)
  • 内容: 仅包含一个文件 medicalPaper_en_qa.json

使用注意事项

  • 由于是自动翻译的多语言数据集,可能包含翻译错误。
  • 在医疗领域使用LLM时,需谨慎使用。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作