kunishou/ApolloCorpus-ja
收藏Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/kunishou/ApolloCorpus-ja
下载链接
链接失效反馈官方服务:
资源简介:
ApolloCorpus-ja是一个多语言医疗数据集,包含525k的指令调优数据,是通过自动翻译将ApolloCorpus数据集翻译成日语得到的。ApolloCorpus是一个开源数据集,仅包含经过筛选的高质量数据。目前,翻译的对象文件是medicalPaper_en_qa.json,由于翻译质量的问题,目前只翻译了英语数据集。用户在使用该数据集时要注意翻译错误,特别是在医疗领域的LLM应用中。
ApolloCorpus-ja是一个多语言医疗数据集,包含525k的指令调优数据,是通过自动翻译将ApolloCorpus数据集翻译成日语得到的。ApolloCorpus是一个开源数据集,仅包含经过筛选的高质量数据。目前,翻译的对象文件是medicalPaper_en_qa.json,由于翻译质量的问题,目前只翻译了英语数据集。用户在使用该数据集时要注意翻译错误,特别是在医疗领域的LLM应用中。
提供机构:
kunishou
原始信息汇总
ApolloCorpus-ja 数据集概述
数据集描述
- 名称: ApolloCorpus-ja
- 类型: 自动翻译的医疗指令调优数据集
- 规模: 525k 数据量
- 原始数据来源: ApolloCorpus
- 语言: 日本語(源自英语数据集的自动翻译)
- 内容: 仅包含一个文件
medicalPaper_en_qa.json
使用注意事项
- 由于是自动翻译的多语言数据集,可能包含翻译错误。
- 在医疗领域使用LLM时,需谨慎使用。



