shi3z/ja_conv_wikipedia_llama2pro8b_20k
收藏Hugging Face2024-01-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shi3z/ja_conv_wikipedia_llama2pro8b_20k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于日语版Wikipedia数据集,并使用llama2Pro8B模型转换为多轮对话格式。由于使用的是llama2许可证,该数据集可以用于商业服务。由于未经过人工筛选,可能包含一些奇怪的对话。数据集是在A100 80GBx7机器上生成,共生成了60,000个对话,耗时18天,并进行了自动筛选。
该数据集基于日语版Wikipedia数据集,并使用llama2Pro8B模型转换为多轮对话格式。由于使用的是llama2许可证,该数据集可以用于商业服务。由于未经过人工筛选,可能包含一些奇怪的对话。数据集是在A100 80GBx7机器上生成,共生成了60,000个对话,耗时18天,并进行了自动筛选。
提供机构:
shi3z
原始信息汇总
数据集概述
许可证
- 许可证类型:llama2
任务类别
- 对话型
语言
- 日语
数据规模
- 10K<n<100K
数据来源与处理
- 数据集基于日文版Wikipedia数据集,通过llama2Pro8B转换为多轮对话格式。
- 数据集包含60,000个对话,生成过程耗时18天,使用A100 80GBx7机器进行自动筛选。
注意事项
- 数据集可能包含未经人工筛选的异常对话。



