QEU/QEU-initialize-300-ja
收藏Hugging Face2023-10-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/QEU/QEU-initialize-300-ja
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于LLM(大型语言模型)的fine-tuning,特别是针对非日语优化的LLM,使其能够更好地处理日语。数据集包含约300条记录,主要用于初始化阶段。使用该数据集时,建议与其他两个数据集(databrick-15k-ja的分割部分和用户自备的日语数据集)一起进行序列化学习。
提供机构:
QEU
原始信息汇总
数据集概述
目的
该数据集旨在用于LLM(大型语言模型)的fine-tuning过程中的初始化阶段,以使非日语优化的LLM能够熟练使用日语。
数据规模
数据集包含约300条记录。
使用方法
- 初始化阶段:
- 使用本数据集进行初始化,约10个epoch。
- 后续阶段:
- 使用作者分割的databrick-15k-ja数据集的一部分,约10个epoch。
- 使用用户准备的日语数据集,直至达到满意的学习效果。
注意事项
- 该数据集仅供作者个人测试使用,使用时请自行负责。
- 该数据集旨在替代10个epoch的初始化过程。



