five

QEU/QEU-initialize-300-ja

收藏
Hugging Face2023-10-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/QEU/QEU-initialize-300-ja
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于LLM(大型语言模型)的fine-tuning,特别是针对非日语优化的LLM,使其能够更好地处理日语。数据集包含约300条记录,主要用于初始化阶段。使用该数据集时,建议与其他两个数据集(databrick-15k-ja的分割部分和用户自备的日语数据集)一起进行序列化学习。
提供机构:
QEU
原始信息汇总

数据集概述

目的

该数据集旨在用于LLM(大型语言模型)的fine-tuning过程中的初始化阶段,以使非日语优化的LLM能够熟练使用日语。

数据规模

数据集包含约300条记录。

使用方法

  1. 初始化阶段
    • 使用本数据集进行初始化,约10个epoch。
  2. 后续阶段
    • 使用作者分割的databrick-15k-ja数据集的一部分,约10个epoch。
    • 使用用户准备的日语数据集,直至达到满意的学习效果。

注意事项

  • 该数据集仅供作者个人测试使用,使用时请自行负责。
  • 该数据集旨在替代10个epoch的初始化过程。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作