five

Aratako/Synthetic-JP-Conversations-Magpie-Nemotron-4-10k

收藏
Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/Aratako/Synthetic-JP-Conversations-Magpie-Nemotron-4-10k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Synthetic-JP-Conversations-Magpie-Nemotron-4-10k,使用了Magpie方法,并应用于nvidia/Nemotron-4-340B-Instruct模型,生成了约10000条日语instruction tuning数据。数据集创建过程中使用了DeepInfra平台,并且相关代码已在GitHub上公开。需要注意的是,数据集未经过后处理过滤,可能包含质量较低的记录。

This dataset is created by applying the Magpie method to the nvidia/Nemotron-4-340B-Instruct model, containing approximately 10,000 records for Japanese instruction tuning. The dataset was created using the DeepInfra platform, and the related code has been made publicly available on GitHub. It is important to note that no post-filtering process was applied, so the dataset may contain records of lower quality.
提供机构:
Aratako
原始信息汇总

Synthetic-JP-Conversations-Magpie-Nemotron-4-10k

概述

  • 数据集名称: Synthetic-JP-Conversations-Magpie-Nemotron-4-10k
  • 数据集用途: 日本語instruction tuning用データセット
  • 数据集规模: 约10000件

数据集来源

数据集特性

  • 语言: 日本語
  • 任务类别: text-generation
  • 数据量: 10K<n<100K
  • 许可证: apache-2.0

注意事项

  • 数据集未经过事后的过滤处理,可能包含质量较低的记录。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作