HachiML/self-rewarding_instruct

Name: HachiML/self-rewarding_instruct
Creator: HachiML
Published: 2024-05-28 05:13:47
License: 暂无描述

Hugging Face2024-05-28 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/HachiML/self-rewarding_instruct

下载链接

链接失效反馈

官方服务：

资源简介：

self-rewarding_instruct数据集是一个合成数据集，使用Stanford Alpaca的方法，以kunishou/oasst1-89k-ja作为种子任务，通过mistralai/Mixtral-8x22B-Instruct-v0.1模型生成。数据集主要用于self-rewarding和Instruction Tuning，包含instruction_id、instruction、input和output_example等特征。数据集分为AIFT_M1、AIFT_M2和AIFT_M3三个部分，分别包含4000、7000和7111个例子。数据集的语言为日语，遵循Apache 2.0许可证。

提供机构：

HachiML

原始信息汇总

数据集概述

基本信息

语言: 日语
许可证: Apache 2.0
任务类别: 文本生成

数据集特征

特征名称: instruction_id, instruction, input, output_example
数据类型: 均为字符串类型

数据集拆分

拆分名称: AIFT_M1, AIFT_M2, AIFT_M3
示例数量:
- AIFT_M1: 4000
- AIFT_M2: 7000
- AIFT_M3: 7111
字节大小:
- AIFT_M1: 2732892
- AIFT_M2: 4896939
- AIFT_M3: 5063803

数据集大小

下载大小: 6738032
数据集总大小: 12693634

配置信息

配置名称: default
数据文件路径:
- AIFT_M1: data/AIFT_M1-*
- AIFT_M2: data/AIFT_M2-*
- AIFT_M3: data/AIFT_M3-*