HanxuHU/tuluv2_100k_seq
收藏Hugging Face2024-06-22 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/HanxuHU/tuluv2_100k_seq
下载链接
链接失效反馈官方服务:
资源简介:
Tuluv2-100k-Seq数据集是从Tulu-v2-sft-mixture数据集中通过Seq-Instruct方法转换而来的100k子样本。该方法来源于论文《SIT: Fine-tuning Large Language Models with Sequential Instructions》。数据集包含大量的顺序指令,每个指令中包含多个子任务。
Tuluv2-100k-Seq is a converted 100k subsample of Tulu-v2-sft-mixture using the Seq-Instruct method from the paper SIT: Fine-tuning Large Language Models with Sequential Instructions. It includes massive sequential instructions which contain more than one subtask in each instruction.
提供机构:
HanxuHU
原始信息汇总
数据集概述
数据集名称
Tuluv2-100k-Seq
数据集来源
- 原始数据集:Tulu-v2-sft-mixture
- 转换方法:Seq-Instruct
- 相关论文:SIT: Fine-tuning Large Language Models with Sequential Instructions
数据集内容
- 包含100k个子样本
- 包含大量的顺序指令,每个指令包含多个子任务
许可证
CC-BY-4.0



