five

Reza8848/MUFFIN_68k

收藏
Hugging Face2024-03-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Reza8848/MUFFIN_68k
下载链接
链接失效反馈
官方服务:
资源简介:
这是MUFFIN(多面指令)的训练数据集,包含1,463个输入文本,每个输入文本平均有约46.48个指令,总共有68,014个训练实例。每个输入文本都包含多个任务指令及其对应的输出,数据格式为JSON,每个元素都是一个Python字典。

The MUFFIN dataset is a multi-faceted instruction set for training, containing 1,463 input texts, each equipped with multiple task instructions, averaging 46.48 instructions per input text, totaling 68,014 training instances. The dataset is provided in JSON format, with each element being a Python dictionary containing the input text and its corresponding task instructions and outputs.
提供机构:
Reza8848
原始信息汇总

数据集概述

数据格式

数据集以JSON格式提供,可以读取为Python列表。每个元素是一个包含输入文本的Python字典,该输入文本包含多个任务指令及其对应的输出。

示例格式如下: json [ { "input": "XXX", "instances": [ { "instruction": "III", "output": "YYY" }, { "instruction": "III", "output": "YYY" } ] }, { "input": "XXX", "instances": [ { "instruction": "III", "output": "YYY" } ] } ]

数据统计

数据集包含1,463个输入文本,每个输入文本平均包含约46.48个任务指令,总计68,014个训练实例。

引用

如果使用该数据集,请引用以下论文: bibtex @inproceedings{Lou2023MUFFIN, title={{MUFFIN}: Curating Multi-Faceted Instructions for Improving Instruction Following}, author={Renze Lou and Kai Zhang and Jian Xie and Yuxuan Sun and Janice Ahn and Hanzi Xu and Yu su and Wenpeng Yin}, booktitle={The Twelfth International Conference on Learning Representations}, year={2024}, url={https://openreview.net/forum?id=1vrS1zwekw} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作