nafisehNik/girt-instruct
收藏Hugging Face2024-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nafisehNik/girt-instruct
下载链接
链接失效反馈官方服务:
资源简介:
GIRT-Instruct数据集是一个包含指令和对应输出对的数据集,基于GIRT-Data和Zephyr-7B-Beta语言模型生成。数据集包含四种类型:default、default+mask、default+summary和default+summary+mask,每种类型在指令中包含的元数据和信息掩码方式不同。该数据集用于训练GIRT-Model模型。
GIRT-Instruct数据集是一个包含指令和对应输出对的数据集,基于GIRT-Data和Zephyr-7B-Beta语言模型生成。数据集包含四种类型:default、default+mask、default+summary和default+summary+mask,每种类型在指令中包含的元数据和信息掩码方式不同。该数据集用于训练GIRT-Model模型。
提供机构:
nafisehNik
原始信息汇总
GIRT-Instruct 数据集
概述
GIRT-Instruct 是一个由指令和相应输出组成的数据集,基于 GIRT-Data 构建。该数据集利用 GIRT-Data 元数据和 Zephyr-7B-Beta 语言模型生成指令。
类型
GIRT-Instruct 包含四种不同类型:
- default: 包含带有 GIRT-Data 元数据的指令。
- default+mask: 包含带有 GIRT-Data 元数据的指令,其中每个指令中的两个信息字段随机掩码。
- default+summary: 包含带有 GIRT-Data 元数据和摘要字段的指令。
- default+summary+mask: 包含带有 GIRT-Data 元数据和摘要字段的指令,其中每个指令中的两个信息字段随机掩码。
使用方法
python from datasets import load_dataset dataset = load_dataset(nafisehNik/GIRT-Instruct, split=train) print(dataset[train][0]) # 训练集的第一行
引用
@article{nikeghbal2024girt, title={GIRT-Model: Automated Generation of Issue Report Templates}, author={Nikeghbal, Nafiseh and Kargaran, Amir Hossein and Heydarnoori, Abbas}, journal={arXiv preprint arXiv:2402.02632}, year={2024} }



