five

nafisehNik/girt-instruct

收藏
Hugging Face2024-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nafisehNik/girt-instruct
下载链接
链接失效反馈
官方服务:
资源简介:
GIRT-Instruct数据集是一个包含指令和对应输出对的数据集,基于GIRT-Data和Zephyr-7B-Beta语言模型生成。数据集包含四种类型:default、default+mask、default+summary和default+summary+mask,每种类型在指令中包含的元数据和信息掩码方式不同。该数据集用于训练GIRT-Model模型。

GIRT-Instruct数据集是一个包含指令和对应输出对的数据集,基于GIRT-Data和Zephyr-7B-Beta语言模型生成。数据集包含四种类型:default、default+mask、default+summary和default+summary+mask,每种类型在指令中包含的元数据和信息掩码方式不同。该数据集用于训练GIRT-Model模型。
提供机构:
nafisehNik
原始信息汇总

GIRT-Instruct 数据集

概述

GIRT-Instruct 是一个由指令和相应输出组成的数据集,基于 GIRT-Data 构建。该数据集利用 GIRT-Data 元数据和 Zephyr-7B-Beta 语言模型生成指令。

类型

GIRT-Instruct 包含四种不同类型:

  • default: 包含带有 GIRT-Data 元数据的指令。
  • default+mask: 包含带有 GIRT-Data 元数据的指令,其中每个指令中的两个信息字段随机掩码。
  • default+summary: 包含带有 GIRT-Data 元数据和摘要字段的指令。
  • default+summary+mask: 包含带有 GIRT-Data 元数据和摘要字段的指令,其中每个指令中的两个信息字段随机掩码。

使用方法

python from datasets import load_dataset dataset = load_dataset(nafisehNik/GIRT-Instruct, split=train) print(dataset[train][0]) # 训练集的第一行

引用

@article{nikeghbal2024girt, title={GIRT-Model: Automated Generation of Issue Report Templates}, author={Nikeghbal, Nafiseh and Kargaran, Amir Hossein and Heydarnoori, Abbas}, journal={arXiv preprint arXiv:2402.02632}, year={2024} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作