five

Aadarssshhh/flan

收藏
Hugging Face2024-06-10 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Aadarssshhh/flan
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个处理过的Flan V2数据集版本,目的是使文件更易于访问。数据集包含Flan 2021、P3、Super-Natural Instructions、Chain-of-thought和Dialog等数据实例。数据字段包括Few Shot、Zero Shot、Options Provided in context和No Options Provided等格式。每个任务和格式的组合都保存为JSONL文件,包含输入、目标和任务字段。所有数据都保存为训练集。

这是一个处理过的Flan V2数据集版本,目的是使文件更易于访问。数据集包含Flan 2021、P3、Super-Natural Instructions、Chain-of-thought和Dialog等数据实例。数据字段包括Few Shot、Zero Shot、Options Provided in context和No Options Provided等格式。每个任务和格式的组合都保存为JSONL文件,包含输入、目标和任务字段。所有数据都保存为训练集。
提供机构:
Aadarssshhh
原始信息汇总

Flan V2 数据集概述

数据集描述

Flan V2 数据集是 Flan Collection 的一个处理版本,旨在提供更易于访问的格式。数据集的创建者推荐在下游任务中实验不同的任务混合比例以获得最佳结果。

数据来源

  • 主页: [https://ai.googleblog.com/2023/02/the-flan-collection-advancing-open.html]
  • 仓库: [https://github.com/google-research/FLAN/tree/main/flan/v2]
  • 论文: [https://arxiv.org/abs/2301/13688]

数据集结构

数据实例

数据集包含以下任务类型:

  • Flan 2021 (flan)
  • P3 (t0)
  • Super-Natural Instructions (niv2)
  • Chain-of-thought (cot)
  • Dialog (dialog)

数据字段

指令数据包含以下格式:

  • Few Shot (fs)
  • Zero Shot (zs)
  • 上下文中提供选项(例如多项选择)(opt)
  • 未提供选项 (noopt)

每个任务和格式的组合都保存为一个 JSONL 文件,遵循以下模式: json {"input": ..., "target": ..., "task": ...}

数据分割

所有数据都保存为训练集。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作