five

CATIE-AQ/fquad_fr_prompt_context_generation_with_answer_and_question

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/fquad_fr_prompt_context_generation_with_answer_and_question
下载链接
链接失效反馈
官方服务:
资源简介:
fquad_fr_prompt_context_generation_with_answer_and_question是DFP数据集的子集,包含574,056条可用于上下文生成(包含答案和问题)任务的数据。数据集原始来源为FQuAD数据集,并经过FrenchQA数据集的增强。本数据集只提供用于重建数据集的prompts,不包含实际数据。

fquad_fr_prompt_context_generation_with_answer_and_question is a subset of the DFP dataset, containing 574,056 rows of data that can be used for context generation tasks (with answers and questions). The original data comes from the FQuAD dataset and has been augmented with questions formatted according to SQUAD 2.0 from the FrenchQA dataset. This dataset only provides prompts for users to recreate the dataset themselves, without including the actual data.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

数据集名称

fquad_fr_prompt_context_generation_with_answer_and_question

数据集来源

该数据集是Dataset of French Prompts (DFP)的一个子集。

数据集大小

包含574,056行数据。

数据集用途

适用于上下文生成(包含答案和问题)任务。

数据集构成

  • 原始数据来源:来自dHoffschmidt等人的FQuAD数据集,并通过FrenchQA数据集中的SQUAD 2.0格式问题进行了增强。
  • 数据集格式:由于FQuAD的许可证不允许共享数据,因此仅共享了用于创建数据集的提示,用户可以自行以xP3数据集的格式重新创建数据集。

提示列表

该数据集使用了24个提示,这些提示采用直陈式语气,包括“你”和“您”两种称呼形式。

数据集分割

  • train:497,544个样本
  • valid:76,512个样本
  • 无测试集分割

许可证

CC BY-NC-SA 3.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作