five

CATIE-AQ/squad_v2_french_translated_fr_prompt_context_generation_with_question

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/squad_v2_french_translated_fr_prompt_context_generation_with_question
下载链接
链接失效反馈
官方服务:
资源简介:
squad_v2_french_translated_fr_prompt_context_generation_with_question数据集是法语提示数据集(DFP)的一个子集,包含3,795,312行数据,适用于上下文生成(带问题)任务。原始数据来自squad_v2_french_translated数据集,并通过FrenchQA数据集中的SQUAD 2.0格式问题进行了增强。应用了24个提示来构建输入和目标列,以匹配xP3数据集的格式。数据集仅包含训练集,没有验证集和测试集。

squad_v2_french_translated_fr_prompt_context_generation_with_question is a subset of the Dataset of French Prompts (DFP), containing 3,795,312 rows for context-generation (with question) tasks. The original data comes from the pragnakalp/squad_v2_french_translated dataset and was augmented with questions from the FrenchQA dataset. The dataset uses 24 prompts, presented in the indicative tense, tutoiement, and vouvoiement forms. It only includes a training set, with no validation or test splits.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

基本信息

  • 语言: 法语
  • 许可证: Apache 2.0
  • 数据集大小: 1M<n<10M
  • 任务类别: 文本生成
  • 标签: DFP, french prompts
  • 注释创建者: found
  • 语言创建者: found
  • 多语言性: 单语种
  • 源数据集: squad_v2_french_translated

数据集详情

  • 名称: squad_v2_french_translated_fr_prompt_context_generation_with_question
  • 数据行数: 3,795,312
  • 任务: 上下文生成(带问题)
  • 原始数据来源: pragnakalp/squad_v2_french_translated
  • 增强数据来源: FrenchQA
  • 格式参考: xP3

提示列表

  • 数量: 24个

  • 逻辑: 使用直陈式,使用tutoiement和vouvoiement形式

  • 示例:

    Étant donné la question "+question+", écrire un texte explicatif. Texte : , Étant donné la question "+question+", écris un texte explicatif. Texte : , Étant donné la question "+question+", écrivez un texte explicatif. Texte : , Étant donné la question "+question+", rédiger un texte explicatif. Texte : , Étant donné la question "+question+", rédige un texte explicatif. Texte : , Étant donné la question "+question+", rédigez un texte explicatif. Texte : , Étant donné la question "+question+", générer un texte explicatif. Texte : , Étant donné la question "+question+", génère un texte explicatif. Texte : , Étant donné la question "+question+", générez un texte explicatif. Texte : , Étant donné la question "+question+", créer un texte explicatif. Texte : , Étant donné la question "+question+", crée un texte explicatif. Texte : , Étant donné la question "+question+", créez un texte explicatif. Texte : , Ecrire un texte comme contexte à la question "+question+" Texte : , Ecris un texte comme contexte à la question "+question+" Texte : , Ecrivez un texte comme contexte à la question "+question+" Texte : , Rédiger un texte comme contexte à la question "+question+" Texte : , Rédige un texte comme contexte à la question "+question+" Texte : , Rédigez un texte comme contexte à la question "+question+" Texte : , Générer un texte comme contexte à la question "+question+" Texte : , Génère un texte comme contexte à la question "+question+" Texte : , Générez un texte comme contexte à la question "+question+" Texte : , Créer un texte comme contexte à la question "+question+" Texte : , Crée un texte comme contexte à la question "+question+" Texte : , Créez un texte comme contexte à la question "+question+" Texte :

数据集分割

  • 训练集: 3,795,312 样本
  • 验证集: 无
  • 测试集: 无

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/squad_v2_french_translated_fr_prompt_context_generation_with_question")

许可证

Apache 2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作