CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_context
收藏Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_context
下载链接
链接失效反馈官方服务:
资源简介:
squad_v2_french_translated_fr_prompt_question_generation_with_context是法语提示数据集(DFP)的一个子集,包含3,795,312行数据,用于生成带上下文的问题。原始数据来源于squad_v2_french_translated数据集,并通过FrenchQA数据集中的SQUAD 2.0格式问题进行了增强。该数据集使用了24个提示来构建输入和目标列,使其格式与Muennighoff等人创建的xP3数据集一致。
提供机构:
CATIE-AQ
原始信息汇总
数据集概述
基本信息
- 语言: 法语
- 许可证: Apache 2.0
- 数据集大小: 1M<n<10M
- 任务类别: 文本生成
- 标签: DFP, french prompts
- 注释创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: squad_v2_french_translated
数据集详情
- 名称: squad_v2_french_translated_fr_prompt_question_generation_with_context
- 数据集来源: 来自Dataset of French Prompts (DFP)的子集
- 数据量: 包含3,795,312行,适用于问题生成(带上下文)任务
- 原始数据: 来自pragnakalp/squad_v2_french_translated数据集,并增加了FrenchQA数据集中的问题
- 输入和目标列构建: 应用了24个提示,以构建输入和目标列,格式与xP3数据集相同
提示列表
- 数量: 24个
- 逻辑: 使用直陈式,使用tutoiement和vouvoiement形式
数据集分割
- 训练集: 3,795,312个样本
- 验证集: 无
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/squad_v2_french_translated_fr_prompt_question_generation_with_context")
引用
原始数据
Hugging Face repository: https://huggingface.co/datasets/pragnakalp/squad_v2_french_translated
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可证
Apache 2.0



