CATIE-AQ/newsquadfr_fr_prompt_qa
收藏Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/newsquadfr_fr_prompt_qa
下载链接
链接失效反馈官方服务:
资源简介:
newsquadfr_fr_prompt_qa数据集是法语提示数据集(DFP)的一个子集,专门用于问答任务。该数据集基于newsquadfr数据集,并使用FrenchQA数据集中的问题进行了增强,包含88,410条记录。数据集采用了SQUAD 1.0和SQUAD 2.0的格式,并提供了42种不同的提示语,适用于训练问答模型。
newsquadfr_fr_prompt_qa is a subset of the French Prompts Dataset (DFP) designed for question-answering tasks. Based on the newsquadfr dataset, it is augmented with questions from the FrenchQA dataset, containing 88,410 entries. The dataset follows the SQUAD 1.0 and SQUAD 2.0 formats and includes 42 different prompts, suitable for training question-answering models.
提供机构:
CATIE-AQ
原始信息汇总
newsquadfr_fr_prompt_qa 数据集概述
基本信息
- 语言: 法语
- 许可: CC BY-NC-SA 4.0
- 数据量: 10K<n<100K
- 任务类型: 问答
- 标签: DFP, french prompts
- 注释创建者: found
- 语言创建者: found
- 多语言性: 单语种
- 源数据集: newsquadfr
概要
- 数据集名称: newsquadfr_fr_prompt_qa
- 数据来源: Dataset of French Prompts (DFP) 的子集
- 数据量: 88,410 行
- 任务类型: 问答
- 原始数据: 来自 newsquadfr 数据集,并结合了 FrenchQA 数据集中的 SQUAD 2.0 格式问题进行增强
- 格式: 与 xP3 数据集格式相同
提示列表
- 数量: 42 个提示
- 逻辑: 使用直陈式、第二人称单数和第二人称复数形式
数据分割
- 训练集: 69,300 样本
- 验证集: 19,110 样本
- 测试集: 无
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/newsquadfr_fr_prompt_qa")
引用
原始数据
Hugging Face repository: https://huggingface.co/datasets/lincoln/newsquadfr
本数据集
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}
许可
CC BY-NC-SA 4.0



