five

CATIE-AQ/wino_x_fr_prompt_coreference

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/wino_x_fr_prompt_coreference
下载链接
链接失效反馈
官方服务:
资源简介:
wino_x_fr_prompt_coreference数据集是法国提示数据集(DFP)的一个子集,专用于指代消解任务。它包含了27,930条记录,数据来源于wino_x数据集的法国部分,经过特定提示模板的处理,以适配xP3数据集的格式。该数据集适用于训练指代消解模型,并遵循MIT许可证。

The wino_x_fr_prompt_coreference dataset is a subset of the Dataset of French Prompts (DFP) specifically designed for coreference resolution tasks. It contains 27,930 entries sourced from the French part of the wino_x dataset, processed with specific prompt templates to match the format of the xP3 dataset. This dataset is suitable for training coreference resolution models and is licensed under MIT.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

wino_x_fr_prompt_coreference 是一个专门用于核心参考任务的数据集,包含27,930条记录。该数据集是Dataset of French Prompts (DFP)的一个子集,其原始数据来自wino_x数据集的法国部分。

数据集特征

  • 语言: 法语
  • 许可证: MIT
  • 大小: 10K<n<100K
  • 标签: 核心参考, DFP, 法语提示
  • 多语言性: 单语种
  • 源数据集: wino_x

数据集结构

  • 训练集: 27,930样本
  • 验证集: 无
  • 测试集: 无

提示使用

数据集使用了10种提示,这些提示设计用于提出指示性时态的提示,形式包括“你”和“您”。提示中的特征包括option1, option2, sentencetargets,这些特征是从wino_x数据集的测试集中提取的。

如何使用

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/wino_x_fr_prompt_coreference")

引用信息

  • 原始数据:

    @inproceedings{Emelin2021WinoXMW, title={Wino-X: Multilingual Winograd Schemas for Commonsense Reasoning and Coreference Resolution}, author={Denis Emelin and Rico Sennrich}, booktitle={EMNLP}, year={2021} }

  • 本数据集:

    @misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023, author = { {Centre Aquitain des Technologies de lInformation et Electroniques} }, title = { DFP (Revision 1d24c09) }, year = 2023, url = { https://huggingface.co/datasets/CATIE-AQ/DFP }, doi = { 10.57967/hf/1200 }, publisher = { Hugging Face } }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作