CATIE-AQ/wino_x_fr_prompt_coreference
收藏数据集概述
wino_x_fr_prompt_coreference 是一个专门用于核心参考任务的数据集,包含27,930条记录。该数据集是Dataset of French Prompts (DFP)的一个子集,其原始数据来自wino_x数据集的法国部分。
数据集特征
- 语言: 法语
- 许可证: MIT
- 大小: 10K<n<100K
- 标签: 核心参考, DFP, 法语提示
- 多语言性: 单语种
- 源数据集: wino_x
数据集结构
- 训练集: 27,930样本
- 验证集: 无
- 测试集: 无
提示使用
数据集使用了10种提示,这些提示设计用于提出指示性时态的提示,形式包括“你”和“您”。提示中的特征包括option1, option2, sentence 和 targets,这些特征是从wino_x数据集的测试集中提取的。
如何使用
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/wino_x_fr_prompt_coreference")
引用信息
-
原始数据:
@inproceedings{Emelin2021WinoXMW, title={Wino-X: Multilingual Winograd Schemas for Commonsense Reasoning and Coreference Resolution}, author={Denis Emelin and Rico Sennrich}, booktitle={EMNLP}, year={2021} }
-
本数据集:
@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023, author = { {Centre Aquitain des Technologies de lInformation et Electroniques} }, title = { DFP (Revision 1d24c09) }, year = 2023, url = { https://huggingface.co/datasets/CATIE-AQ/DFP }, doi = { 10.57967/hf/1200 }, publisher = { Hugging Face } }



