five

CATIE-AQ/wikiner_fr_prompt_ner

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/wikiner_fr_prompt_ner
下载链接
链接失效反馈
官方服务:
资源简介:
wikiner_fr_prompt_ner数据集是DFP(法语提示数据集)的一个子集,专门用于命名实体识别任务。它包含2,534,322行数据,这些数据来源于wikiner数据集中的法语部分。通过应用21种不同的提示(prompts),数据集被构建成与xP3数据集相同的格式。这些提示以不同的法语形式(如直陈式、你形式、您形式)提出,用于生成输入和目标列。数据集仅包含训练集,没有验证集和测试集。

wikiner_fr_prompt_ner数据集是DFP(法语提示数据集)的一个子集,专门用于命名实体识别任务。它包含2,534,322行数据,这些数据来源于wikiner数据集中的法语部分。通过应用21种不同的提示(prompts),数据集被构建成与xP3数据集相同的格式。这些提示以不同的法语形式(如直陈式、你形式、您形式)提出,用于生成输入和目标列。数据集仅包含训练集,没有验证集和测试集。
提供机构:
CATIE-AQ
原始信息汇总

数据集概述:wikiner_fr_prompt_ner

基本信息

  • 语言: 法语 (fr)
  • 许可证: 未知
  • 大小: 1M<n<10M
  • 任务类别: 分词分类
  • 标签: 命名实体识别 (NER), DFP, 法语提示
  • 多语言性: 单语
  • 来源数据集: wikiner

数据集描述

wikiner_fr_prompt_nerDataset of French Prompts (DFP) 的一个子集,包含 2,534,322 行数据,用于命名实体识别任务。原始数据来自 Nothman 等人的 wikiner 数据集,仅保留了法语部分。通过应用一系列提示,构建了输入和目标列,以达到与 xP3 数据集相同的格式。

提示列表

数据集使用了21个提示,这些提示采用直陈式、你称和您称的形式。

数据集分割

  • train: 2,534,322 样本
  • valid 分割
  • test 分割

如何使用

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/wikiner_fr_prompt_ner")

引用信息

原始数据

@article{NOTHMAN2013151,
title = {Learning multilingual named entity recognition from Wikipedia},
journal = {Artificial Intelligence},
volume = {194},
pages = {151-175},
year = {2013},
note = {Artificial Intelligence, Wikipedia and Semi-Structured Resources},
issn = {0004-3702},
doi = {https://doi.org/10.1016/j.artint.2012.03.006},
url = {https://www.sciencedirect.com/science/article/pii/S0004370212000276},
author = {Joel Nothman and Nicky Ringland and Will Radford and Tara Murphy and James R. Curran}, }

本数据集

@misc {centre_aquitain_des_technologies_de_linformation_et_electroniques_2023,
author = { {Centre Aquitain des Technologies de lInformation et Electroniques} },
title = { DFP (Revision 1d24c09) },
year = 2023,
url = { https://huggingface.co/datasets/CATIE-AQ/DFP },
doi = { 10.57967/hf/1200 },
publisher = { Hugging Face }
}

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作