five

CATIE-AQ/universal_dependencies_fr_fqb_fr_prompt_pos

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/universal_dependencies_fr_fqb_fr_prompt_pos
下载链接
链接失效反馈
官方服务:
资源简介:
universal_dependencies_fr_fqb_fr_prompt_pos是一个针对法语词性标注任务的数据集,包含48,069个样本,是DFP数据集的一个子集。它基于universal_dependencies数据集中的法语fqb分支构建,并使用特定提示来格式化数据,以适应xP3数据集的格式。

universal_dependencies_fr_fqb_fr_prompt_pos is a dataset for French part-of-speech tagging containing 48,069 samples, which is a subset of the DFP dataset. It is built upon the French fqb branch of the universal_dependencies dataset and formatted with specific prompts to match the format of the xP3 dataset.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

数据集名称: universal_dependencies_fr_fqb_fr_prompt_pos

来源: 该数据集是Dataset of French Prompts (DFP)的一个子集。

数据量: 包含48,069行数据,用于词性标注任务。

原始数据来源: 来自universal_dependencies数据集,仅保留了由Seddah和Candito处理的French fqb分割。

数据处理: 应用了21个提示(prompts)来构建输入和目标列,以达到与xP3数据集相同的格式。

数据集特征

语言: 法语(fr)

多语言性: 单语种(monolingual)

任务类别: 词元分类(token-classification)

标签: POS(词性标注)、DFP(French Prompts)

数据集分割

  • 训练集: 48,069样本
  • 验证集:
  • 测试集:

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/universal_dependencies_fr_fqb_fr_prompt_pos")

许可证

LGPL-R

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作