five

CATIE-AQ/universal_dependencies_fr_sequoia_fr_prompt_pos

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/universal_dependencies_fr_sequoia_fr_prompt_pos
下载链接
链接失效反馈
官方服务:
资源简介:
universal_dependencies_fr_sequoia_fr_prompt_pos数据集是法语提示数据集(DFP)的一个子集,专门用于词性标注任务。该数据集包含27,804行数据,来源于universal_dependencies数据集中的法语sequoia部分。通过应用21种不同的提示,数据集构建了输入和目标列,格式与xP3数据集相同。数据集分为训练集、验证集和测试集,分别包含9,576、8,652和9,576个样本。

universal_dependencies_fr_sequoia_fr_prompt_pos数据集是法语提示数据集(DFP)的一个子集,专门用于词性标注任务。该数据集包含27,804行数据,来源于universal_dependencies数据集中的法语sequoia部分。通过应用21种不同的提示,数据集构建了输入和目标列,格式与xP3数据集相同。数据集分为训练集、验证集和测试集,分别包含9,576、8,652和9,576个样本。
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

数据集名称

universal_dependencies_fr_sequoia_fr_prompt_pos

数据集来源

该数据集是Dataset of French Prompts (DFP)的一个子集。

数据集大小

包含27,804行数据,适用于词性标注任务。

数据集内容

数据集中的原始数据来自universal_dependencies,仅保留了法语sequoia分割。通过应用一系列提示(prompts),构建了输入和目标列,以达到与xP3数据集相同的格式。

提示列表

数据集使用了21个提示,这些提示包括指示性语气、tu形式和vous形式。

数据集分割

  • train: 9,576 samples
  • valid: 8,652 samples
  • test: 9,576 samples

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/universal_dependencies_fr_sequoia_fr_prompt_pos")

许可证

LGPL-LR

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作