CATIE-AQ/universal_dependencies_fr_sequoia_fr_prompt_pos
收藏Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/universal_dependencies_fr_sequoia_fr_prompt_pos
下载链接
链接失效反馈官方服务:
资源简介:
universal_dependencies_fr_sequoia_fr_prompt_pos数据集是法语提示数据集(DFP)的一个子集,专门用于词性标注任务。该数据集包含27,804行数据,来源于universal_dependencies数据集中的法语sequoia部分。通过应用21种不同的提示,数据集构建了输入和目标列,格式与xP3数据集相同。数据集分为训练集、验证集和测试集,分别包含9,576、8,652和9,576个样本。
universal_dependencies_fr_sequoia_fr_prompt_pos数据集是法语提示数据集(DFP)的一个子集,专门用于词性标注任务。该数据集包含27,804行数据,来源于universal_dependencies数据集中的法语sequoia部分。通过应用21种不同的提示,数据集构建了输入和目标列,格式与xP3数据集相同。数据集分为训练集、验证集和测试集,分别包含9,576、8,652和9,576个样本。
提供机构:
CATIE-AQ
原始信息汇总
数据集概述
数据集名称
universal_dependencies_fr_sequoia_fr_prompt_pos
数据集来源
该数据集是Dataset of French Prompts (DFP)的一个子集。
数据集大小
包含27,804行数据,适用于词性标注任务。
数据集内容
数据集中的原始数据来自universal_dependencies,仅保留了法语sequoia分割。通过应用一系列提示(prompts),构建了输入和目标列,以达到与xP3数据集相同的格式。
提示列表
数据集使用了21个提示,这些提示包括指示性语气、tu形式和vous形式。
数据集分割
train: 9,576 samplesvalid: 8,652 samplestest: 9,576 samples
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/universal_dependencies_fr_sequoia_fr_prompt_pos")
许可证
LGPL-LR



