CATIE-AQ/mtop_domain_intent_fr_prompt_intent_classification
收藏Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/mtop_domain_intent_fr_prompt_intent_classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是法语提示数据集(DFP)的一个子集,专门用于意图文本分类任务。它包含497,100行数据,原始数据来自mtop_domain数据集,仅保留了法语部分。通过应用一系列提示,构建了输入和目标列,使其格式与xP3数据集一致。数据集分为训练集、验证集和测试集,分别包含354,000、47,300和95,800个样本。
This dataset is a subset of the French Prompt Dataset (DFP), specifically tailored for intent text classification tasks. It contains 497,100 rows of data, originating from the mtop_domain dataset with only the French-language portion retained. A series of prompts were applied to construct the input and target columns, aligning the dataset's format with that of the xP3 dataset. The dataset is split into training, validation, and test sets, which hold 354,000, 47,300, and 95,800 samples respectively.
提供机构:
CATIE-AQ
原始信息汇总
数据集概述
数据集名称: mtop_domain_intent_fr_prompt_intent_classification
语言: 法语 (fr)
数据集大小: 497,100 行
任务类型: 文本分类 (text-classification)
数据来源: 原始数据来自 mtop_domain,仅保留了法语部分。
数据处理: 应用了30个提示(prompts)来构建输入和目标列,以获得与 xP3 数据集相同的格式。
数据集内容
提示列表: 共30个提示,使用指示性语气,包括tutoiement和vouvoiement形式。
特征使用: 在提示中使用了 classes、text 和 targets 特征,其中 classes 包括 "rappel, actualités, recettes, minuterie, appel, météo, alarme, événement, musique, personne, message"。
数据集分割
train: 354,000 样本valid: 47,300 样本test: 95,800 样本
使用方法
python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/mtop_domain_intent_fr_prompt_intent_classification")
许可证
许可证: 未知



