five

CATIE-AQ/anli_fr_prompt_textual_entailment

收藏
Hugging Face2025-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CATIE-AQ/anli_fr_prompt_textual_entailment
下载链接
链接失效反馈
官方服务:
资源简介:
anli_fr_prompt_textual_entailment是一个专门用于文本蕴含任务的数据集,包含550,000条基于法语的数据记录。该数据集是从multilingual-NLI-26lang-2mil7数据集中的法语部分派生出来的,并使用了特定的提示语来构建数据格式。它适用于训练机器学习模型进行文本蕴含任务。

anli_fr_prompt_textual_entailment is a dataset for textual entailment tasks, containing 550,000 records based on the French language. It is derived from the French part of the multilingual-NLI-26lang-2mil7 dataset and uses specific prompts to construct the data format. It is suitable for training machine learning models for textual entailment tasks.
提供机构:
CATIE-AQ
原始信息汇总

数据集概述

anli_fr_prompt_textual_entailment 是一个文本蕴含任务的数据集,包含550,000行数据,属于Dataset of French Prompts (DFP)的子集。该数据集主要用于文本分类任务,原始数据来自multilingual-NLI-26lang-2mil7,仅保留了法语部分。

数据集特征

  • 语言:法语
  • 大小:100K<n<1M
  • 任务类别:文本分类
  • 标签:文本蕴含、DFP、法语提示
  • 多语言性:单语种
  • 来源数据集:multilingual-NLI-26lang-26lang-2mil7

数据集结构

  • 训练集:550,000样本
  • 验证集:无
  • 测试集:无

使用方法

python from datasets import load_dataset dataset = load_dataset("CATIE-AQ/anli_fr_prompt_textual_entailment")

许可证

数据集遵循cc-by-nc-4.0许可证。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作