five

asas-ai/ArEntail

收藏
Hugging Face2024-05-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asas-ai/ArEntail
下载链接
链接失效反馈
官方服务:
资源简介:
ArEntail是一个手动整理的阿拉伯语自然语言推理数据集,来源于新闻标题。该数据集主要用于文本分类任务,特别是自然语言推理。数据集包含两个主要特征:premise和hypothesis,以及一个label特征用于分类。数据集分为训练集和测试集,分别包含5000和1000个样本。数据集的语言为阿拉伯语,大小类别为1K<n<10K。数据集的下载大小为579304字节,数据集总大小为1571069字节。数据集的许可证未知。

ArEntail是一个手动整理的阿拉伯语自然语言推理数据集,来源于新闻标题。该数据集主要用于文本分类任务,特别是自然语言推理。数据集包含两个主要特征:premise和hypothesis,以及一个label特征用于分类。数据集分为训练集和测试集,分别包含5000和1000个样本。数据集的语言为阿拉伯语,大小类别为1K<n<10K。数据集的下载大小为579304字节,数据集总大小为1571069字节。数据集的许可证未知。
提供机构:
asas-ai
原始信息汇总

数据集概述

数据集名称

ArEntail

数据集特征

  • premise:字符串类型
  • hypothesis:字符串类型
  • label:字符串类型

数据集划分

  • 训练集
    • 示例数量:5000
    • 数据大小:1309131字节
  • 测试集
    • 示例数量:1000
    • 数据大小:261938字节

数据集大小

  • 下载大小:579304字节
  • 数据集总大小:1571069字节

数据集配置

  • 默认配置
    • 训练数据路径:data/train-*
    • 测试数据路径:data/test-*

许可信息

  • 许可:未知

任务类别

  • 文本分类

语言

  • 阿拉伯语

数据集大小类别

  • 1K<n<10K

标签

  • 自然语言推理
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作