asas-ai/ArEntail
收藏Hugging Face2024-05-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asas-ai/ArEntail
下载链接
链接失效反馈官方服务:
资源简介:
ArEntail是一个手动整理的阿拉伯语自然语言推理数据集,来源于新闻标题。该数据集主要用于文本分类任务,特别是自然语言推理。数据集包含两个主要特征:premise和hypothesis,以及一个label特征用于分类。数据集分为训练集和测试集,分别包含5000和1000个样本。数据集的语言为阿拉伯语,大小类别为1K<n<10K。数据集的下载大小为579304字节,数据集总大小为1571069字节。数据集的许可证未知。
ArEntail是一个手动整理的阿拉伯语自然语言推理数据集,来源于新闻标题。该数据集主要用于文本分类任务,特别是自然语言推理。数据集包含两个主要特征:premise和hypothesis,以及一个label特征用于分类。数据集分为训练集和测试集,分别包含5000和1000个样本。数据集的语言为阿拉伯语,大小类别为1K<n<10K。数据集的下载大小为579304字节,数据集总大小为1571069字节。数据集的许可证未知。
提供机构:
asas-ai
原始信息汇总
数据集概述
数据集名称
ArEntail
数据集特征
- premise:字符串类型
- hypothesis:字符串类型
- label:字符串类型
数据集划分
- 训练集:
- 示例数量:5000
- 数据大小:1309131字节
- 测试集:
- 示例数量:1000
- 数据大小:261938字节
数据集大小
- 下载大小:579304字节
- 数据集总大小:1571069字节
数据集配置
- 默认配置:
- 训练数据路径:data/train-*
- 测试数据路径:data/test-*
许可信息
- 许可:未知
任务类别
- 文本分类
语言
- 阿拉伯语
数据集大小类别
- 1K<n<10K
标签
- 自然语言推理



