five

PNLPhub/FarsTail

收藏
Hugging Face2025-03-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PNLPhub/FarsTail
下载链接
链接失效反馈
官方服务:
资源简介:
波斯语(Farsi)是一种多中心语言,主要在伊朗、阿富汗和塔吉克斯坦等国家使用,约有1.1亿人使用。这里,我们介绍了第一个相对大规模的波斯语自然语言推理(NLI)任务数据集,名为FarsTail。该数据集共包含10,367个样本,这些样本是从3,539个多项选择题中生成的。训练集、验证集和测试集分别包含7,266、1,537和1,564个实例。

波斯语(Farsi)是一种多中心语言,主要在伊朗、阿富汗和塔吉克斯坦等国家使用,约有1.1亿人使用。这里,我们介绍了第一个相对大规模的波斯语自然语言推理(NLI)任务数据集,名为FarsTail。该数据集共包含10,367个样本,这些样本是从3,539个多项选择题中生成的。训练集、验证集和测试集分别包含7,266、1,537和1,564个实例。
提供机构:
PNLPhub
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本分类
  • 语言: 波斯语(Farsi)
  • 数据集大小: 1K<n<10K

数据集详情

  • 数据集名称: FarsTail
  • 数据集描述: FarsTail 是首个相对大规模的波斯语自然语言推理(NLI)数据集,包含10,367个样本,这些样本源自3,539个多选题。数据集分为训练集(7,266个实例)、验证集(1,537个实例)和测试集(1,564个实例)。

数据集来源

引用信息

@article{amirkhani2020farstail, title={FarsTail: A Persian Natural Language Inference Dataset}, author={Hossein Amirkhani, Mohammad Azari Jafari, Azadeh Amirak, Zohreh Pourjafari, Soroush Faridan Jahromi, and Zeinab Kouhkan}, journal={arXiv preprint arXiv:2009.08820}, year={2020} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作