PNLPhub/FarsTail
收藏Hugging Face2025-03-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PNLPhub/FarsTail
下载链接
链接失效反馈官方服务:
资源简介:
波斯语(Farsi)是一种多中心语言,主要在伊朗、阿富汗和塔吉克斯坦等国家使用,约有1.1亿人使用。这里,我们介绍了第一个相对大规模的波斯语自然语言推理(NLI)任务数据集,名为FarsTail。该数据集共包含10,367个样本,这些样本是从3,539个多项选择题中生成的。训练集、验证集和测试集分别包含7,266、1,537和1,564个实例。
波斯语(Farsi)是一种多中心语言,主要在伊朗、阿富汗和塔吉克斯坦等国家使用,约有1.1亿人使用。这里,我们介绍了第一个相对大规模的波斯语自然语言推理(NLI)任务数据集,名为FarsTail。该数据集共包含10,367个样本,这些样本是从3,539个多项选择题中生成的。训练集、验证集和测试集分别包含7,266、1,537和1,564个实例。
提供机构:
PNLPhub
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 文本分类
- 语言: 波斯语(Farsi)
- 数据集大小: 1K<n<10K
数据集详情
- 数据集名称: FarsTail
- 数据集描述: FarsTail 是首个相对大规模的波斯语自然语言推理(NLI)数据集,包含10,367个样本,这些样本源自3,539个多选题。数据集分为训练集(7,266个实例)、验证集(1,537个实例)和测试集(1,564个实例)。
数据集来源
- 仓库链接: FarsTail GitHub仓库
- 相关论文: FarsTail 论文
引用信息
@article{amirkhani2020farstail, title={FarsTail: A Persian Natural Language Inference Dataset}, author={Hossein Amirkhani, Mohammad Azari Jafari, Azadeh Amirak, Zohreh Pourjafari, Soroush Faridan Jahromi, and Zeinab Kouhkan}, journal={arXiv preprint arXiv:2009.08820}, year={2020} }



