five

FarsTail

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/FarsTail
下载链接
链接失效反馈
官方服务:
资源简介:
自然语言推理 (NLI),也称为文本蕴涵,是 NLP 中的一项重要任务,其目标是确定前提 p 和假设 h 之间的推理关系。这是一个三类问题,其中每一对 (p, h) 被分配到以下类别之一:如果假设可以从前提中推断出,则为“ENTAILMENT”,如果假设与前提相矛盾,则为“CONTRADICTION”,以及“NEUTRAL”如果以上都不成立。_x000D_ 英语 NLI 有 SNLI、MNLI 和 SciTail 等大型数据集,但波斯语等数据较差的语言的数据集很少。_x000D_ 波斯语(波斯语)是一种多中心语言,在伊朗、阿富汗和塔吉克斯坦等国家约有 1.1 亿人使用。在这里,我们展示了第一个用于 NLI 任务的相对大规模的波斯数据集,称为 FarsTail。从 3,539 个多项选择题的集合中生成了总共 10,367 个样本。训练、验证和测试部分分别包括 7,266、1,537 和 1,564 个实例。请参阅手稿以获取更多详细信息。
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
FarsTail是首个用于波斯语自然语言推理任务的相对大规模数据集,包含10,367个样本,分为三类推理关系。该数据集从多项选择题生成,旨在支持波斯语NLP研究,填补了数据稀缺语言的空白。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作