PerCQA
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/PerCQA
下载链接
链接失效反馈官方服务:
资源简介:
PerCQA是第一个用于社区问答的波斯数据集。
社区问答 (CQA) 论坛为许多现实生活中的问题提供答案。由于规模庞大,这些论坛在机器学习研究人员中非常受欢迎。自动选择答案,答案排名,问题检索,专家发现和事实检查是使用CQA数据执行的示例学习任务。
在本文中,我们介绍了PerCQA,这是CQA的第一个波斯数据集。此数据集包含从最著名的波斯论坛抓取的问题和答案。数据采集后,我们在迭代过程中提供严格的注释指南,然后以SemEvalCQA格式对问答对进行注释。
PerCQA包含989个问题和21,915带注释的答案。我们公开提供PerCQA,以鼓励对波斯CQA进行更多研究。我们还通过使用单语言和多语言的预训练语言模型,为PerCQA中的答案选择任务建立了强大的基准。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
PerCQA是首个波斯语社区问答数据集,包含从波斯论坛收集的989个问题和21,915个带注释的答案,数据以SemEval CQA格式进行标注。该数据集旨在推动波斯语CQA研究,并为答案选择任务提供了基于预训练语言模型的基准。
以上内容由遇见数据集搜集并总结生成



