five

PerCQA

收藏
arXiv2021-12-25 更新2024-06-21 收录
下载链接:
https://github.com/PerCQA
下载链接
链接失效反馈
官方服务:
资源简介:
PerCQA是首个针对波斯语的社区问答数据集,由计算机科学学院和德黑兰大学的研究团队创建。该数据集包含从最著名的波斯论坛Ninisite爬取的989个问题和21,915个答案。创建过程中,研究团队开发了详细的标注指南和工具,以确保数据质量。数据集的标注分为问题和答案两个阶段,使用三种标签:‘好’、‘坏’和‘潜在’。PerCQA旨在推动波斯语社区问答研究,特别是在自动答案选择领域。

PerCQA is the first Persian-language community question answering dataset, created by a research team from the School of Computer Science and University of Tehran. It contains 989 questions and 21,915 answers crawled from the most prominent Persian forum, Ninisite. During its development, the research team developed detailed annotation guidelines and tools to ensure data quality. The dataset's annotation is divided into two stages: question and answer annotation, using three labels: "good", "bad", and "potential". PerCQA aims to advance Persian-language community QA research, particularly in the field of automatic answer selection.
提供机构:
计算机科学学院,基础科学研究所,电气与计算机工程学院,工程学院,德黑兰大学
创建时间:
2021-12-25
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作