TweetQA
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/TweetQA
下载链接
链接失效反馈官方服务:
资源简介:
随着社交媒体越来越受欢迎,其中报道了大量新闻和实时事件,开发自动问答系统对于许多依赖实时知识的应用程序的有效性至关重要。虽然以前的问答 (QA) 数据集集中在新闻和维基百科等正式文本上,但我们展示了第一个针对社交媒体数据的 QA 的大规模数据集。为了使推文有意义并包含有趣的信息,我们收集了记者用来撰写新闻文章的推文。然后,我们要求人工注释者在这些推文上写下问题和答案。与 SQuAD 等其他 QA 数据集的答案是抽取式的不同,我们允许答案是抽象的。该任务需要模型阅读一条简短的推文和一个问题,并输出一个文本短语(不需要在推文中)作为答案。
提供机构:
OpenDataLab
创建时间:
2022-04-29
搜集汇总
数据集介绍

背景与挑战
背景概述
TweetQA是一个针对社交媒体数据的大规模问答数据集,专注于推文内容,旨在支持自动问答系统处理实时事件。该数据集基于记者使用的推文,通过人工注释生成抽象式答案,要求模型根据推文和问题输出文本短语,由加州大学和IBM Research于2019年发布。
以上内容由遇见数据集搜集并总结生成



