GeMQuAD
收藏arXiv2024-04-14 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2404.09163v1
下载链接
链接失效反馈官方服务:
资源简介:
GeMQuAD是由亚马逊Alexa国际团队开发的一个半监督学习数据集,主要用于多语言问答任务。该数据集通过使用AlexaTM 20B Seq2Seq大型语言模型,利用少量样本学习(1-shot learning)生成,特别适用于资源较少的多语言环境下的抽取式问答任务。数据集创建过程中,通过迭代识别高质量数据来提升模型性能。GeMQuAD的应用领域主要集中在优化小型学生模型,以降低部署成本和下游任务的延迟,同时提高多语言问答系统的性能。
提供机构:
亚马逊,Alexa国际
创建时间:
2024-04-14



