five

LAReQA

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/LAReQA
下载链接
链接失效反馈
官方服务:
资源简介:
LAReQA 是一个具有挑战性的基准测试,测试从多语言候选池中检索与语言无关的答案。与以前的跨语言任务不同,LAReQA 测试“强”跨语言对齐,要求语义相关的跨语言对在表示空间中比不相关的同语言对更接近。作为 LAReQA 基准测试的一部分,我们通过采用现有的跨语言抽取式 QA 任务 XQuAD 并将其转换为检索任务:XQuAD-R,构建了一个具有多语言池的 QA 检索任务。我们在此存储库中发布带有断句的 XQuAD,以用作 XQuAD-R。
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
LAReQA是一个用于评估多语言答案检索的基准测试,它通过要求跨语言语义对齐来挑战模型能力,即相关跨语言对在表示空间中的距离需小于不相关的同语言对。该数据集基于XQuAD任务构建为XQuAD-R检索任务,并提供断句版本,由Google Research于2020年发布,采用CC BY-SA 4.0许可证。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作