SEACrowd/miracl
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/miracl
下载链接
链接失效反馈官方服务:
资源简介:
MIRACL是一个多语言数据集,支持18种语言的检索任务,涵盖了超过30亿的母语使用者。该数据集主要用于单语检索任务,即查询和语料库使用同一种语言。数据集包含了超过726,000个高质量的相关性判断,涉及78,000个查询,所有标注均由母语使用者完成。MIRACL数据集特别涵盖了印尼语和泰语。使用该数据集前,用户需要接受确认并使用huggingface-cli进行身份验证。
MIRACL是一个多语言数据集,支持18种语言的检索任务,涵盖了超过30亿的母语使用者。该数据集主要用于单语检索任务,即查询和语料库使用同一种语言。数据集包含了超过726,000个高质量的相关性判断,涉及78,000个查询,所有标注均由母语使用者完成。MIRACL数据集特别涵盖了印尼语和泰语。使用该数据集前,用户需要接受确认并使用huggingface-cli进行身份验证。
提供机构:
SEACrowd



