five

RAR-b

收藏
arXiv2024-05-13 更新2024-07-30 收录
下载链接:
https://github.com/gowitheflow-1998/RAR-b
下载链接
链接失效反馈
官方服务:
资源简介:
一个全面评估检索模型中存储的推理能力的任务和设置套件。
创建时间:
2024-04-09
原始信息汇总

RAR-b 数据集概述

数据集更新

  • 2024年7月2日:新增数据集/指令工具;RAR-b已集成到MTEB,并提供排行榜
  • 2024年4月15日:所有RAR-b处理后的数据集、工具和评估脚本已开源。
  • 2024年4月9日:发布RAR-b论文

数据集下载

  • 完整数据集检索(full)设置的所有数据集托管在Huggingface
  • 多选设置(mcr)的所有数据集已随git clone一起提供(CSTS除外,提供了重现代码mcr/create_csts.py)。

数据集加载

  • 提供HFDataLoader从Huggingface加载完整设置数据集。
  • 提供task_to_instruction获取任务特定默认指令。

评估

  • 提供scripts文件夹以重现RAR-b论文中的评估结果。
  • 示例:评估BGE模型,运行python scripts/evaluate-BGE.py

示例

  • 示例代码展示了如何使用Grit模型进行评估,包括有和无指令的情况。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作