INSTRUCTIR
收藏arXiv2024-02-22 更新2024-06-21 收录
下载链接:
https://github.com/kaistAI/InstructIR
下载链接
链接失效反馈官方服务:
资源简介:
INSTRUCTIR数据集由韩国科学技术院人工智能研究所创建,专注于评估信息检索模型遵循用户指令的能力。该数据集包含9906条实例,每条实例都包含用户特定的指令,反映了真实世界搜索场景的多样性。数据集的创建过程涉及从MSMARCO数据集中选择种子示例,使用GPT-4生成多样化的指令,并经过多阶段的数据创建和过滤过程。INSTRUCTIR数据集的应用领域主要集中在提高信息检索系统的用户指令遵循能力,解决现有检索模型在理解用户意图和偏好方面的不足。
提供机构:
韩国科学技术院人工智能研究所
创建时间:
2024-02-22
搜集汇总
数据集介绍

背景与挑战
背景概述
INSTRUCTIR是一个专门设计用于评估信息检索模型指令遵循能力的基准数据集。它通过为每个查询实例生成用户对齐的指令,以反映真实世界搜索场景的多样性,并提供了完整的构建流程和开源资源。
以上内容由遇见数据集搜集并总结生成



