five

MMSEARCH|多模态搜索数据集|AI技术数据集

收藏
arXiv2024-09-20 更新2024-09-26 收录
多模态搜索
AI技术
下载链接:
https://mmsearch.github.io
下载链接
链接失效反馈
资源简介:
MMSEARCH数据集由香港中文大学多媒体实验室、字节跳动、上海人工智能实验室等机构联合创建,旨在评估大型多模态模型在多模态搜索中的潜力。该数据集包含300个精心收集的实例,涵盖14个子领域,确保与当前LMMs的训练数据无重叠。数据集内容包括最新的新闻和稀有的知识查询,涉及图像和文本的混合信息。创建过程结合了Google Lens和网页截图技术,确保信息的全面性和准确性。MMSEARCH数据集主要应用于多模态AI搜索引擎的开发和评估,旨在解决传统文本搜索在处理复杂、交错的多模态查询时的局限性。
提供机构:
香港中文大学多媒体实验室、字节跳动、香港中文大学MiuLar实验室、上海人工智能实验室、北京大学、斯坦福大学、商汤科技
创建时间:
2024-09-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
MMSEARCH数据集通过精心设计的流程构建,旨在评估大型多模态模型(LMMs)在多模态搜索任务中的潜力。该数据集包含300个手动收集的实例,涵盖14个子领域,确保与当前LMMs的训练数据无重叠,从而保证正确答案只能通过搜索获得。数据集的构建包括两个主要领域:新闻和知识。新闻领域涵盖最新的新闻事件,确保答案不在LMMs的训练数据中;知识领域则关注稀有知识,这些知识通常无法被现有的最先进LMMs如GPT-4o或Claude-3.5回答。
使用方法
使用MMSEARCH数据集时,研究人员和开发者可以通过MMSEARCH-ENGINE管道对LMMs进行评估。该管道包括四个主要任务:重新查询、重新排序、总结和端到端搜索。通过这些任务,可以全面评估LMMs在处理多模态查询时的表现。具体使用方法包括:首先,LMMs需要将用户的问题重新格式化为适合搜索引擎的查询;其次,根据搜索结果对相关网站进行重新排序;最后,从最相关的网页内容中提取并总结答案。通过这种方式,MMSEARCH数据集能够为多模态AI搜索引擎的开发提供宝贵的见解和指导。
背景与挑战
背景概述
MMSEARCH数据集由香港中文大学、字节跳动、上海人工智能实验室等机构的研究人员共同创建,旨在评估大型多模态模型(LMMs)在多模态搜索任务中的潜力。该数据集于2024年发布,包含300个手动收集的实例,涵盖14个子领域,确保与当前LMMs的训练数据无重叠。MMSEARCH数据集通过设计精巧的管道MMSEARCH-ENGINE,使任何LMMs都能具备多模态搜索能力,并通过三个核心任务(重新查询、重新排序和总结)以及一个端到端的挑战性任务来评估其性能。
当前挑战
MMSEARCH数据集面临的挑战主要包括两个方面:一是解决多模态用户查询和文本图像交错网站信息的复杂性,这要求模型不仅能够处理文本查询,还能理解和整合图像信息;二是在构建过程中,确保数据集与LMMs的训练数据无重叠,以保证评估的公正性和有效性。此外,数据集的设计和评估方法需要能够全面反映LMMs在多模态搜索任务中的实际应用能力,包括对复杂查询的处理、信息检索的准确性以及对多模态内容的整合能力。
常用场景
经典使用场景
MMSEARCH数据集的经典使用场景在于评估大型多模态模型(LMMs)在多模态搜索任务中的表现。通过提供包含文本和图像的多模态查询,数据集能够测试模型在处理复杂用户查询和理解多模态信息方面的能力。具体任务包括重新查询(requery)、重新排序(rerank)和总结(summarization),以及一个端到端的完整搜索过程任务。
解决学术问题
MMSEARCH数据集解决了当前多模态搜索领域中的一个关键学术问题,即缺乏对LMMs在多模态搜索任务中潜力的系统评估。通过设计一个精细的搜索管道(MMSEARCH-ENGINE)和全面的评估基准(MMSEARCH),该数据集为研究人员提供了一个标准化的工具,用于评估和比较不同LMMs在多模态搜索任务中的性能。这不仅有助于揭示现有模型的局限性,还为未来模型的改进提供了方向。
实际应用
在实际应用中,MMSEARCH数据集和其评估方法可以用于开发和优化多模态搜索引擎。这些搜索引擎能够处理包含图像和文本的复杂查询,从而提高信息检索的准确性和用户体验。例如,在电子商务、新闻检索和学术研究等领域,用户可以通过上传图像和输入文本进行更精确的搜索,系统则能够返回更相关的结果。
数据集最近研究
最新研究方向
在多模态搜索领域,MMSEARCH数据集的最新研究方向集中在评估大型多模态模型(LMMs)作为多模态搜索引擎的潜力。研究不仅关注LMMs在处理文本查询方面的能力,还探索其在处理图像和文本混合查询时的表现。通过设计精细的搜索管道MMSEARCH-ENGINE,研究者们能够全面评估LMMs在多模态搜索任务中的性能,包括重新查询、重新排序和总结等关键步骤。此外,研究还通过广泛的实验和错误分析,揭示了当前LMMs在多模态搜索任务中的局限性,并提出了未来改进的方向。
相关研究论文
  • 1
    MMSearch: Benchmarking the Potential of Large Models as Multi-modal Search Engines香港中文大学多媒体实验室、字节跳动、香港中文大学MiuLar实验室、上海人工智能实验室、北京大学、斯坦福大学、商汤科技 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

Global Water Quality Dataset

该数据集包含了全球多个地区的水质监测数据,涵盖了多种水质参数,如pH值、溶解氧、电导率、温度等。数据集旨在帮助研究人员和政策制定者了解全球水质的现状和变化趋势。

www.kaggle.com 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录