Product1M
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Product1M
下载链接
链接失效反馈官方服务:
资源简介:
我们提供Product1M,这是用于实际实例级检索的最大的多模式化妆品数据集之一。值得注意的是,Product1M包含超过100万个imagecaption对并且由两种样品类型组成,即,单一产品和多产品样品,其涵盖了各种各样的化妆品品牌。除了巨大的多样性,Product1M还具有几个吸引人的特征,包括细粒度的类别,复杂的组合和模糊的对应关系,可以很好地模仿现实世界的场景。
We present Product1M, one of the largest multimodal cosmetic datasets for real-world instance-level retrieval. Notably, Product1M contains over one million image-caption pairs and consists of two sample types: single-product and multi-product samples, which cover a wide range of cosmetic brands. In addition to its extensive diversity, Product1M also features several appealing characteristics, including fine-grained categories, complex compositions, and ambiguous correspondences, which effectively mimic real-world scenarios.
提供机构:
OpenDataLab
创建时间:
2023-03-22
搜集汇总
数据集介绍

背景与挑战
背景概述
Product1M是一个大规模的多模式化妆品数据集,包含超过100万个图像-文本对,涵盖单一产品和多产品样品,具有细粒度类别和复杂组合特点,适用于实例级检索任务。该数据集由北京交通大学、阿里巴巴和中山大学于2021年发布,旨在模拟现实世界的化妆品场景,支持计算机视觉和预训练研究。
以上内容由遇见数据集搜集并总结生成



