FashionIQ|时尚数据集|视觉语言理解数据集
收藏
- FashionIQ数据集首次发表,由美国卡内基梅隆大学和Adobe Research联合发布,旨在通过图像和文本的结合来评估和提升时尚领域的智能系统。
- FashionIQ数据集首次应用于国际计算机视觉与模式识别会议(CVPR)的挑战赛中,吸引了全球多个研究团队参与,推动了时尚智能系统的发展。
- FashionIQ数据集在多个国际顶级会议上被广泛引用和讨论,成为时尚领域智能系统研究的重要基准数据集之一。
- 1FashionIQ: A New Dataset for Compositional Language Image RetrievalUniversity of California, Santa Cruz · 2020年
- 2FashionIQ: Compositional Learning of Embeddings for Fashion Image RetrievalUniversity of California, Santa Cruz · 2021年
- 3FashionIQ: A Comprehensive Dataset for Fashion Image RetrievalUniversity of California, Santa Cruz · 2022年
- 4FashionIQ: Enhancing Fashion Image Retrieval with Compositional LearningUniversity of California, Santa Cruz · 2022年
- 5FashionIQ: A Benchmark for Compositional Language Image Retrieval in FashionUniversity of California, Santa Cruz · 2023年
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
UAVDT
UAVDT是一个用于目标检测任务的数据集。
github 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录