five

GyGO

收藏
github2024-03-08 更新2024-05-31 收录
下载链接:
https://github.com/ilchemla/gygo-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
GyGO是一个专注于电子商务领域的视频对象分割数据集。它包含131个训练序列和24个验证序列,每个序列1-10秒长,由手持智能手机摄像头拍摄,并以约5fps的速度进行后期处理和标注。该数据集旨在填补视频对象分割领域数据的严重不足,并促进开放共享的研究文化。

GyGO is a video object segmentation dataset focused on the e-commerce domain. It comprises 131 training sequences and 24 validation sequences, each ranging from 1 to 10 seconds in length. These sequences are captured using handheld smartphone cameras and are post-processed and annotated at approximately 5 frames per second (fps). The dataset aims to address the significant shortage of data in the field of video object segmentation and to foster a culture of open and shared research.
创建时间:
2017-09-10
原始信息汇总

GyGO数据集概述

数据集基本信息

  • 名称: GyGO
  • 类型: 视频对象分割数据集
  • 领域: 电子商务
  • 包含: 131个训练序列和24个验证序列
  • 视频特性: 每个序列1-10秒,由手持智能手机摄像头拍摄,后期处理为约5 fps
  • 标注: 由Amazon Mechanical Turk工作者进行标注

数据集结构

. ├── JPEGImages # 包含RGB视频的文件夹 | ├── 480p | └── original ├── Annotations # 包含二进制标注的文件夹 | ├── 480p | └── original └── ImageSets ├── Train.txt # 包含所有训练序列的列表 ├── trainval.txt # 包含所有训练和验证序列的列表 └── val.txt # 包含所有验证序列的列表

下载链接

基准测试

  • 测试环境: 使用P100 GPU进行测试
  • 性能指标: Jaccard指数(J)
  • 测试结果:
    • Gygo-OSMN: 在GyGO验证集上,Jaccard指数为96.3%,处理速度为7 FPS;在DAVIS16验证集上,Jaccard指数为80.0%,处理速度为8 FPS。
    • Gygo-Deeplabv3+: 在GyGO验证集上,Jaccard指数为93.3%,处理速度为8.27 FPS;在DAVIS16验证集上,Jaccard指数为75.9%,处理速度为8.53 FPS。
    • 原始OSMN: 在GyGO验证集上,Jaccard指数为95.1%,处理速度为7 FPS;在DAVIS16验证集上,Jaccard指数为73.6%,处理速度为8 FPS。
    • 原始OSVOS: 在GyGO验证集上,Jaccard指数为93%,处理速度为0.11 FPS。

数据集目标

  • 填补数据空缺: 当前视频对象分割领域数据严重不足,希望通过发布GyGO数据集提升整体性能。
  • 促进开放共享: 鼓励研究者共享数据和成果,推动视频对象分割领域的进步。
搜集汇总
数据集介绍
main_image_url
构建方式
GyGO数据集的构建过程体现了对电子商务场景的深度关注。该数据集包含131个训练序列和24个验证序列,每个序列时长为1至10秒,均通过手持智能手机拍摄完成。拍摄后,视频帧率被降低至约5帧每秒,并由亚马逊Mechanical Turk工作者进行高质量标注。这一过程确保了数据的多样性和标注的精确性,为视频对象分割任务提供了坚实的基础。
特点
GyGO数据集的特点在于其专注于电子商务场景,视频中的对象涵盖了玩具、衣物、模型和办公用品等多种语义类别。尽管视频序列相对简单,缺乏遮挡和快速运动等复杂性因素,但其多样化的对象类别为模型训练提供了丰富的语义信息。此外,数据集的高质量标注和帧率调整进一步提升了其在视频对象分割任务中的实用性。
使用方法
GyGO数据集的使用方法包括下载和解压数据集文件,文件结构包含JPEGImages、Annotations和ImageSets三个主要文件夹。JPEGImages文件夹存储RGB视频,Annotations文件夹包含二进制标注,ImageSets文件夹则提供了训练和验证序列的列表。研究人员可以通过加载这些数据,结合现有的视频对象分割算法进行模型训练和验证。此外,数据集还提供了初始基准测试结果,供研究人员参考和比较。
背景与挑战
背景概述
GyGO数据集由Visualead团队于2017年发布,专注于电子商务领域的视频对象分割任务。该数据集包含131个训练序列和24个验证序列,每个序列时长1至10秒,由手持智能手机拍摄,并在后期处理中降帧至约5帧每秒。GyGO的标注工作通过亚马逊Mechanical Turk平台完成,确保了高质量的标注数据。该数据集的发布旨在填补视频对象分割领域数据匮乏的现状,并通过与DAVIS数据集的联合训练提升模型性能。GyGO的多样性体现在其视频中对象的语义类别广泛,涵盖了玩具、衣物、模型和办公用品等。该数据集的发布不仅推动了视频对象分割技术的发展,还促进了开放共享的研究文化。
当前挑战
GyGO数据集在构建和应用过程中面临多重挑战。首先,视频对象分割任务本身具有较高的复杂性,尤其是在处理对象遮挡、快速运动等场景时,模型的表现往往不尽如人意。尽管GyGO的视频序列相对简单,但其多样化的语义类别仍对模型的泛化能力提出了较高要求。其次,数据集的构建过程中,标注工作依赖于众包平台,虽然确保了标注质量,但也引入了标注一致性和准确性的潜在问题。此外,尽管GyGO与DAVIS数据集的联合训练显示出性能提升,但如何进一步优化模型以适应电子商务场景的特定需求,仍需深入研究。最后,数据集的规模相对较小,限制了其在更广泛场景中的应用潜力,未来需要进一步扩充数据量以支持更复杂的任务。
常用场景
经典使用场景
在电子商务领域,视频对象分割技术对于提升用户体验和优化产品展示具有重要意义。GyGO数据集通过提供高质量的视频序列和标注,成为研究视频对象分割算法的经典工具。其应用场景主要集中在电子商务平台中,用于自动识别和分割视频中的商品对象,从而支持智能推荐、虚拟试衣等功能。
衍生相关工作
GyGO数据集的发布激发了大量相关研究,尤其是在视频对象分割算法的优化和应用扩展方面。基于GyGO的研究工作包括改进的OSMN和DeeplabV3+模型,这些模型在电子商务场景中表现出色。此外,GyGO还推动了与其他数据集(如DAVIS)的联合训练研究,进一步提升了视频对象分割技术的通用性和鲁棒性。
数据集最近研究
最新研究方向
在电子商务领域,视频对象分割技术正逐渐成为研究热点。GyGO数据集作为该领域的重要资源,其最新研究方向主要集中在提升视频对象分割的精度与效率。通过结合GyGO与DAVIS数据集进行联合训练,研究者们发现能够显著提高模型的推理效果。此外,GyGO数据集的应用还推动了零样本学习和在线微调技术的发展,这些技术在电子商务视频分析中具有广泛的应用前景。随着电子商务的快速发展,GyGO数据集的研究不仅为视频对象分割算法提供了新的基准,也为相关技术的实际应用奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作