COCOStuff|计算机视觉数据集|场景理解数据集
收藏
- COCOStuff数据集首次发表,由Holger Caesar、Jasper Uijlings和Vittorio Ferrari共同提出,旨在扩展COCO数据集的语义分割任务。
- COCOStuff数据集在CVPR 2017上正式发布,包含164,000张图像和172个语义类别,显著提升了语义分割任务的多样性和复杂性。
- COCOStuff数据集首次应用于语义分割和场景理解研究,成为该领域的重要基准数据集之一。
- COCOStuff数据集在多个国际竞赛中被广泛使用,如COCO 2019挑战赛,进一步验证了其在语义分割任务中的有效性。
- COCOStuff数据集的扩展版本发布,增加了更多的图像和类别,提升了数据集的覆盖范围和应用广度。
- 1COCO-Stuff: Thing and Stuff Classes in ContextUniversity of Edinburgh, University of Amsterdam · 2018年
- 2Panoptic SegmentationUniversity of Oxford, University of Edinburgh · 2019年
- 3A Benchmark for Semantic Segmentation of Natural Scenes with Dense AnnotationsUniversity of Amsterdam · 2019年
- 4DensePose: Dense Human Pose Estimation In The WildFacebook AI Research · 2018年
- 5Learning to Segment Every ThingFacebook AI Research, Cornell University · 2018年
MUStARD++
MUStARD++是一个多模态讽刺检测数据集,由萨里大学创建,旨在通过语言、语音和视觉线索全面捕捉讽刺现象。数据集包含1202个视频样本,来源于多个流行电视节目,通过手动标注确保高质量的讽刺标签。创建过程中,研究者们通过多轮标注和验证确保数据的准确性和多样性。该数据集主要应用于自动讽刺检测,帮助机器理解并识别讽刺语境,解决讽刺识别中的多模态挑战。
arXiv 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
FMA (Free Music Archive)
免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集
OpenDataLab 收录
中国30米分辨率土壤可蚀性因子数据集
该数据集为2018年中国30米分辨率土壤可蚀性因子(K)栅格数据,数据是利用中国1979-1994年的全国第二次土壤普查的成果数据进行计算;再利用径流小区观测数据修正计算结果;将修订结果利用反距离权重插值法插值生成栅格数据。特殊地类河湖库塘、冰川及永久积雪、裸岩土地类型K因子值强制赋值为0。如果用户采用的土地利用精度较高,建议重新对以下土地类型的K因子强制赋值为0:河湖库塘、冰川及永久积雪、裸岩。如果有K值为0,但不属于上述类型的,K因子可按如下原则:取邻近相同土地类型图斑的K值,或取与该图斑邻近且不等于0的所有图斑K值的平均值。
国家地球系统科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录