Manga109|漫画研究数据集|图像处理数据集
收藏
- Manga109数据集首次发表,由东京大学和日本国立情报学研究所联合发布,旨在为漫画图像分析提供一个标准化的数据集。
- Manga109数据集首次应用于学术研究,特别是在计算机视觉和自然语言处理领域,推动了漫画内容理解和分析技术的发展。
- Manga109数据集的扩展版本发布,增加了更多的漫画样本和详细的标注信息,进一步提升了其在学术界的影响力。
- Manga109数据集被广泛应用于多个国际会议和竞赛中,成为评估和比较漫画分析算法性能的标准数据集之一。
- 1Manga109: A Large-scale Dataset of Manga with 109 TitlesUniversity of Tokyo · 2017年
- 2Manga OCR: A New Dataset and Baseline for Text Recognition in MangaUniversity of Tokyo · 2021年
- 3Manga Character Recognition Using Deep Learning TechniquesKyushu Institute of Technology · 2020年
- 4Exploring the Use of Manga109 Dataset for Scene Understanding in MangaUniversity of Tokyo · 2019年
- 5Manga109-s: A Dataset for Scene Understanding in MangaUniversity of Tokyo · 2022年
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
data
食神オリジナルデータ
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Houston2013, Berlin, Augsburg
本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。
arXiv 收录