Flickr30k Entities|图像描述数据集|实体识别数据集
收藏
- Flickr30k Entities数据集首次发表,由Bryan A. Plummer等人提出,旨在解决图像描述中的细粒度实体识别问题。
- 该数据集首次应用于图像与文本的多模态研究,特别是在视觉问答(VQA)和图像描述生成领域,展示了其在跨模态理解中的潜力。
- Flickr30k Entities被广泛用于多模态机器学习算法的评估,成为该领域的一个重要基准数据集。
- 随着深度学习技术的发展,该数据集被用于训练和验证更复杂的神经网络模型,进一步推动了图像与文本联合理解的研究。
- Flickr30k Entities数据集的扩展版本发布,增加了更多的注释和实体信息,以适应日益增长的跨模态研究需求。
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
CBIS-DDSM
该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。
github 收录
数据堂—103,282张驾驶员行为标注数据
103,282张驾驶员行为标注数据涵盖多年龄段、多时间段、多种行为(危险驾驶行为、疲劳驾驶行为、视线偏移行为)。在标注方面,对人脸72关键点(包括瞳孔)、人脸属性、手势检测框、安全带检测框、瞳孔关键点、行为类别进行标注。本套驾驶员行为标注数据可用于驾驶员行为分析等任务
魔搭社区 收录