five

NewsStories|新闻媒体数据集|多模态数据数据集

收藏
OpenDataLab2025-03-29 更新2024-05-09 收录
新闻媒体
多模态数据
下载链接:
https://opendatalab.org.cn/OpenDataLab/NewsStories
下载链接
链接失效反馈
资源简介:
我们引入了一个名为NewsStories的大规模多模式数据集,其中包含超过3100万篇文章,22m张图像和100万个视频。
提供机构:
OpenDataLab
创建时间:
2022-11-02
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

UAVDT Dataset

The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.

datasetninja.com 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

全国兴趣点(POI)数据

  POI(Point of Interest),即兴趣点,一个POI可以是餐厅、超市、景点、酒店、车站、停车场等。兴趣点通常包含四方面信息,分别为名称、类别、坐标、分类。其中,分类一般有一级分类和二级分类,每个分类都有相应的行业的代码和名称一一对应。  POI包含的信息及其衍生信息主要包含三个部分:

CnOpenData 收录

LMHLD (Large-scale Multi-source High-resolution Landslide Dataset)

LMHLD是一个大规模多源高分辨率滑坡数据集,由中国地质大学(武汉)未来技术学院构建。该数据集收集了全球七个研究区域的遥感图像,包括中国汶川、巴西里约热内卢、尼泊尔戈尔卡、中国九寨沟、中国台湾、日本北海道和意大利艾米利亚-罗马涅,涵盖了不同触发条件下的多种类型滑坡。数据集包含25365个不同大小的斑块,以适应不同尺度的滑坡检测需求,为基于深度学习的滑坡检测提供了丰富的训练样本。

arXiv 收录