Occurrence Download
收藏flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
Allen Brain Atlas
Allen Brain Atlas 是一个综合性的脑图谱数据库,提供了详细的大脑解剖结构、基因表达数据、神经元连接信息等。该数据集包括了小鼠、人类和其他模式生物的大脑数据,旨在帮助研究人员理解大脑的结构和功能。
portal.brain-map.org 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
DIV2K
displayName: DIV2K labelTypes: [] license: - DIV2K Custom mediaTypes: - Image paperUrl: https://doi.org/10.1109/CVPRW.2017.150 publishDate: "2017" publishUrl: https://data.vision.ee.ethz.ch/cvl/DIV2K/ publisher: - ETH Zurich tags: - RGB Image taskTypes: - Image Super-resolution --- # 数据集介绍 ## 简介 DIV2K数据集分为: 列车数据: 从800高清高分辨率图像开始,我们获得相应的低分辨率图像,并为2、3和4个降尺度因子提供高分辨率和低分辨率图像 验证数据: 100高清晰度高分辨率图像用于生成低分辨率对应图像,低分辨率从挑战开始提供,并用于参与者从验证服务器获得在线反馈; 当挑战的最后阶段开始时,高分辨率图像将被释放。 测试数据: 100多样的图像用于生成低分辨率的相应图像; 参与者将在最终评估阶段开始时收到低分辨率图像,并在挑战结束并确定获胜者后宣布结果。 ## 引文 ``` @inproceedings{agustsson2017ntire, title={Ntire 2017 challenge on single image super-resolution: Dataset and study}, author={Agustsson, Eirikur and Timofte, Radu}, booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition workshops}, pages={126--135}, year={2017} } ``` ## Download dataset :modelscope-code[]{type="git"}
魔搭社区 收录
STKit
STKit是一个旨在增强视觉语言模型(VLMs)在动态视频中进行时空推理能力的数据集,包含现实世界视频的3D注释,详细描述了对象的运动动力学,如旅行距离、速度、移动方向等。该数据集通过结合标注数据和伪标签数据,支持LLaVA-OneVision模型的微调,以生成具备时空推理能力的ST-VLM模型。
arXiv 收录
