MMSci|科学研究数据集|多模态模型数据集
收藏MMSci 数据集概述
数据集
- 目录:
mmsci-data
- 内容:
- rawdata: 包含所有文章和相关图表的源数据集。
- benchmark: 包含用于基准评估的测试/开发集和用于视觉指令调优的训练数据。
- pretraindata: 包含用于预训练模型的交错数据。
- 详细信息: 数据集的详细信息可在 mmsci-data/DATACARD.md 中找到。
- 许可证: 数据集的许可证条款可在 mmsci-data/LICENSE 中查看。
基准评估与视觉指令调优
- 目录:
mmsci-exps
- 内容: 包含进行视觉指令调优和基准评估的指令和脚本。
- 详细指南: 详细指南可在 mmsci-exps/README.md 中找到。
预训练交错数据
- 目录:
mmsci-data/pretraindata
- 内容: 使用交错数据继续预训练 LLaMA2-7B 模型。
- 步骤:
- 设置 VILA: 使用 VILA 代码库进行预训练。
- 注册 MMSci 数据: 确保数据已准备好并注册到 VILA 中。
- 预训练: 分为两个阶段:
- 阶段 1: 对齐文本和视觉模态。
- 阶段 2: 使用准备好的数据进行预训练。
材料生成
- 内容: 使用预训练模型进行材料生成任务的微调。
- 步骤:
- 安装: 使用 crystal-text-llm 代码库。
- 微调: 对预训练模型进行微调。
- 采样: 使用微调后的模型生成样本。
- 评估: 评估生成的材料。
资源

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
DermNet
DermNet是一个包含皮肤病图像的数据集,涵盖了多种皮肤病类型,如痤疮、湿疹、牛皮癣等。该数据集主要用于皮肤病诊断和研究。
www.dermnetnz.org 收录