CCDC 2033908: Experimental Crystal Structure Determination|晶体结构数据集|化学实验数据集
收藏学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
MMOral
MMOral是一个针对全景X光片解读的大规模多模态指令数据集和基准。它包括20,563张带有1.3百万条指令跟随实例的注释图像,涵盖了多种任务类型,如属性提取、报告生成、视觉问答和基于图像的对话。此外,我们还提出了MMOral-Bench,这是一个涵盖牙科五个关键诊断维度的综合评估套件。我们评估了64个LVLMs在MMOral-Bench上的表现,发现即使是表现最好的模型GPT-4o,也只能达到41.45%的准确率,这揭示了当前模型在这一领域的显著局限性。为了促进该特定领域的发展,我们还提出了OralGPT,它使用我们精心策划的MMOral指令数据集对Qwen2.5-VL-7B进行监督微调。值得注意的是,一个SFT周期就为LVLMs带来了显著的性能提升,例如,OralGPT表现出24.73%的改进。MMOral和OralGPT都具有作为智能牙科关键基础的巨大潜力,并使牙科领域中的多模态AI系统更具临床意义。数据集、模型、基准和评估套件可在上述网址获取。
arXiv 收录
DIV2K
displayName: DIV2K labelTypes: [] license: - DIV2K Custom mediaTypes: - Image paperUrl: https://doi.org/10.1109/CVPRW.2017.150 publishDate: "2017" publishUrl: https://data.vision.ee.ethz.ch/cvl/DIV2K/ publisher: - ETH Zurich tags: - RGB Image taskTypes: - Image Super-resolution --- # 数据集介绍 ## 简介 DIV2K数据集分为: 列车数据: 从800高清高分辨率图像开始,我们获得相应的低分辨率图像,并为2、3和4个降尺度因子提供高分辨率和低分辨率图像 验证数据: 100高清晰度高分辨率图像用于生成低分辨率对应图像,低分辨率从挑战开始提供,并用于参与者从验证服务器获得在线反馈; 当挑战的最后阶段开始时,高分辨率图像将被释放。 测试数据: 100多样的图像用于生成低分辨率的相应图像; 参与者将在最终评估阶段开始时收到低分辨率图像,并在挑战结束并确定获胜者后宣布结果。 ## 引文 ``` @inproceedings{agustsson2017ntire, title={Ntire 2017 challenge on single image super-resolution: Dataset and study}, author={Agustsson, Eirikur and Timofte, Radu}, booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition workshops}, pages={126--135}, year={2017} } ``` ## Download dataset :modelscope-code[]{type="git"}
魔搭社区 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
