High temperature expansion via Schwinger-Dyson equations: The planar rotator model on a triangular lattice|统计物理数据集|计算物理数据集
收藏MMOral
MMOral是一个针对全景X光片解读的大规模多模态指令数据集和基准。它包括20,563张带有1.3百万条指令跟随实例的注释图像,涵盖了多种任务类型,如属性提取、报告生成、视觉问答和基于图像的对话。此外,我们还提出了MMOral-Bench,这是一个涵盖牙科五个关键诊断维度的综合评估套件。我们评估了64个LVLMs在MMOral-Bench上的表现,发现即使是表现最好的模型GPT-4o,也只能达到41.45%的准确率,这揭示了当前模型在这一领域的显著局限性。为了促进该特定领域的发展,我们还提出了OralGPT,它使用我们精心策划的MMOral指令数据集对Qwen2.5-VL-7B进行监督微调。值得注意的是,一个SFT周期就为LVLMs带来了显著的性能提升,例如,OralGPT表现出24.73%的改进。MMOral和OralGPT都具有作为智能牙科关键基础的巨大潜力,并使牙科领域中的多模态AI系统更具临床意义。数据集、模型、基准和评估套件可在上述网址获取。
arXiv 收录
CODrone
CODrone 是一个为无人机设计的全面定向目标检测数据集,它准确反映了真实世界条件。该数据集包含来自多个城市在不同光照条件下的广泛标注图像,增强了基准的逼真度。CODrone 包含超过 10,000 张高分辨率图像,捕获自五个城市的真实无人机飞行,涵盖了各种城市和工业环境,包括港口和码头。为了提高鲁棒性和泛化能力,它包括在正常光线、低光和夜间条件下相同场景的图像。我们采用了三种飞行高度和两种常用的相机角度,从而产生了六个不同的视角配置。所有图像都针对 12 个常见对象类别进行了定向边界框标注,总计超过 590,000 个标记实例。总体而言,这项工作构建了一个综合数据集和基准,用于城市无人机场景中的定向目标检测,旨在满足该领域的研究和实践应用需求。
arXiv 收录
PU Dataset
德国帕德博恩大学(PU)轴承故障诊断数据集提供了丰富的轴承故障信号数据,包括内圈、外圈和滚动体故障等多种类型的轴承故障。与其他数据集相比,PU数据集的特色在于包含了大量的电机驱动系统故障数据,为轴承故障诊断研究提供了一个全面的实验平台。
github 收录
XS-Video
XS-Video数据集是由中国科学院自动化研究所MAIS实验室提出的一个大规模现实世界短视频传播数据集。该数据集收集了来自中国五大平台(抖音、快手、西瓜视频、今日头条、哔哩哔哩)的117720个短视频,包含381926个样本和535个话题,覆盖了从发布后的互动信息,如观看、点赞、分享、收藏、粉丝和评论等。数据集通过跨平台指标对齐方法,对视频的长期传播影响力进行评分,分为0到9级,旨在为短视频传播研究提供全面的互动信息和内容特征。
arXiv 收录
AirSafe_DB
该数据集包含了从Plane Crash Info网站上抓取的飞机事故的结构化信息,原始数据为CSV格式,经过AI模型处理后生成了标准化的JSON格式数据。数据集包含5049条记录,每条记录包括事故信息(日期、时间、地点等)、飞机信息(运营商、航班号、机型等)、伤亡统计(总死亡人数、机组人员、乘客、地面人员等)、事故摘要(事故描述、事故类型、飞行阶段等)等内容。数据经过标准化处理,确保数据质量和一致性,适用于分析和研究。
huggingface 收录
