2017 Contours
收藏The MaizeGDB
The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。
www.maizegdb.org 收录
Other-Animals-10
该数据集包含103张图像,每张图像对应一个动物标签,标签类别包括熊、蜜蜂、甲虫等34种动物。数据集仅包含一个训练集,用于训练模型。
huggingface 收录
中国陆地实际蒸散发数据集(1982-2024)
本数据集为基于蒸散发互补方法研制的中国陆地蒸散发数据产品v2.0。输入数据包括CMFD v2的向下短波辐射、向下长波辐射、气温、湿度、风速、气压,GLASS反照率、发射率等,以及ERA5-Land地表温度等。本数据集时间跨度为1982年-2024年,空间范围为中国陆地。本数据集可为研究长时间尺度水循环和气候变化提供基础。陆地实际蒸散发 (Ea),单位: mm/month。 时间分辨率为逐月;空间分辨率为0.1°。数据类型:NetCDF;本数据仅为陆地实际蒸散发,不含水面。
国家青藏高原科学数据中心 收录
MMOral
MMOral是一个针对全景X光片解读的大规模多模态指令数据集和基准。它包括20,563张带有1.3百万条指令跟随实例的注释图像,涵盖了多种任务类型,如属性提取、报告生成、视觉问答和基于图像的对话。此外,我们还提出了MMOral-Bench,这是一个涵盖牙科五个关键诊断维度的综合评估套件。我们评估了64个LVLMs在MMOral-Bench上的表现,发现即使是表现最好的模型GPT-4o,也只能达到41.45%的准确率,这揭示了当前模型在这一领域的显著局限性。为了促进该特定领域的发展,我们还提出了OralGPT,它使用我们精心策划的MMOral指令数据集对Qwen2.5-VL-7B进行监督微调。值得注意的是,一个SFT周期就为LVLMs带来了显著的性能提升,例如,OralGPT表现出24.73%的改进。MMOral和OralGPT都具有作为智能牙科关键基础的巨大潜力,并使牙科领域中的多模态AI系统更具临床意义。数据集、模型、基准和评估套件可在上述网址获取。
arXiv 收录
OECD Statistics
OECD Statistics 数据集包含了经济合作与发展组织(OECD)发布的各种统计数据,涵盖了经济、社会、环境、教育、科技等多个领域。数据集提供了详细的指标和时间序列数据,帮助研究人员和政策制定者分析和理解全球经济和社会发展趋势。
stats.oecd.org 收录
