Data from: Population structure of mountain pine beetle symbiont Leptographium longiclavatum and the implication on the multipartite beetle-fungi relationships|生态学数据集|真菌学数据集
收藏中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。时间为北京时间。
国家海洋科学数据中心 收录
GPQA
GPQA是一个由生物学、物理学和化学领域的专家编写的448个多选题数据集。该数据集的特点是问题质量高且极其困难,即使是具有博士学位或在读博士的专家也仅能达到65%的准确率,而高技能的非专家验证者仅有34%的准确率。数据集旨在用于研究未来AI系统在帮助解答非常困难问题时的可扩展监督方法,特别是在开发新科学知识时。
arXiv 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
GLUCOBENCH
GLUCOBENCH是由德克萨斯A&M大学统计系和电气与计算机工程系共同创建的一个综合数据集,旨在为连续血糖监测(CGM)数据的预测模型提供标准化的评估平台。该数据集包含五个公开的CGM数据集,涵盖不同规模和人口特征,数据量从5个到超过200个患者不等。数据集的创建过程包括数据预处理、插值和分割,确保数据质量。GLUCOBENCH主要应用于糖尿病管理领域,旨在通过提高血糖轨迹预测的准确性和不确定性量化,改善糖尿病患者的治疗效果和自主管理能力。
arXiv 收录
LANDSLIDE DETECTION
该数据集专注于山体滑坡现象的识别与分类,旨在为改进YOLOv8模型提供高质量的训练数据。数据集包含1600幅图像,类别数量为1,具体类别为“LANDSLIDE”。数据集的构建考虑了山体滑坡的多样性与复杂性,确保模型在实际应用中具备良好的泛化能力。
github 收录
