Data from: Mutation is a sufficient and robust predictor of genetic variation for mitotic spindle traits in Caenorhabditis elegans
收藏OpenPose
OpenPose数据集包含人体姿态估计的相关数据,主要用于训练和评估人体姿态检测算法。数据集包括多视角的图像和视频,标注了人体关键点位置,适用于研究人体姿态识别和动作分析。
github.com 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
GLUCOBENCH
GLUCOBENCH是由德克萨斯A&M大学统计系和电气与计算机工程系共同创建的一个综合数据集,旨在为连续血糖监测(CGM)数据的预测模型提供标准化的评估平台。该数据集包含五个公开的CGM数据集,涵盖不同规模和人口特征,数据量从5个到超过200个患者不等。数据集的创建过程包括数据预处理、插值和分割,确保数据质量。GLUCOBENCH主要应用于糖尿病管理领域,旨在通过提高血糖轨迹预测的准确性和不确定性量化,改善糖尿病患者的治疗效果和自主管理能力。
arXiv 收录
Vending-Bench
Vending-Bench是一个模拟环境,专为测试基于大型语言模型(LLM)的智能体在长期连贯性方面的能力而设计。智能体需要管理一个简单且长期的商业场景:操作自动售货机。该数据集模拟了智能体与供应商的沟通、客户购买行为等,以评估智能体在长期时间跨度(超过20M tokens的运行)上的持续、连贯决策能力。
arXiv 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录