AlphaFold Protein Structure Database|蛋白质结构预测数据集|生物信息学数据集
收藏
- DeepMind首次发布AlphaFold,在第13届全球蛋白质结构预测竞赛(CASP)中取得突破性成绩,准确预测了大部分蛋白质的三维结构。
- AlphaFold 2在CASP14中再次取得显著进展,其预测的蛋白质结构与实验测定的结构高度一致,标志着蛋白质结构预测领域的重大突破。
- DeepMind与欧洲生物信息学研究所(EMBL-EBI)合作,正式发布AlphaFold Protein Structure Database,提供超过35万个蛋白质结构的公开访问,涵盖了人类、细菌、植物和病毒等多种生物的蛋白质。
- AlphaFold数据库扩展至超过2亿个蛋白质结构,覆盖了几乎所有已知蛋白质序列,极大地推动了生物学研究和药物开发领域的发展。
- 1Highly accurate protein structure prediction with AlphaFoldDeepMind · 2021年
- 2Accurate prediction of protein structures and interactions using a three-track neural networkUniversity of Washington · 2021年
- 3Protein complex prediction with AlphaFold-MultimerDeepMind · 2022年
- 4Improved protein structure prediction using potentials from deep learningDeepMind · 2019年
- 5AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy modelsEuropean Molecular Biology Laboratory · 2022年
Med-MAT
Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。
huggingface 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
WLASL, MSASL, NMFs-CSL, SLR500, Slovo, BOBSL, 27 Class Sign Language Dataset, AUTSL, BosphorusSign22k, GSL, LSA16, LSA64, Rendered Handpose Dataset, YouTube-ASL, LSFB-ISOL, ASLLVD, AASL, KArSL, BdSLImset, HaGRID, Phoenix-2014, Phoenix-2014T
该仓库收集了多种与手语识别和翻译相关的数据集,旨在为研究者、开发者和爱好者提供一个集中的资源。数据集包括不同类型(如RGB、深度、骨骼)和来自不同国家的数据,用于支持手语识别和翻译技术的研究。
github 收录
PQAref
PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。
huggingface 收录