PROTEINS|生物信息学数据集|蛋白质结构分析数据集
收藏
- PROTEINS数据集首次发表,作为蛋白质结构分类的基准数据集。
- PROTEINS数据集首次应用于机器学习领域,用于评估图分类算法的性能。
- PROTEINS数据集被广泛用于图神经网络的研究,成为该领域的重要基准。
- PROTEINS数据集的扩展版本发布,增加了更多的蛋白质结构数据,提升了数据集的多样性和复杂性。
- PROTEINS数据集在生物信息学和计算生物学领域得到进一步应用,支持了多项蛋白质结构预测和分类的研究。
- PROTEINS数据集被用于评估新型图神经网络模型的性能,推动了图神经网络在蛋白质结构分析中的应用。
- 1Protein Data Bank: a computer-based archival file for macromolecular structuresBrookhaven National Laboratory · 1984年
- 2The Protein Data Bank: a historical perspectiveRutgers University · 2008年
- 3The Protein Data Bank: new resources for research and educationRutgers University · 2003年
- 4The Protein Data Bank: a repository of macromolecular structure dataRutgers University · 2000年
- 5The Protein Data Bank: a historical perspectiveRutgers University · 2008年
广东省标准地图
该数据类主要为广东省标准地图信息。标准地图依据中国和世界各国国界线画法标准编制而成。该数据包括广东省全图、区域地图、地级市地图、县(市、区)地图、专题地图、红色印迹地图等分类。
开放广东 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
SPIQA
SPIQA数据集由谷歌研究院和约翰斯·霍普金斯大学共同创建,是首个针对科学研究论文中复杂图表和表格进行多模态问答的大规模数据集。该数据集包含270,194个问题,涉及计算机科学多个领域的研究论文。数据集的创建过程结合了自动和手动筛选,确保了数据的质量和多样性。SPIQA数据集主要用于评估多模态大型语言模型在理解科学论文中的图表和表格方面的能力,旨在提高信息检索和问答系统的性能。
arXiv 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
CWRU bearing fault dataset
CWRU数据集的故障类别被总结为总共十类数据,包括一种正常数据和九种故障数据。该数据集包含两种采样频率的数据,12k Hz和48k Hz,正常数据除外,它只有48k Hz的采样频率。对于这些数据,我们使用12k Hz采样频率的数据。
github 收录