DUD-E|药物发现数据集|虚拟筛选数据集
收藏
- DUD-E数据集的前身DUD(Directory of Useful Decoys)首次发表,旨在提供高质量的虚拟化合物库,用于评估分子对接算法的性能。
- DUD数据集首次应用于分子对接研究,显著提升了对接算法的准确性和可靠性。
- DUD-E(Directory of Useful Decoys, Enhanced)数据集正式发布,相较于DUD,DUD-E包含了更多的虚拟化合物和更广泛的靶标类型,极大地扩展了其应用范围。
- DUD-E数据集被广泛应用于药物发现和分子对接研究,成为评估和优化对接算法的标准数据集之一。
- DUD-E数据集的更新版本发布,进一步优化了虚拟化合物的质量和多样性,提升了其在药物设计中的应用价值。
- 1Directory of Useful Decoys, Enhanced (DUD-E): Better Ligands and Decoys for Better BenchmarkingUniversity of California, San Francisco · 2012年
- 2Benchmarking Molecular Docking and Virtual Screening with the DUD-E DatasetUniversity of California, San Francisco · 2018年
- 3Machine Learning in Drug Discovery: A Review of the Recent LiteratureUniversity of California, San Francisco · 2020年
- 4Deep Learning for Molecular Design: A Review of the State of the ArtUniversity of California, San Francisco · 2019年
- 5Advances in Computational Drug Discovery: A Review of Recent DevelopmentsUniversity of California, San Francisco · 2021年
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
PROSLU
PROSLU数据集是由哈尔滨工业大学社会计算与信息检索研究中心和华为技术有限公司共同创建的,包含超过5000条中文语句,每条语句都配有详细的个人资料信息,如知识图谱、用户资料和上下文感知信息。数据集通过人工标注确保高质量,旨在解决在语义模糊的实际场景中,传统基于文本的口语理解模型可能无法准确识别意图和槽位的问题。该数据集的应用领域主要集中在提高对话系统在复杂环境下的理解和响应能力,特别是在用户意图不明确或语句具有多重含义的情况下。
arXiv 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录