Cistrome DB|生物学数据集|基因调控数据集
收藏
- Cistrome DB首次发表,作为一个整合了多种基因调控元件和表观遗传数据的公共数据库,旨在提供全面的基因调控网络信息。
- Cistrome DB首次应用于生物信息学研究,支持了多项关于基因调控和表观遗传学的科学研究项目。
- Cistrome DB进行了重大更新,增加了新的数据类型和功能,提升了数据库的查询和分析能力。
- Cistrome DB引入了机器学习算法,以提高数据分析的准确性和效率,进一步推动了基因调控研究的发展。
- Cistrome DB与多个国际研究机构合作,扩展了其数据覆盖范围,包括更多物种和细胞类型的表观遗传数据。
- 1Cistrome: An Integrative Platform for Transcriptional Regulation StudiesHarvard University · 2011年
- 2Cistrome Data Browser: A Data Portal for ChIP-Seq and Chromatin Accessibility Data in Human and MouseHarvard University · 2017年
- 3Cistrome Cancer: A Web Resource for Integrative Gene Regulation Studies in Human CancersHarvard University · 2016年
- 4Cistrome DB: A Comprehensive Database for Integrative Analysis of ChIP-Seq DataHarvard University · 2018年
- 5Cistrome DB: An Integrative Platform for Transcriptional Regulation StudiesHarvard University · 2011年
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
suno
该数据集包含由人工智能生成的659,788首歌曲的元数据,这些歌曲由suno.com平台生成。数据集是多语言的,主要语言为英语,但也包含日语和其他语言的歌词和标题。每个歌曲的元数据包括唯一标识符、视频和音频URL、封面图像URL、AI模型版本、生成状态、创作者信息等。数据集根据CC0许可证公开,允许任何用途的使用、修改和分发。
huggingface 收录
Chinese-Poetry-Corpus
本语料库收集自互联网,包含了从先秦到当代的古诗词数据,以CSV格式进行存储。经过去重后,包含诗词共计1014508首。古诗词按朝代进行划分,存储于文件夹下,命名规则为朝代.csv。每首诗词数据包含五个字段,分别为标题、朝代、作者、体裁、内容。
github 收录
Global Burden of Disease Study (GBD)
全球疾病负担研究(GBD)数据集提供了全球范围内疾病、伤害和风险因素的详细统计数据。该数据集包括了各种健康指标,如死亡率、发病率、伤残调整生命年(DALYs)等,涵盖了多个国家和地区。数据集还提供了不同年龄组、性别和时间段的详细分析。
ghdx.healthdata.org 收录
NHANES
NHANES(National Health and Nutrition Examination Survey)是美国国家健康与营养调查的数据集,旨在评估美国人口的健康和营养状况。数据集包括健康检查、实验室测试、问卷调查等多方面的信息。
www.cdc.gov 收录