five

CleverThis/uniprotkb_obsolete_entries_50000000

收藏
Hugging Face2026-01-01 更新2026-01-03 收录
下载链接:
https://hf-mirror.com/datasets/CleverThis/uniprotkb_obsolete_entries_50000000
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含功能性注释的全面蛋白质知识库,源自uniprotkb_obsolete_entries_50000000的RDF三元组,已转换为HuggingFace数据集格式以便于在机器学习流程中使用。数据集格式为原始RDF转换为HuggingFace数据集,大小为0.392 GB(解压后),包含约9000万蛋白质条目和约34亿三元组,原始许可证为CC BY 4.0。推荐用于蛋白质研究、分子生物学和功能基因组学。数据集采用标准无损格式表示RDF数据,保留了原始RDF知识图谱的所有语义信息,支持完美往返转换。

Comprehensive protein knowledgebase with functional annotations. This dataset contains RDF triples from uniprotkb_obsolete_entries_50000000 converted to HuggingFace dataset format for easy use in machine learning pipelines. Format: Originally rdf, converted to HuggingFace Dataset. Size: 0.392 GB (extracted). Entities: ~90M protein entries. Triples: ~3.4B. Original License: CC BY 4.0. Recommended Use: Protein research, molecular biology, functional genomics. The dataset uses a standard lossless format for representing RDF data in HuggingFace Datasets, preserving all semantic information from the original RDF knowledge graph.
提供机构:
CleverThis
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作