five

tyang816/MF_ESMFold

收藏
Hugging Face2024-05-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/tyang816/MF_ESMFold
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - text-classification tags: - protein - downstream task --- # GO-MF Dataset with ESMFold Structural Sequence - Description: Molecular Function of Gene Ontology (GO) project. - Number of labels: 489 - Problem Type: multi_label_classification - Columns: - aa_seq: protein amino acid sequence - foldseek_seq: foldseek 20 3di structural sequence - ss8_seq: DSSP 8 secondary structure sequence # Github Simple, Efficient and Scalable Structure-aware Adapter Boosts Protein Language Models https://github.com/tyang816/SES-Adapter # Citation Please cite our work if you use our dataset. ``` @article{tan2024ses-adapter, title={Simple, Efficient and Scalable Structure-aware Adapter Boosts Protein Language Models}, author={Tan, Yang and Li, Mingchen and Zhou, Bingxin and Zhong, Bozitao and Zheng, Lirong and Tan, Pan and Zhou, Ziyi and Yu, Huiqun and Fan, Guisheng and Hong, Liang}, journal={arXiv preprint arXiv:2404.14850}, year={2024} } ```
提供机构:
tyang816
原始信息汇总

GO-MF Dataset with ESMFold Structural Sequence

数据集概述

  • 描述: 分子功能基因本体(GO)项目。
  • 标签数量: 489
  • 问题类型: 多标签分类
  • 数据列:
    • aa_seq: 蛋白质氨基酸序列
    • foldseek_seq: foldseek 20 3di结构序列
    • ss8_seq: DSSP 8二级结构序列

许可证

  • 许可证: Apache-2.0

任务类别

  • 任务类别: 文本分类

标签

  • 标签:
    • 蛋白质
    • 下游任务
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作