five

ProtT3 蛋白质文本问答数据集

收藏
超神经2024-08-15 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/33482
下载链接
链接失效反馈
官方服务:
资源简介:
ProtT3 数据集由新加坡国立大学、中国科学技术大学和北海道大学的研究团队于 2024 年联合构建,相关论文成果为「ProtT3: Protein-to-Text Generation for Text-based Protein Understanding」,并已入选 ACL 2024 。该数据集为论文研究的预训练数据集。

The ProtT3 dataset was jointly constructed in 2024 by research teams from the National University of Singapore, University of Science and Technology of China, and Hokkaido University. The associated research paper is titled "ProtT3: Protein-to-Text Generation for Text-based Protein Understanding" and has been accepted by ACL 2024. This dataset serves as the pre-training dataset for the research reported in the paper.
创建时间:
2024-08-14
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ProtT3是一个用于蛋白质文本生成和理解的预训练数据集,由Swiss-Prot、ProteinKG25和PDB-QA三个子数据集构成,适用于蛋白质功能、位置和家族等文本描述生成任务。该数据集由多所大学联合构建,相关论文入选ACL 2024,具有较高的学术价值。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务