five

pretrain datasets for ERNIE-RNA

收藏
Figshare2024-12-17 更新2026-04-08 收录
下载链接:
https://figshare.com/articles/dataset/pretrain_datasets_for_ERNIE-RNA/28034282/1
下载链接
链接失效反馈
官方服务:
资源简介:
pretrain datasets for ERNIE-RNA<br>Dataset0: RNAcentral database filtered for sequences &lt;1024nt<br>Dataset1: Dataset0 excluding rRNA and tRNA sequences<br>Dataset2: Dataset0 retaining 20% rRNA/tRNA and all other RNA categories<br>Dataset3: Random sample from Dataset0 matched to Dataset2 size<br>Dataset4: Dataset0 excluding lncRNA sequencesDataset5: Random 2.72M sequences (860M token) subset from Dataset0 for scaling analysis<br>Dataset6: Random 0.27M sequences (86M token) subset from Dataset0 for scaling analysis
提供机构:
Zhang, Zhaoyu
创建时间:
2024-12-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作