five

rouskinlab/rnacentral_synthetic

收藏
Hugging Face2024-02-27 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/rouskinlab/rnacentral_synthetic
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit language: - en tags: - chemistry - biology` author: Silvi Rouskin source: data.json date: 2024-02-26-18-51-30 --- # Data types - **sequence**: 226729 datapoints - **structure**: 226729 datapoints # Conversion report Over a total of 226729 datapoints, there are: ### OUTPUT - ALL: 226729 valid datapoints - INCLUDED: 0 duplicate sequences with different structure / dms / shape ### MODIFIED - 0 multiple sequences with the same reference (renamed reference) ### FILTERED OUT - 0 invalid datapoints (ex: sequence with non-regular characters) - 0 datapoints with bad structures - 0 duplicate sequences with the same structure / dms / shape
提供机构:
rouskinlab
原始信息汇总

数据集概述

基本信息

  • 授权许可: MIT
  • 语言: 英语
  • 标签: 化学, 生物学
  • 作者: Silvi Rouskin
  • 数据来源: data.json
  • 日期: 2024年2月26日 18:51:30

数据类型

  • 序列: 226729个数据点
  • 结构: 226729个数据点

数据处理报告

  • 总数据点: 226729个
  • 有效数据点: 226729个
  • 包含的重复序列: 0个(具有不同结构/dms/形状)
  • 修改的序列: 0个(具有相同参考,已重命名参考)
  • 过滤掉的数据点: 0个(无效数据点,包含非标准字符的序列,结构不良的数据点,具有相同结构/dms/形状的重复序列)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作