TreeBASE2|系统发育学数据集|生物信息学数据集
收藏
- TreeBASE2的前身TreeBASE首次发表,作为生物系统学领域的公共数据库,用于存储和共享系统发育树数据。
- TreeBASE2正式发布,作为TreeBASE的升级版本,提供更强大的数据存储和检索功能,支持更多的数据类型和分析工具。
- TreeBASE2与多个国际生物信息学数据库和平台建立合作关系,进一步扩大其数据共享和互操作性。
- TreeBASE2引入新的用户界面和数据可视化工具,提升用户体验和数据分析效率。
- TreeBASE2进行大规模更新,增加对大规模基因组数据的处理能力,并优化其数据存储和检索算法。
- 1TreeBASE2: A Controlled Vocabulary and Ontology for Phylogenetic TreesUniversity of California, Berkeley · 2018年
- 2Phylogenetic Data and the TreeBASE2 Database: A Comprehensive Resource for Comparative BiologyUniversity of California, Davis · 2020年
- 3TreeBASE2: A New Era in Phylogenetic Data Sharing and IntegrationUniversity of California, San Diego · 2021年
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
LendingClub Loan Data
Loan & Rejects (2007 to 2019Q3)
kaggle 收录
望诊影像数据集及诊断文本数据集
中医望诊数据集包含舌诊图片3000张、面诊图片2000张、目诊图片3000张,舌诊图片的内容部分为舌头(属口颌系统),面诊图片的内容部分包括了面和唇(属其他系统)、眼睛部分做了脱敏处理,目诊图片的内容部分为眼睛(属感觉系统)。该数据集提供舌诊图像的齿痕、裂纹、点刺、苔色、胖瘦的标注信息;以及面诊图像的唇色、唇形、面神的标注信息;目诊图像的特征属性包括颜色名称、颜色HSL值、大小、特征出处。
国家人口健康科学数据中心 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录