KEGG PATHWAY|生物信息学数据集|代谢途径数据集
收藏
- KEGG PATHWAY数据集首次发表,标志着生物信息学领域中代谢途径和基因功能研究的新起点。
- KEGG PATHWAY首次应用于基因组学研究,为基因组注释和功能预测提供了重要工具。
- KEGG PATHWAY数据库扩展至涵盖更多物种的代谢途径,增强了其在跨物种比较研究中的应用价值。
- KEGG PATHWAY引入网络分析工具,使得研究人员能够更深入地探索生物网络的复杂性。
- KEGG PATHWAY数据集开始支持高通量数据整合,促进了系统生物学研究的发展。
- KEGG PATHWAY数据库更新至包含超过25,000条代谢途径,成为全球生物信息学研究的重要资源。
- KEGG PATHWAY进一步整合人工智能技术,提升了数据分析的自动化和精确度。
CHiME-5
CHiME-5是关于自动语音识别处理技术的数据集。该数据集来自第5个CHiME挑战,包括在真实家庭环境中进行远程多麦克风会话的任务。从晚餐场景中提取语音素材,数据集获得自然对话语音数据,并由6个Kinect麦克风阵列和4个双耳麦克风对记录。 数据集包含单阵列轨道与多阵列轨道语言建模,以及用于阵列同步,语音增强,常规和端到端ASR的数据收集过程,任务和基线系统。
OpenDataLab 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
