five

Fetal Tissue Annotation Dataset (FeTA)|医学影像数据集|胎儿脑部分割数据集

收藏
arXiv2021-07-07 更新2024-06-21 收录
医学影像
胎儿脑部分割
下载链接:
http://dx.doi.org/10.7303/syn23747212
下载链接
链接失效反馈
资源简介:
FeTA数据集由苏黎世大学儿童医院MR研究中心创建,包含50个手动分割的胎儿脑部磁共振成像数据,涵盖20至33周的妊娠期,分为7种不同组织类别。该数据集旨在作为自动多类语义或实例分割算法的训练数据集,已用于研究如网络训练和转移学习在胎儿脑部分割中的作用。数据集的创建过程涉及从多个临床ssFSE扫描重建胎儿脑部SR体积,并进行手动分割。应用领域包括支持决策制定、产前规划和更好地理解先天性疾病的根本原因。
提供机构:
苏黎世大学儿童医院MR研究中心
创建时间:
2020-10-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
Fetal Tissue Annotation Dataset (FeTA) 的构建基于50个手动分割的胎儿磁共振脑部体积重建,涵盖了20至33周的妊娠期,并分为7种不同的组织类别(外部脑脊液、灰质、白质、脑室、小脑、深层灰质、脑干/脊髓)。数据集的构建过程包括从临床获取的T2加权单次快速自旋回波(ssFSE)扫描中重建超分辨率(SR)体积,并进行手动分割。每个体积的重建质量由三位独立评审员使用Likert量表进行评估,以确保数据集的真实性和适用性。
使用方法
FeTA 数据集主要用于训练和验证自动多类语义或实例分割算法。用户可以通过访问Synapse平台获取数据集,并根据提供的指南进行数据处理和模型训练。数据集的分割挑战也鼓励研究团队开发和提交自动分割算法,以促进胎儿脑部分割技术的发展。通过使用该数据集,研究人员可以开发出更精确和可重复的胎儿脑部分析方法,从而支持产前规划和先天性疾病的理解。
背景与挑战
背景概述
Fetal Tissue Annotation Dataset (FeTA) 是由 Kelly Payette 等研究者在2021年提出的,旨在为胎儿脑部多组织分割算法提供一个公开的数据库。该数据集包含了50个手动分割的胎儿脑部磁共振成像(MRI)体积重建,涵盖了20至33周的妊娠期,并分为7种不同的组织类别。FeTA的创建是为了促进对正常胎儿和患有先天性疾病的胎儿神经发育的定量分析,从而推动自动多组织胎儿脑部分割算法的发展。该数据集的发布对胎儿MRI领域的研究具有重要意义,因为它填补了该领域缺乏公开、经过整理和标注的真实数据集的空白。
当前挑战
FeTA数据集在构建过程中面临了多个挑战。首先,胎儿脑部的快速发育和复杂的解剖结构变化使得分割任务变得异常复杂。其次,由于胎儿在MRI扫描过程中无法保持静止,图像中常常存在运动伪影和模糊现象,这进一步增加了分割的难度。此外,现有的脑组织分割方法大多基于正常发育的胎儿,而FeTA数据集中包含了病理和非病理的胎儿脑部图像,这要求算法能够处理更为多样和复杂的情况。最后,数据集的标注过程中存在较高的标注者间变异性,这表明需要更多的多标注者共识来提高标注的准确性和一致性。
常用场景
经典使用场景
Fetal Tissue Annotation Dataset (FeTA) 主要用于开发和评估自动多组织胎儿脑部分割算法。该数据集包含50个手动分割的胎儿脑部磁共振成像(MRI)体积,涵盖20至33周的妊娠期,分为7种不同的组织类别。这些数据为研究人员提供了一个基准,用于训练和验证自动分割算法,特别是在处理快速变化的胎儿脑部解剖结构时。
解决学术问题
FeTA 数据集解决了在胎儿脑部MRI图像中缺乏高质量、多类别分割数据的问题。通过提供详细的手动分割标签,该数据集有助于改进自动分割算法的准确性和鲁棒性,特别是在处理病理和非病理胎儿脑部时。这不仅推动了胎儿脑部发育研究,还为先天性疾病的早期诊断和治疗提供了重要工具。
实际应用
FeTA 数据集在临床实践中具有广泛的应用前景。它可以帮助医生和研究人员更准确地分析胎儿脑部的发育情况,特别是在超声图像不清晰或需要更精确诊断的情况下。通过自动分割算法,可以快速且准确地评估胎儿脑部的结构和体积,从而为产前诊断和治疗计划提供有力支持。
数据集最近研究
最新研究方向
在胎儿脑部发育研究领域,Fetal Tissue Annotation Dataset (FeTA) 数据集的最新研究方向主要集中在自动多组织胎儿脑部分割算法的开发与评估。该数据集包含了50个手动分割的病理和非病理胎儿磁共振脑部体积重建,涵盖了20至33周的妊娠期,并分为7种不同的组织类别。研究者们通过该数据集,评估了多种自动多组织分割算法的准确性,展示了数据集在开发自动算法方面的优势。此外,该数据集的发布还促进了胎儿脑部MRI在诊断先天性疾病中的应用,特别是在超声图像不清晰或需要更准确诊断的情况下。通过这些研究,旨在提高对胎儿脑部发育的定量分析能力,从而更好地理解正常胎儿和先天性疾病胎儿的神经发育过程。
相关研究论文
  • 1
    An automatic multi-tissue human fetal brain segmentation benchmark using the Fetal Tissue Annotation Dataset苏黎世大学儿童医院MR研究中心 · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

MultiTalk

MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。

arXiv 收录

OpenPose

OpenPose数据集包含人体姿态估计的相关数据,主要用于训练和评估人体姿态检测算法。数据集包括多视角的图像和视频,标注了人体关键点位置,适用于研究人体姿态识别和动作分析。

github.com 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录