five

HICH-IT

收藏
arXiv2024-02-05 更新2024-06-21 收录
下载链接:
https://github.com/CYBUS123456/HICH-IT-Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
HICH-IT数据集由重庆医科大学第一附属医院神经外科创建,专注于高血压性脑内出血(HICH)的研究。该数据集包含数以十万计的CT图像和数千份病例文本,均经过精心标注,旨在提高人工智能在HICH诊断和治疗中的准确性。数据集内容包括电子医疗记录(EMRs)和头部CT图像,特别标注了脑中线、血肿、左右脑室等关键信息。创建过程中,图像使用3D-Slicer进行标注,文本则基于BERT模型进行手动标注。HICH-IT数据集的应用领域广泛,特别是在医学图像处理和EMR分析中,有助于临床专业人员快速理解患者状况,提升诊断和治疗效果。

The HICH-IT dataset was developed by the Department of Neurosurgery, First Affiliated Hospital of Chongqing Medical University, and focuses on research related to hypertensive intracerebral hemorrhage (HICH). This dataset contains hundreds of thousands of CT images and thousands of clinical case texts, all meticulously annotated, with the goal of improving the accuracy of artificial intelligence applications in HICH diagnosis and treatment. The dataset includes electronic medical records (EMRs) and head CT images, with key annotations for critical anatomical structures such as the brain midline, hematoma, left and right cerebral ventricles. During the dataset construction process, CT images were annotated using 3D-Slicer, while the textual data was manually annotated based on the BERT model. The HICH-IT dataset has broad application prospects, particularly in medical image processing and EMR analysis, helping clinical professionals quickly grasp patient conditions and improve diagnostic and therapeutic outcomes.
提供机构:
重庆医科大学第一附属医院神经外科
创建时间:
2024-01-29
搜集汇总
数据集介绍
main_image_url
构建方式
HICH-IT数据集的构建基于真实的医疗记录,涵盖了电子病历(EMR)和头部CT图像。为了保护患者隐私,数据集中已排除与患者隐私密切相关的部分。图像数据使用3D-Slicer进行标注,分割为NIfTI格式的切片图像。图像标注数据包括血肿、左侧脑室、右侧脑室和脑中线四个部分的位置信息。文本数据包括与患者病史、当前状况、体格检查结果、实验室结果和检查报告相关的详细文本信息,所有这些信息都与后续的诊断和治疗密切相关。这些信息已经使用基于BERT模型的方法进行了手动标注,以便于文本信息处理方法,如命名实体识别。
使用方法
HICH-IT数据集适用于头部CT图像分割和EMR文本提取的研究。用户可以使用数据集中的图像和文本数据进行模型训练和验证,以开发更先进的医疗图像处理和EMR分析算法。此外,数据集还支持自然语言处理任务,如命名实体识别。用户可以将数据集用于开发更准确和有效的医疗诊断和治疗方法的算法。
背景与挑战
背景概述
高血压性颅内出血(HICH)是脑卒中的一种亚型,其高死亡率和高发病率给患者及其家庭带来沉重负担,同时也对国家医疗保健系统构成挑战。为了提高人工智能在HICH诊断和治疗中的准确性,Jie Li等人于2024年构建了HICH-IT数据集。该数据集包括电子病历(EMRs)和头部CT图像,旨在促进HICH图像分割和命名实体识别的研究。HICH-IT数据集的创建,填补了HICH领域深度学习研究的数据空白,为相关研究提供了重要的数据支持。
当前挑战
HICH-IT数据集面临的挑战主要在于数据的精细标注和隐私保护。数据集的构建过程中,研究人员需要确保标注的准确性和一致性,同时也要保护患者的隐私信息。此外,HICH-IT数据集还需要应对图像分割和文本信息提取等领域的挑战,如提高分割的精度和文本信息提取的准确性。
常用场景
经典使用场景
在高血压性脑出血(HICH)的医学领域,HICH-IT数据集以其全面性和精细的标注成为研究和应用的重要资源。该数据集不仅包含了电子病历(EMR)和头部CT图像,还在EMR中进行了特定标注,从文本信息中提取关键内容,并将影像数据的标注内容分为脑中线、血肿、左侧和右侧脑室四种类型。这些特点使得HICH-IT数据集成为图像分割任务和命名实体识别的基础数据集,为深度学习算法的训练和性能评估提供了丰富的实验数据。
解决学术问题
HICH-IT数据集的建立解决了HICH研究领域中缺乏大规模、精细标注的数据集的问题。该数据集的发布为HICH的诊断和治疗提供了可靠的数据支持,有助于提高人工智能在HICH诊断和治疗中的准确性和效率。此外,HICH-IT数据集的发布还推动了医学、计算机科学和人工智能等多个领域的交叉研究,为智能医疗的发展提供了新的可能性。
实际应用
在实际应用中,HICH-IT数据集为医疗影像分割和病例文本信息提取提供了重要的数据资源。通过使用该数据集训练的深度学习模型,临床医生可以快速了解患者的病情,从而提高诊断和治疗的准确性。同时,HICH-IT数据集也为医疗影像处理和病例文本分析算法的开发提供了丰富的实验数据,有助于实现更准确、更有效的医疗诊断和治疗方法。
数据集最近研究
最新研究方向
HICH-IT数据集的发布,为高血压性脑出血(HICH)的研究提供了强有力的数据支持。该数据集融合了电子病历(EMR)和头部CT图像,旨在提高人工智能在HICH诊断和治疗中的准确性。HICH-IT数据集的构建,为图像分割和命名实体识别等前沿研究方向提供了宝贵的数据资源,有助于推动智能医疗的发展。通过实验验证,HICH-IT数据集在U-net分割模型和NER模型上表现出良好的性能,准确分割了标注区域,并成功提取了标注的关键内容。HICH-IT数据集的发布,对于推动HICH研究和智能医疗的发展具有重要意义。
相关研究论文
  • 1
    HICH Image/Text (HICH-IT): Comprehensive Text and Image Datasets for Hypertensive Intracerebral Hemorrhage Research重庆医科大学第一附属医院神经外科 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作