five

RadRevise|放射学数据集|自然语言处理数据集

收藏
github2024-06-25 更新2024-07-12 收录
放射学
自然语言处理
下载链接:
https://github.com/rajpurkarlab/RadRevise
下载链接
链接失效反馈
资源简介:
RadRevise是一个用于基于指令的放射学报告编辑的基准数据集,通过GPT-4生成指令和修改报告,并经过人工审查和注释过程。
创建时间:
2024-06-13
原始信息汇总

RadRevise: A Benchmark Dataset for Instruction-Based Radiology Report Editing

数据集概述

RadRevise 是一个用于指令型放射报告编辑的基准数据集。该数据集通过开放认证流程在 PhysioNet 上提供。

数据生成

数据集使用 GPT-4 生成基于特定类型指令和临床主题的指令和修改后的报告。需要注意的是,生成结果会与 RadRevise 有所不同,因为 GPT 生成的响应和 RadRevise 经过的人工审查和注释过程。

生成步骤

  1. 进入 generation 目录。
  2. 运行以下命令生成数据: bash python generate.py

模型评估

数据集可用于评估任何托管在 Hugging Face 上的文本生成模型。

评估步骤

  1. 下载 RadRevise 数据集。

  2. 导航到 evaluation 目录。

  3. 运行以下命令评估单个模型: bash python eval_model $MODEL_ID [$DATA_PATH] [$BATCH_SIZE] [$OUTPUT_FILE]

    • $MODEL_ID: Hugging Face 模型 ID
    • $DATA_PATH: RadRevise 数据集路径(默认:../data/RadRevise_v0.csv
    • $BATCH_SIZE: 推理批次大小(默认:32)
    • $OUTPUT_FILE: 评估输出文件名(默认:output/result.csv
  4. 或者,修改并执行 run.sh 脚本来评估一个或多个模型。

许可证

该数据集仓库在 MIT 许可证下公开可用。

AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建RadRevise数据集时,研究团队采用了GPT-4模型生成指令和修改后的放射报告。这些指令和报告基于特定的临床主题和指令类型。值得注意的是,生成的结果与RadRevise数据集有所不同,这主要是因为GPT-4的生成响应以及RadRevise经过的额外人工审查和注释过程。通过这种方式,数据集不仅涵盖了广泛的临床场景,还确保了数据的高质量和多样性。
特点
RadRevise数据集的主要特点在于其指令驱动的设计,这使得数据集在评估和训练基于指令的放射报告编辑模型时具有显著优势。此外,数据集经过GPT-4生成和人工审查的双重验证,确保了数据的准确性和可靠性。这种双重验证机制不仅提高了数据集的质量,还为模型评估提供了更为严格的标准。
使用方法
使用RadRevise数据集进行模型评估时,用户首先需要下载数据集,并导航至`evaluation`目录。随后,可以通过运行`python eval_model $MODEL_ID [$DATA_PATH] [$BATCH_SIZE] [$OUTPUT_FILE]`命令来评估单个模型。其中,`$MODEL_ID`代表Hugging Face上的模型ID,`$DATA_PATH`为数据集路径,`$BATCH_SIZE`为推理批量大小,`$OUTPUT_FILE`为评估输出文件名。此外,用户还可以通过修改和执行`run.sh`脚本来评估一个或多个模型。
背景与挑战
背景概述
RadRevise数据集是一个专注于指令型放射报告编辑的基准数据集,由相关领域的研究人员和机构于近期创建。该数据集的核心研究问题是如何通过生成式模型(如GPT-4)来生成和修改放射报告,以提高报告的准确性和一致性。RadRevise的推出,标志着在医学影像分析领域中,对自动化报告生成技术的进一步探索,为研究人员提供了一个标准化的评估平台,以比较和改进现有的文本生成模型。
当前挑战
RadRevise数据集在构建过程中面临的主要挑战包括:首先,如何确保通过GPT-4生成的指令和修改报告的质量和准确性,这需要复杂的人工审查和注释过程。其次,数据集的生成和评估依赖于现有的文本生成模型,这些模型在处理医学领域的专业术语和复杂语境时可能存在局限性。此外,数据集的开放获取和使用过程中,如何保护患者隐私和确保数据安全也是一个重要的挑战。
常用场景
经典使用场景
在医学影像领域,RadRevise数据集被广泛用于基于指令的放射报告编辑任务。该数据集通过GPT-4生成指令和修改后的报告,涵盖多种临床主题,为研究人员提供了一个标准化的基准。通过使用RadRevise,研究者可以评估和比较不同文本生成模型在放射报告编辑任务中的表现,从而推动医学文本处理技术的发展。
实际应用
在实际应用中,RadRevise数据集可用于训练和验证放射报告编辑系统,这些系统能够自动识别和修正报告中的错误或不一致之处。例如,医院和诊所可以使用这些系统来快速生成和校对放射报告,减少人为错误,提高工作效率。此外,这些系统还可以集成到现有的医疗信息系统中,为医生提供实时、准确的诊断支持。
衍生相关工作
基于RadRevise数据集,许多研究工作得以展开,包括但不限于放射报告自动生成、错误检测和修正、以及多模态医学数据融合等。例如,有研究者利用该数据集开发了基于深度学习的放射报告生成模型,显著提高了报告的生成质量和速度。此外,RadRevise还促进了跨学科的合作,如与自然语言处理和计算机视觉领域的结合,进一步推动了医学影像分析技术的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

VQA

我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。

OpenDataLab 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录