Shrey-1329/cxiu_hf_dataset
收藏Hugging Face2023-07-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Shrey-1329/cxiu_hf_dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个由印第安纳大学提供的开放访问的肺炎胸部X光数据集的转换和处理版本。数据集包含两个字段:图像和文本。图像是X光片,文本是与之相关的发现。预处理步骤包括将文本转换为小写、去除标点符号、去除数字、去除含有连续两个或更多X的单词,以及去除长度在底部和顶部2%的文本。
这是一个由印第安纳大学提供的开放访问的肺炎胸部X光数据集的转换和处理版本。数据集包含两个字段:图像和文本。图像是X光片,文本是与之相关的发现。预处理步骤包括将文本转换为小写、去除标点符号、去除数字、去除含有连续两个或更多X的单词,以及去除长度在底部和顶部2%的文本。
提供机构:
Shrey-1329
原始信息汇总
数据集概述
基本信息
- 数据集名称: Indiana University Chest Xray Dataset
- 任务类别: image-to-text
- 语言: English (en)
- 标签: medical
- 大小类别: 1K<n<10K
数据结构
- 特征:
- image: 图像数据
- text: 字符串数据,包含与图像相关的发现文本
数据分割
- 训练集:
- 示例数量: 6060
- 数据大小: 1108945726.54字节
数据集大小
- 下载大小: 1108991167字节
- 总大小: 1108945726.54字节
预处理步骤
- 转换所有文本为小写
- 移除所有标点符号
- 移除所有数字
- 移除包含两个或以上连续X的单词
- 移除文本长度最短和最长的2%数据



