five

Shrey-1329/cxiu_hf_dataset

收藏
Hugging Face2023-07-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Shrey-1329/cxiu_hf_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由印第安纳大学提供的开放访问的肺炎胸部X光数据集的转换和处理版本。数据集包含两个字段:图像和文本。图像是X光片,文本是与之相关的发现。预处理步骤包括将文本转换为小写、去除标点符号、去除数字、去除含有连续两个或更多X的单词,以及去除长度在底部和顶部2%的文本。

这是一个由印第安纳大学提供的开放访问的肺炎胸部X光数据集的转换和处理版本。数据集包含两个字段:图像和文本。图像是X光片,文本是与之相关的发现。预处理步骤包括将文本转换为小写、去除标点符号、去除数字、去除含有连续两个或更多X的单词,以及去除长度在底部和顶部2%的文本。
提供机构:
Shrey-1329
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Indiana University Chest Xray Dataset
  • 任务类别: image-to-text
  • 语言: English (en)
  • 标签: medical
  • 大小类别: 1K<n<10K

数据结构

  • 特征:
    • image: 图像数据
    • text: 字符串数据,包含与图像相关的发现文本

数据分割

  • 训练集:
    • 示例数量: 6060
    • 数据大小: 1108945726.54字节

数据集大小

  • 下载大小: 1108991167字节
  • 总大小: 1108945726.54字节

预处理步骤

  1. 转换所有文本为小写
  2. 移除所有标点符号
  3. 移除所有数字
  4. 移除包含两个或以上连续X的单词
  5. 移除文本长度最短和最长的2%数据
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作