Anonymous2024NipsUser/3MAD-Tiny-1K
收藏Hugging Face2024-05-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Anonymous2024NipsUser/3MAD-Tiny-1K
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: file_name
dtype: string
- name: original_attribute
dtype: string
- name: unmatch_attribute
dtype: string
- name: normal_prompt
dtype: string
- name: harmful_prompt
dtype: string
- name: policy
dtype: string
- name: key_phrases
dtype: string
- name: __index_level_0__
dtype: int64
- name: image
dtype: image
splits:
- name: Dermoscopy_Skin
num_bytes: 16689492.0
num_examples: 60
- name: MRI_Alzheimer
num_bytes: 286992.0
num_examples: 60
- name: MRI_Brain
num_bytes: 1584232.0
num_examples: 60
- name: Fundus_Retina
num_bytes: 42737467.0
num_examples: 60
- name: Mamography_Breast
num_bytes: 1079676.0
num_examples: 60
- name: OCT_Retina
num_bytes: 11527885.0
num_examples: 60
- name: CT_Chest
num_bytes: 10292123.0
num_examples: 60
- name: CT_Heart
num_bytes: 1751557.0
num_examples: 60
- name: CT_Brain
num_bytes: 1797137.0
num_examples: 60
- name: Xray_Chest
num_bytes: 37533502.0
num_examples: 60
- name: Xray_Skeleton
num_bytes: 5177609.0
num_examples: 60
- name: Xray_Dental
num_bytes: 7593293.0
num_examples: 60
- name: Endoscopy_Gastroent
num_bytes: 10065196.0
num_examples: 60
- name: Ultrasound_Baby
num_bytes: 14944343.0
num_examples: 60
- name: Ultrasound_Breast
num_bytes: 21320622.0
num_examples: 60
- name: Ultrasound_Carotid
num_bytes: 15818269.0
num_examples: 60
- name: Ultrasound_Ovary
num_bytes: 5581863.0
num_examples: 60
- name: Ultrasound_Brain
num_bytes: 7552189.0
num_examples: 60
download_size: 427654134
dataset_size: 213333447.0
configs:
- config_name: default
data_files:
- split: Ultrasound_Brain
path: data/Ultrasound_Brain-*
- split: Dermoscopy_Skin
path: data/Dermoscopy_Skin-*
- split: MRI_Alzheimer
path: data/MRI_Alzheimer-*
- split: MRI_Brain
path: data/MRI_Brain-*
- split: Fundus_Retina
path: data/Fundus_Retina-*
- split: Mamography_Breast
path: data/Mamography_Breast-*
- split: OCT_Retina
path: data/OCT_Retina-*
- split: CT_Chest
path: data/CT_Chest-*
- split: CT_Heart
path: data/CT_Heart-*
- split: CT_Brain
path: data/CT_Brain-*
- split: Xray_Chest
path: data/Xray_Chest-*
- split: Xray_Skeleton
path: data/Xray_Skeleton-*
- split: Xray_Dental
path: data/Xray_Dental-*
- split: Endoscopy_Gastroent
path: data/Endoscopy_Gastroent-*
- split: Ultrasound_Baby
path: data/Ultrasound_Baby-*
- split: Ultrasound_Breast
path: data/Ultrasound_Breast-*
- split: Ultrasound_Carotid
path: data/Ultrasound_Carotid-*
- split: Ultrasound_Ovary
path: data/Ultrasound_Ovary-*
---
数据集信息:
特征字段:
- 样本ID(id):数据类型为int64
- 文件名称(file_name):数据类型为字符串
- 原始属性(original_attribute):数据类型为字符串
- 不匹配属性(unmatch_attribute):数据类型为字符串
- 正常提示词(normal_prompt):数据类型为字符串
- 有害提示词(harmful_prompt):数据类型为字符串
- 安全策略(policy):数据类型为字符串
- 关键短语(key_phrases):数据类型为字符串
- 索引层级0(__index_level_0__):数据类型为int64
- 图像(image):数据类型为图像
数据拆分:
- 皮肤镜皮肤影像(Dermoscopy_Skin):字节大小16689492.0,样本数量60
- 阿尔茨海默病磁共振成像(MRI_Alzheimer):字节大小286992.0,样本数量60
- 脑部磁共振成像(MRI_Brain):字节大小1584232.0,样本数量60
- 视网膜眼底影像(Fundus_Retina):字节大小42737467.0,样本数量60
- 乳腺钼靶影像(Mamography_Breast):字节大小1079676.0,样本数量60
- 视网膜光学相干断层扫描影像(OCT_Retina):字节大小11527885.0,样本数量60
- 胸部计算机断层扫描影像(CT_Chest):字节大小10292123.0,样本数量60
- 心脏计算机断层扫描影像(CT_Heart):字节大小1751557.0,样本数量60
- 脑部计算机断层扫描影像(CT_Brain):字节大小1797137.0,样本数量60
- 胸部X射线影像(Xray_Chest):字节大小37533502.0,样本数量60
- 骨骼X射线影像(Xray_Skeleton):字节大小5177609.0,样本数量60
- 牙科X射线影像(Xray_Dental):字节大小7593293.0,样本数量60
- 胃肠内镜影像(Endoscopy_Gastroent):字节大小10065196.0,样本数量60
- 胎儿超声影像(Ultrasound_Baby):字节大小14944343.0,样本数量60
- 乳腺超声影像(Ultrasound_Breast):字节大小21320622.0,样本数量60
- 颈动脉超声影像(Ultrasound_Carotid):字节大小15818269.0,样本数量60
- 卵巢超声影像(Ultrasound_Ovary):字节大小5581863.0,样本数量60
- 脑部超声影像(Ultrasound_Brain):字节大小7552189.0,样本数量60
下载总大小:427654134 字节
数据集总大小:213333447.0 字节
配置信息:
- 默认配置(default):对应数据文件拆分与路径如下:
- 拆分:Ultrasound_Brain,路径:data/Ultrasound_Brain-*
- 拆分:Dermoscopy_Skin,路径:data/Dermoscopy_Skin-*
- 拆分:MRI_Alzheimer,路径:data/MRI_Alzheimer-*
- 拆分:MRI_Brain,路径:data/MRI_Brain-*
- 拆分:Fundus_Retina,路径:data/Fundus_Retina-*
- 拆分:Mamography_Breast,路径:data/Mamography_Breast-*
- 拆分:OCT_Retina,路径:data/OCT_Retina-*
- 拆分:CT_Chest,路径:data/CT_Chest-*
- 拆分:CT_Heart,路径:data/CT_Heart-*
- 拆分:CT_Brain,路径:data/CT_Brain-*
- 拆分:Xray_Chest,路径:data/Xray_Chest-*
- 拆分:Xray_Skeleton,路径:data/Xray_Skeleton-*
- 拆分:Xray_Dental,路径:data/Xray_Dental-*
- 拆分:Endoscopy_Gastroent,路径:data/Endoscopy_Gastroent-*
- 拆分:Ultrasound_Baby,路径:data/Ultrasound_Baby-*
- 拆分:Ultrasound_Breast,路径:data/Ultrasound_Breast-*
- 拆分:Ultrasound_Carotid,路径:data/Ultrasound_Carotid-*
- 拆分:Ultrasound_Ovary,路径:data/Ultrasound_Ovary-*
提供机构:
Anonymous2024NipsUser
原始信息汇总
数据集概述
数据集特征
- id: int64
- file_name: string
- original_attribute: string
- unmatch_attribute: string
- normal_prompt: string
- harmful_prompt: string
- policy: string
- key_phrases: string
- index_level_0: int64
- image: image
数据集分割
- Dermoscopy_Skin: 60 examples, 16689492.0 bytes
- MRI_Alzheimer: 60 examples, 286992.0 bytes
- MRI_Brain: 60 examples, 1584232.0 bytes
- Fundus_Retina: 60 examples, 42737467.0 bytes
- Mamography_Breast: 60 examples, 1079676.0 bytes
- OCT_Retina: 60 examples, 11527885.0 bytes
- CT_Chest: 60 examples, 10292123.0 bytes
- CT_Heart: 60 examples, 1751557.0 bytes
- CT_Brain: 60 examples, 1797137.0 bytes
- Xray_Chest: 60 examples, 37533502.0 bytes
- Xray_Skeleton: 60 examples, 5177609.0 bytes
- Xray_Dental: 60 examples, 7593293.0 bytes
- Endoscopy_Gastroent: 60 examples, 10065196.0 bytes
- Ultrasound_Baby: 60 examples, 14944343.0 bytes
- Ultrasound_Breast: 60 examples, 21320622.0 bytes
- Ultrasound_Carotid: 60 examples, 15818269.0 bytes
- Ultrasound_Ovary: 60 examples, 5581863.0 bytes
- Ultrasound_Brain: 60 examples, 7552189.0 bytes
数据集大小
- download_size: 427654134 bytes
- dataset_size: 213333447.0 bytes
配置信息
- config_name: default
- data_files:
- 各分割对应的数据文件路径,如
data/Ultrasound_Brain-*等。
- 各分割对应的数据文件路径,如
搜集汇总
数据集介绍

构建方式
在构建3MAD-Tiny-1K数据集时,研究者们精心收集了来自多个医学影像领域的数据,包括皮肤病学、阿尔茨海默病MRI、脑部MRI、眼底视网膜、乳腺摄影、视网膜OCT、胸部CT、心脏CT、脑部CT、胸部X光、骨骼X光、牙科X光、胃肠内窥镜、胎儿超声、乳腺超声、颈动脉超声、卵巢超声和脑部超声。每个子集均包含60个样本,确保了数据集的多样性和代表性。通过这种方式,数据集不仅涵盖了广泛的医学影像类型,还为不同领域的研究提供了丰富的资源。
使用方法
使用3MAD-Tiny-1K数据集时,研究者可以通过HuggingFace平台直接下载并加载数据。数据集的结构清晰,每个子集对应一个特定的医学影像类型,且每个样本包含多个特征,如图像文件名、原始属性、不匹配属性和提示信息等。研究者可以根据需要选择特定的子集进行分析或模型训练。此外,数据集的图像数据类型为image,便于直接用于图像处理和分析任务。
背景与挑战
背景概述
在医学影像分析领域,多模态数据集的构建与应用已成为推动诊断技术进步的关键。Anonymous2024NipsUser/3MAD-Tiny-1K数据集由匿名研究团队于2024年创建,旨在为多种医学影像类型的分析提供标准化数据支持。该数据集涵盖了皮肤镜检查、MRI、CT、X光、超声等多种影像类型,每种类型包含60个样本,总计1000个样本。主要研究人员通过整合不同医学影像数据,旨在解决多模态医学影像的分类与诊断问题,对提升医学影像分析的准确性和效率具有重要意义。
当前挑战
该数据集在构建过程中面临多重挑战。首先,不同医学影像类型的数据获取与标准化处理需要高度的专业知识和技术支持,确保数据的一致性和可用性。其次,多模态数据的融合与分析对算法提出了更高的要求,如何在保持数据独立性的同时实现有效融合是一个关键问题。此外,数据集的样本数量相对较少,如何在有限样本下实现高精度的模型训练与验证,也是当前研究中亟待解决的难题。
常用场景
经典使用场景
在医学影像分析领域,3MAD-Tiny-1K数据集被广泛用于多模态医学图像的分类与识别任务。该数据集涵盖了多种医学影像类型,如皮肤病理学图像、阿尔茨海默病MRI、眼底图像等,为研究人员提供了丰富的数据资源。通过这些图像数据,研究者可以训练和验证深度学习模型,以实现对不同疾病和病理状态的精准诊断。
解决学术问题
3MAD-Tiny-1K数据集在解决医学影像分析中的多模态数据融合问题方面具有重要意义。传统的医学影像分析往往依赖单一模态的数据,而该数据集的多模态特性使得研究者能够探索不同模态数据之间的关联性,从而提高诊断的准确性和可靠性。此外,该数据集还为研究医学影像的自动标注和分类提供了宝贵的资源,推动了相关领域的技术进步。
实际应用
在实际应用中,3MAD-Tiny-1K数据集被用于开发和优化医学影像分析系统,这些系统广泛应用于临床诊断、疾病筛查和治疗方案制定。例如,通过分析皮肤病理学图像,医生可以更早地识别出皮肤癌等疾病;通过分析阿尔茨海默病的MRI图像,可以提前预测患者的病情发展。这些应用不仅提高了诊断的效率,还为患者提供了更个性化的治疗方案。
数据集最近研究
最新研究方向
在医学影像分析领域,Anonymous2024NipsUser/3MAD-Tiny-1K数据集的最新研究方向主要集中在多模态医学图像的深度学习模型构建与优化。该数据集涵盖了多种医学影像类型,如皮肤病理学、阿尔茨海默病MRI、眼底视网膜图像等,为研究人员提供了丰富的数据资源。前沿研究聚焦于如何通过跨模态数据融合,提升疾病诊断的准确性和效率。相关热点事件包括利用该数据集进行的多模态图像配准与融合技术,以及基于深度学习的自动化诊断系统开发。这些研究不仅推动了医学影像分析技术的发展,也为临床诊断提供了新的工具和方法,具有重要的实际应用价值。
以上内容由遇见数据集搜集并总结生成



