Anonymous2024NipsUser/3MAD-Tiny-1K|医学影像数据集|数据分析数据集
收藏数据集概述
数据集特征
- id: int64
- file_name: string
- original_attribute: string
- unmatch_attribute: string
- normal_prompt: string
- harmful_prompt: string
- policy: string
- key_phrases: string
- index_level_0: int64
- image: image
数据集分割
- Dermoscopy_Skin: 60 examples, 16689492.0 bytes
- MRI_Alzheimer: 60 examples, 286992.0 bytes
- MRI_Brain: 60 examples, 1584232.0 bytes
- Fundus_Retina: 60 examples, 42737467.0 bytes
- Mamography_Breast: 60 examples, 1079676.0 bytes
- OCT_Retina: 60 examples, 11527885.0 bytes
- CT_Chest: 60 examples, 10292123.0 bytes
- CT_Heart: 60 examples, 1751557.0 bytes
- CT_Brain: 60 examples, 1797137.0 bytes
- Xray_Chest: 60 examples, 37533502.0 bytes
- Xray_Skeleton: 60 examples, 5177609.0 bytes
- Xray_Dental: 60 examples, 7593293.0 bytes
- Endoscopy_Gastroent: 60 examples, 10065196.0 bytes
- Ultrasound_Baby: 60 examples, 14944343.0 bytes
- Ultrasound_Breast: 60 examples, 21320622.0 bytes
- Ultrasound_Carotid: 60 examples, 15818269.0 bytes
- Ultrasound_Ovary: 60 examples, 5581863.0 bytes
- Ultrasound_Brain: 60 examples, 7552189.0 bytes
数据集大小
- download_size: 427654134 bytes
- dataset_size: 213333447.0 bytes
配置信息
- config_name: default
- data_files:
- 各分割对应的数据文件路径,如
data/Ultrasound_Brain-*
等。
- 各分割对应的数据文件路径,如

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录