TJDR|医学图像分析数据集|糖尿病视网膜病变数据集
收藏TJDR: 高质量糖尿病视网膜病变像素级标注数据集
数据集概述
TJDR 是一个高质量的糖尿病视网膜病变(DR)像素级标注数据集,旨在促进 DR 病变分割研究。该数据集包含 561 张来自同济大学附属同济医院的高分辨率彩色眼底图像。
数据来源
- 图像来源:同济大学附属同济医院
- 采集设备:Topcon 的 TRC-50DX 和 Zeiss 的 CLARUS 500 眼底相机
- 图像特点:高分辨率,确保了视盘、视网膜血管和黄斑等解剖结构的清晰显示
数据处理
- 隐私保护:严格遵守数据隐私原则,移除了所有私人信息
- 标注工具:使用 Labelme 工具进行标注
- 标注内容:包含四种常见的糖尿病视网膜病变病变:微动脉瘤(MA)、出血(HE)、硬性渗出(EX)和软性渗出(SE)
标注质量
- 标注人员:经验丰富的眼科医生进行标注,确保标注质量
数据集划分
- 数据集分为训练集和测试集,并已公开发布
引用信息
如果您发现该数据集对您的研究有用,请考虑引用我们的论文: text @article{mao2023tjdr, title={TJDR: A High-Quality Diabetic Retinopathy Pixel-Level Annotation Dataset}, author={Jingxin Mao and Xiaoyu Ma and Yanlong Bi and Rongqing Zhang}, journal={arXiv preprint arXiv:2312.15389}, year={2023}, }

- 1TJDR: A High-Quality Diabetic Retinopathy Pixel-Level Annotation Dataset同济大学 · 2023年
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录
World Flights
该数据集包含使用OpenSky Network实时API收集的两小时飞行数据。飞行颜色基于出发国家,记录了18000次飞行,由于缺乏卫星覆盖,海洋上的航线不完整。每条航线还加入了来自airlinecodes.co.uk的航空公司信息。
github 收录
glaive-function-calling-openai
该数据集包含用于训练和评估语言模型在函数调用能力上的对话示例。数据集包括一个完整的函数调用示例集合和一个精选的子集,专注于最常用的函数。数据集的结构包括一个完整的数据集和几个测试子集。每个记录都是一个JSON对象,包含对话消息、可用函数定义和实际的函数调用。数据集还包括最常用的函数分布信息,并提供了加载和评估数据集的示例代码。
huggingface 收录