introvoyz041/synthvision-annotated-kimi
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/introvoyz041/synthvision-annotated-kimi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为synthvision-annotated-kimi,包含59,539条医学图像标注记录,由Kimi K2.5模型通过Doubleword批量推理生成,是SynthVision流程的后半部分标注。每条记录包含多轮临床对话(5-9轮)、临床叙述报告(4-6句)、结构化发现、推理链和难度评级(简单、中等、困难)。数据集旨在支持视觉问答任务,特别是医学领域的应用,提供丰富的临床上下文和诊断信息。
license: apache-2.0
task_categories:
- 视觉问答(visual-question-answering)
tags:
- 医疗(medical)
- SynthVision
- OpenMed
size_categories:
- 10K<n<100K
---
# SynthVision标注-Kimi

由Kimi K2.5通过Doubleword批量推理服务标注的医学影像数据集
**数据记录数**: 59,539
## 数据集概况
本数据集为[SynthVision数据流水线](https://huggingface.co/blog/OpenMed/synthvision)的后半段标注数据,共计59,539张医学影像,由[Kimi K2.5](https://huggingface.co/moonshotai/Kimi-K2.5)(1万亿参数混合专家模型,320亿激活参数)通过[Doubleword](https://doubleword.ai)批量推理服务完成标注。
每条数据记录均包含一段5~9轮的多轮临床对话、一份临床叙事报告、结构化检查结果、推理链条以及难度评级。
## 数据结构
id: str # 唯一记录标识符
image: str # 影像相对路径
conversations: list[dict] # 多轮ShareGPT格式对话
report: str # 4~6句临床叙事文本
structured_findings: dict # 检查项名称 → 检查值
reasoning_chain: str # 编号式诊断步骤
difficulty: str # 简单 | 中等 | 困难
## 数据加载
python
from datasets import load_dataset
ds = load_dataset("OpenMed/synthvision-annotated-kimi")
## 相关链接
- [SynthVision 官方博客](https://huggingface.co/blog/OpenMed/synthvision)
- [源代码仓库](https://github.com/openmed-labs/synthvision)
- [所有SynthVision相关数据集产物](https://huggingface.co/collections/OpenMed/synthvision-69baac655b557943aa1babd3)
- [Hugging Face平台上的OpenMed团队](https://huggingface.co/OpenMed)
提供机构:
introvoyz041



