five

introvoyz041/synthvision-annotated-kimi

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/introvoyz041/synthvision-annotated-kimi
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为synthvision-annotated-kimi,包含59,539条医学图像标注记录,由Kimi K2.5模型通过Doubleword批量推理生成,是SynthVision流程的后半部分标注。每条记录包含多轮临床对话(5-9轮)、临床叙述报告(4-6句)、结构化发现、推理链和难度评级(简单、中等、困难)。数据集旨在支持视觉问答任务,特别是医学领域的应用,提供丰富的临床上下文和诊断信息。

license: apache-2.0 task_categories: - 视觉问答(visual-question-answering) tags: - 医疗(medical) - SynthVision - OpenMed size_categories: - 10K<n<100K --- # SynthVision标注-Kimi ![SynthVision](synthvision_featured.png) 由Kimi K2.5通过Doubleword批量推理服务标注的医学影像数据集 **数据记录数**: 59,539 ## 数据集概况 本数据集为[SynthVision数据流水线](https://huggingface.co/blog/OpenMed/synthvision)的后半段标注数据,共计59,539张医学影像,由[Kimi K2.5](https://huggingface.co/moonshotai/Kimi-K2.5)(1万亿参数混合专家模型,320亿激活参数)通过[Doubleword](https://doubleword.ai)批量推理服务完成标注。 每条数据记录均包含一段5~9轮的多轮临床对话、一份临床叙事报告、结构化检查结果、推理链条以及难度评级。 ## 数据结构 id: str # 唯一记录标识符 image: str # 影像相对路径 conversations: list[dict] # 多轮ShareGPT格式对话 report: str # 4~6句临床叙事文本 structured_findings: dict # 检查项名称 → 检查值 reasoning_chain: str # 编号式诊断步骤 difficulty: str # 简单 | 中等 | 困难 ## 数据加载 python from datasets import load_dataset ds = load_dataset("OpenMed/synthvision-annotated-kimi") ## 相关链接 - [SynthVision 官方博客](https://huggingface.co/blog/OpenMed/synthvision) - [源代码仓库](https://github.com/openmed-labs/synthvision) - [所有SynthVision相关数据集产物](https://huggingface.co/collections/OpenMed/synthvision-69baac655b557943aa1babd3) - [Hugging Face平台上的OpenMed团队](https://huggingface.co/OpenMed)
提供机构:
introvoyz041
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作