LiveClin
收藏LiveClin 数据集概述
数据集简介
LiveClin 是一个无泄漏的实时临床基准测试数据集。
更新记录
- 2026.02.21 相关论文已发布。
- 2026.02.10 LiveClin 数据集正式发布。
数据集内容与结构
数据集包含基准测试数据,每个发布周期数据存放在独立的文件夹中。
项目目录结构
LiveClin/ ├── assets/ # 文档所需的图片、徽标、示例输出等资源 ├── data/ # 基准测试数据集 │ ├── 2025H1/ # 2025年上半年数据集 │ │ ├── 2025h1.jsonl # 输入的JSONL文件 │ │ └── images/ # 数据集中引用的图像文件(解压images.zip后生成) │ └── ... # 其他周期数据 ├── demo/ # 用于快速测试的小型演示数据集 │ ├── demo.jsonl # 演示用的JSONL输入文件 │ └── images/ # 演示样本引用的图像 ├── core.py # 核心评估逻辑(读取JSONL,运行模型推理,写回结果) ├── evaluate.py # 控制器脚本:启动SGLang服务器 -> 运行core.py -> 停止服务器 ├── stats_analyzer.py # 分析评估结果并生成汇总报告 └── README.md # 项目文档
评估流程
0. 准备数据集
以2025H1数据集为例: bash cd data/2025H1 unzip images.zip
1. 执行评估
首先需在 evaluate.py 文件中修改 JSONL_PATH 和 IMAGE_ROOT_PATH 参数(第15、16行)。
bash
python evaluate.py
2. 结果分析
bash python stats_analyzer.py




