five

精致的医疗r1数据|医疗数据分析数据集|自然语言处理数据集

收藏
魔搭社区2025-10-10 更新2025-04-26 收录
医疗数据分析
自然语言处理
下载链接:
https://modelscope.cn/datasets/krisfu/delicate_medical_r1_data
下载链接
链接失效反馈
资源简介:
# 数据: 基于华佗开源的高质量语料库 # 技术链路: 多智能体 + 数据进化 + 推理过程生成 + 推理过程验证过滤 # 多智能体 利用metagpt搭建的造数据的workflow # 数据进化 改造 self-instruct 进行数据进化 # 推理过程生成 使用 qwq 模型进行每 query 10次 think 过程的生成 # 推理过程验证过滤所使用的指标 ## 质量评估 ###### 2.1.1. 召回率 首先经过step_partition步骤后,得到了带有N步推理的思维链。使用llm找到其中的关键 步骤,然后依次判断这些关键步骤解决的问题或陈述的事实是否在出现在真实答案中。将出现的个数除以总个数, 即可得到召回率分值。 ###### 2.1.2. 精确率 首先经过step_partition步骤后,得到了带有N步推理的思维链。使用llm,以真实答案为 基准对每个步骤进行正确性的评估。将正确的个数除以总个数,即可得到精确率。 ###### 2.1.3. F1值 通过前述计算得到的召回率和精确率,即可计算得出F1值,即 F1 = 2 * 精确率 * 召回率 / (精确率 + 召回率) # 模型部署: 智能体用的qwen-72b-awq 推理过程生成用的qwq-32b 推理过程验证过滤用的qwen-72b-awq
提供机构:
maas
创建时间:
2025-04-23
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国逐日格点降水数据集V2(1960–2024,0.1°)

CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。

国家青藏高原科学数据中心 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

QM9

该数据集名为QM9,包含了134,000个分子的信息,可用于生成点云的建模工作,同时也可应用于分子动力学的研究以及点云生成任务中。

arXiv 收录

NIH Chest X-rays

Over 112,000 Chest X-ray images from more than 30,000 unique patients

kaggle 收录