requests

Hugging Face2025-07-18 更新2025-07-19 收录

下载链接：

https://huggingface.co/datasets/rntc/requests

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了用于法国医疗自然语言处理（NLP）排行榜的评价请求信息。每个请求信息为一个JSON格式文件，其中包括模型名称、版本、精确度、权重类型、状态、提交时间、模型类型、点赞数、参数量和许可证类型。

创建时间：

2025-07-17

原始信息汇总

French Medical NLP Leaderboard - Requests Dataset 概述

数据集简介

用途：包含用于French Medical NLP Leaderboard的评估请求数据
领域：医学自然语言处理（NLP）

数据结构

格式：JSON文件
字段说明：
- model: 模型名称
- revision: 模型版本（默认"main"）
- precision: 精度类型（如"float16"）
- weight_type: 权重类型（如"Original"）
- status: 评估状态
- submitted_time: 提交时间（ISO 8601格式）
- model_type: 模型类型（如"🟢 pretrained"）
- likes: 点赞数
- params: 参数量（单位：百万）
- license: 许可证类型（如"mit"）

状态值说明

PENDING: 等待评估
RUNNING: 正在评估中
FINISHED: 评估成功完成
FAILED: 评估失败

搜集汇总

数据集介绍

构建方式

该数据集作为法国医学NLP排行榜的评估请求集合，采用标准化JSON格式构建。每个请求文件严格遵循预定义的结构化模板，包含模型名称、版本号、计算精度、权重类型等核心元数据字段。数据集通过自动化流程收集来自不同研究团队的模型评估请求，并实时更新请求状态标记，形成动态更新的评估队列。

特点

数据集以轻量级JSON结构实现高效数据交互，所有字段均经过严格类型约束确保数据质量。独特的四态标记系统（PENDING/RUNNING/FINISHED/FAILED）完整覆盖模型评估生命周期，配合精确到毫秒的时间戳记录，为研究社区提供透明的评估过程追溯能力。特别设计的模型类型图标系统增强了可视化识别效率。

使用方法

使用者需按照指定JSON schema提交评估请求，其中模型标识符和版本控制字段为必填项。系统自动解析precision参数决定计算资源配置，通过status字段实时查询评估进度。研究人员可通过分析历史请求中的likes计数和params规模等指标，获取模型受欢迎程度与计算效率的关联洞察。

背景与挑战

背景概述

Requests数据集作为French Medical NLP Leaderboard的核心评估组件，诞生于2024年，由法国医学自然语言处理研究联盟主导开发。该数据集旨在标准化医学领域NLP模型的评估流程，通过结构化请求文件记录模型参数、评估状态和元数据，为跨机构研究提供可追溯的基准测试框架。其创新性地采用动态状态追踪机制，显著提升了医学文本分类、实体识别等任务的评估效率，推动了法语医疗NLP领域的标准化进程。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，医疗文本特有的术语多样性及隐私敏感性要求评估框架兼具语言学准确性和数据合规性，现有结构难以覆盖临床笔记、放射报告等异构数据；在构建过程中，状态同步的实时性与海量请求处理的可靠性形成矛盾，PENDING到FINISHED的状态转换需平衡队列优先级与计算资源分配，而模型精度参数与硬件适配性验证则增加了系统复杂性。

常用场景

经典使用场景

在医学自然语言处理领域，该数据集主要用于评估和比较不同模型在法语医学文本处理任务中的性能表现。研究人员通过提交模型请求，系统自动执行标准化测试流程，生成可比较的量化指标。这种集中式评估机制为法语医学NLP研究提供了统一的基准平台，极大促进了该领域的模型迭代和技术进步。

实际应用

在实际医疗信息化建设中，该评估系统可辅助医疗机构筛选适合临床文本分析的NLP模型。医院信息部门可根据模型在leaderboard上的评估结果，结合具体应用场景的精度、效率要求，选择适配的文本处理解决方案。这种第三方评估机制大幅降低了医疗机构的模型选型风险。

衍生相关工作

基于该评估框架，学界已衍生出多个针对法语医学NLP的专项研究。包括《法语临床术语抽取的迁移学习策略》、《基于多任务学习的法语医疗问答系统》等经典工作，这些研究均以该平台的评估数据作为模型优化的基准参照。后续更有学者扩展出针对放射学报告、电子病历等细分文本类型的子评估体系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集