five

jamilhussain/medInfo

收藏
Hugging Face2025-08-11 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/jamilhussain/medInfo
下载链接
链接失效反馈
官方服务:
资源简介:
信息提取数据集(HF JSONL)是从最新的`studies_rows.csv`文件重新生成的,用于在PDF信息提取任务上微调一个仅解码器的LLM模型。该数据集包括训练集`train.jsonl`和示例集`sample10.jsonl`。每行数据包括系统指令、用户任务和文档文本,以及需要提取的黄金标准JSON格式字段。数据集包含多个字段,如标题、声明性陈述、研究设计等,用于提取信息。

Information Extraction Dataset (HF JSONL) is regenerated from the latest `studies_rows.csv` for fine-tuning a decoder-only LLM on PDF IE tasks. The dataset includes a training set `train.jsonl` and a sample set `sample10.jsonl`. Each line of data contains a system instruction, user task and document text, along with gold standard JSON fields to be extracted. The dataset comprises multiple fields such as title, declarative statement, study design, etc., for information extraction.
提供机构:
jamilhussain
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作