PMC-Patients Dataset
收藏DataCite Commons2023-11-06 更新2024-08-18 收录
下载链接:
https://figshare.com/articles/dataset/PMC-Patients_Dataset/24504115
下载链接
链接失效反馈官方服务:
资源简介:
<pre>## PMC-Patients Dataset<br><br>The core file of our dataset, containing the patient summaries, demographics, and relational annotations.<br><br>### PMC-Patients.json<br>Patient summaries are presented as a `json` file, which is a list of dictionaries with the following keys:<br>- `patient_id`: string. A continuous id of patients, starting from 0.<br>- `patient_uid`: string. Unique ID for each patient, with format PMID-x, where PMID is the PubMed Identifier of source article of the note and x denotes index of the note in source article.<br>- `PMID`: string. PMID for source article.<br>- `file_path`: string. File path of xml file of source article.<br>- `title`: string. Source article title.<br>- `patient`: string. Patient note.<br>- `age`: list of tuples. Each entry is in format `(value, unit)` where value is a float number and unit is in 'year', 'month', 'week', 'day' and 'hour' indicating age unit. For example, `[[1.0, 'year'], [2.0, 'month']]` indicating the patient is a one-year- and two-month-old infant.<br>- `gender`: 'M' or 'F'. Male or Female.<br>- `relevant_articles`: dict. The key is PMID of the relevant articles and the corresponding value is its relevance score (2 or 1 as defined in the ``Methods'' section).<br>- `similar_patients`: dict. The key is patient_uid of the similar patients and the corresponding value is its similarity score (2 or 1 as defined in the ``Methods'' section).</pre>
## PMC-Patients 数据集
本数据集的核心文件包含患者总结、人口统计学信息以及关联标注。
### PMC-Patients.json
患者总结以`json`文件形式存储,为包含以下键的字典列表:
- `patient_id`:字符串类型,患者连续编号,起始值为0。
- `patient_uid`:字符串类型,每位患者的唯一标识符,格式为`PMID-x`,其中PMID指笔记来源文章的PubMed标识符(PubMed Identifier),x代表该笔记在来源文章中的索引位置。
- `PMID`:字符串类型,来源文章的PubMed标识符。
- `file_path`:字符串类型,来源文章的xml文件路径。
- `title`:字符串类型,来源文章标题。
- `patient`:字符串类型,患者病历笔记。
- `age`:元组列表,每个条目格式为`(数值, 单位)`,其中数值为浮点数,单位可选`year`(年)、`month`(月)、`week`(周)、`day`(日)或`hour`(时)。示例`[[1.0, 'year'], [2.0, 'month']]`表示该患者为1岁2个月的婴儿。
- `gender`:取值为`M`或`F`,分别代表男性与女性。
- `relevant_articles`:字典类型,键为相关文章的PMID,对应值为其相关性评分(按"方法"章节定义,取值为2或1)。
- `similar_patients`:字典类型,键为相似患者的`patient_uid`,对应值为其相似性评分(按"方法"章节定义,取值为2或1)。
提供机构:
figshare
创建时间:
2023-11-06
搜集汇总
数据集介绍

背景与挑战
背景概述
PMC-Patients Dataset是一个包含患者摘要、人口统计信息和关系注释的临床数据集,适用于临床决策支持系统和信息检索研究。数据集以JSON格式存储,每个患者记录包含详细的信息,如年龄、性别、相关文章和相似患者等。
以上内容由遇见数据集搜集并总结生成



