five

Human Reference Atlas Literature (HRAlit) Database

收藏
DataCite Commons2024-02-01 更新2024-08-18 收录
下载链接:
https://figshare.com/articles/dataset/Human_Reference_Atlas_Literature_HRAlit_Database/24580669
下载链接
链接失效反馈
官方服务:
资源简介:
The Human Reference Atlas literature (HRAlit) database, with 23 tables with 21,703,812 records including 7 junction tables with 13,042,188 relationships and a total size of 1.56 GB, is available in SQL format together with tables in CSV format. The database links the 295 digital objects of the HRA (versions 1.0 to 1.4) to publication, funding, and experimental data. Specifically, HRAlit includes 7,103,180 PubMed publications retrieved by a query for all 31 organs plus papers published in HRA, CZ CELLxGENE, GTEx, and CellMarker that are linked to 583,117 experts from 26,235 (cleaned) institutions and 896,680 funded projects by 6,427 (cleaned) funders. HRAlit also links the HRA to 1,816 experimental datasets and their 4,639 donors. The anatomical structures, cell types, and biomarkers in the 5th HRA release link to 5,049 ontology terms and IDs. HRAlit can be used to identify leading experts, major papers, funding trends, or alignment with existing ontologies in support of systematic HRA construction and usage. All data and code is at https://github.com/cns-iu/hra-literature. <br>

人类参考图谱文献(Human Reference Atlas literature, HRAlit)数据库包含23张数据表,共计21,703,812条记录,其中涵盖7张关联表(junction tables),包含13,042,188条关联关系,总大小为1.56 GB,该数据库以SQL格式发布,同时附带CSV格式的数据表。该数据库将人类参考图谱(Human Reference Atlas, HRA)的295个数字对象(版本1.0至1.4)与文献出版物、资助项目及实验数据进行关联。具体而言,HRAlit包含7,103,180篇PubMed文献,这些文献通过针对全部31个器官的检索策略获取,同时涵盖发表于HRA、CZ CELLxGENE、GTEx及CellMarker的相关论文;上述文献共关联了来自26,235家(已清洗)机构的583,117名专家,以及由6,427名(已清洗)资助者牵头的896,680个资助项目。HRAlit还将HRA与1,816个实验数据集及其对应的4,639名供体进行关联。HRA第5版中的解剖结构、细胞类型与生物标志物,共关联了5,049个本体术语及标识符。HRAlit可用于识别领域核心专家、高影响力论文、资助趋势,或验证与现有本体的一致性,以支撑系统性的HRA构建与应用。所有数据与代码均可通过https://github.com/cns-iu/hra-literature获取。
提供机构:
figshare
创建时间:
2023-11-17
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Human Reference Atlas Literature (HRAlit) Database是一个包含23个表格、总计21,703,812条记录的大型数据库,链接了HRA的数字对象到出版物、资助和实验数据,旨在支持HRA的系统构建和使用。数据集还包括专家、机构、资助项目等丰富信息,可用于研究分析。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作