pmc/open_access
收藏Hugging Face2024-09-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pmc/open_access
下载链接
链接失效反馈官方服务:
资源简介:
PMC开放获取子集包括超过340万篇期刊文章和预印本,这些文章在允许重用的许可下提供。并非所有PMC中的文章都可用于文本挖掘和其他重用,许多文章受版权保护,但PMC开放获取子集中的文章在Creative Commons或类似许可下提供,通常允许比传统版权作品更自由的重新分发和重用。PMC开放获取子集是PMC文章数据集的一部分。在PMC开放获取子集中,有三个分组:允许商业使用(CC0、CC BY、CC BY-SA、CC BY-ND许可)、仅限非商业使用(CC BY-NC、CC BY-NC-SA、CC BY-NC-ND许可)以及其他(无机器可读的Creative Commons许可、无许可或自定义许可)。
The PMC Open Access Subset includes over 3.4 million journal articles and preprints, which are made available under licenses that permit reuse. Not all articles in PMC are eligible for text mining and other reuse activities, as many are protected by copyright. However, articles in the PMC Open Access Subset are provided under Creative Commons or similar licenses, which generally allow more unrestricted redistribution and reuse than traditional copyrighted works. The PMC Open Access Subset is part of the PMC Articles Dataset. Within the PMC Open Access Subset, there are three categories: works permitting commercial use (licenses including CC0, CC BY, CC BY-SA, CC BY-ND), works restricted to non-commercial use only (licenses including CC BY-NC, CC BY-NC-SA, CC BY-NC-ND), and other works (including those without machine-readable Creative Commons licenses, unlicensed works, or works under custom licenses).
提供机构:
pmc
原始信息汇总
数据集概述
名称: PMC Open Access Subset
语言: 英语 (en)
许可: 多种许可,包括CC0-1.0, CC-BY-4.0, CC-BY-SA-4.0, CC-BY-ND-4.0, CC-BY-NC-4.0, CC-BY-NC-SA-4.0, CC-BY-NC-ND-4.0, 其他, 未知。
多语言性: 单语种
大小: 1M<n<10M
来源: 原始数据
任务类别: 文本生成
任务ID: 语言建模
数据集结构
数据实例
每个数据实例包含以下字段:
text: 文本内容。pmid: PubMed ID。accession_id: 序列记录的唯一标识符。license: 许可类型。last_updated: 最后更新日期。retracted: 是否撤回。citation: 引用参考。
数据字段
text: 文本内容。pmid: PubMed ID。accession_id: 唯一标识符。license: 许可类型。last_updated: 最后更新日期。retracted: 是否撤回。citation: 引用参考。
数据分割
数据集未进行分割。
许可信息
许可条款因文章而异。请参考每篇文章中的许可声明以获取具体的许可使用条款。
在PMC Open Access Subset中,根据可用的许可条款分为三个组别:
- 允许商业使用 - CC0, CC BY, CC BY-SA, CC BY-ND许可;
- 仅限非商业使用 - CC BY-NC, CC BY-NC-SA, CC BY-NC-ND许可;
- 其他 - 无机器可读的Creative Commons许可,无许可,或自定义许可。
引用信息
PMC Open Access Subset [Internet]. Bethesda (MD): National Library of Medicine. 2003 - [cited YEAR MONTH DAY]. Available from https://www.ncbi.nlm.nih.gov/pmc/tools/openftlist/
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



