Expenditure on Research and Development
收藏github2020-03-07 更新2024-05-31 收录
下载链接:
https://github.com/datasets/expenditure-on-research-and-development
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含自1996年以来各国在医学和健康科学领域的研究与开发支出数据,包括资金来源、R&D活动类型和领域等指标。数据来源于UNESCO统计研究所,经过提取和合并处理,最终形成可用的数据集。
This dataset encompasses data on research and development expenditures in the fields of medical and health sciences by various countries since 1996, including indicators such as funding sources, types of R&D activities, and fields. The data is sourced from the UNESCO Institute for Statistics, having undergone extraction and consolidation processes to form a usable dataset.
创建时间:
2017-11-02
原始信息汇总
数据集概述
数据来源
- 数据源自联合国教科文组织统计研究所(UNESCO Institute for Statistics),网址为:http://data.uis.unesco.org。
数据内容
- 包含各国自1996年以来的研发支出信息,具体包括:
- 资金来源:企业、政府、高等教育、私人非营利、世界其他地区、未指定来源。
- 研发活动类型:基础研究、应用研究、实验开发、未指定活动。
- 研发领域:医学与健康科学。
数据准备
- 原始数据位于
archive/gerd.csv。 - 数据处理步骤包括:
- 按资金来源和活动类型分别提取数据。
- 提取医学与健康科学领域的数据。
- 使用
pandas库将数据合并为data/medical.csv。
- 最终合并数据
data/expenditure.csv通过运行scripts/process.py脚本获得。
许可证
- 数据集采用公共领域贡献许可(Public Domain Dedication and License, PDDL)。
搜集汇总
数据集介绍

构建方式
针对研究与开发(R&D)支出的数据集,其构建方式始于对unesco统计研究所提供的数据进行深度加工。首先,数据按照资金来源分类,包括企业、政府、高等教育、私人非营利组织等。其次,根据活动类型,如基础研究、应用研究、实验开发等进行划分。最后,专研于医疗和健康科学的R&D支出数据也被单独提取并整合,形成最终的`data/expenditure.csv`文件,整个流程通过python脚本自动化完成。
特点
本数据集显著的特点在于其详尽性与专业性,覆盖了自1996年以来各国在R&D领域的支出情况,详细记录了不同资金来源、活动类型以及特定领域(医疗和健康科学)的支出数据。其数据来源的权威性以及加工过程的透明性,确保了数据集的可靠性和准确性。
使用方法
用户可通过对数据集GitHub详情页面的访问,获取到数据集的概述及其使用方法。数据集以CSV格式存储,可通过运行提供的python脚本`scripts/process.py`来合并不同分类的数据,进而获得完整的支出数据。此外,用户还可以直接访问unesco统计数据网站,以获取更多详细和原始的数据信息。
背景与挑战
背景概述
‘Expenditure on Research and Development’数据集,简称R&D数据集,是由联合国教科文组织统计研究所(UNESCO Institute for Statistics)自1996年起收集并发布的。该数据集聚焦于各国在科学研究与发展领域的资金投入,包括资金来源、研发活动类型以及研发领域(如医学与健康科学)等多个指标,为研究者提供了宝贵的国别研发投资信息。数据集的创建,不仅为政策制定者提供了决策支持,也为科研工作者和相关领域的研究提供了重要数据资源。
当前挑战
在构建该数据集过程中,面临了多方面的挑战。首先,数据集需要整合不同资金来源的数据,如企业、政府、高等教育、私人非营利组织等,这要求在数据清洗和整合过程中保持高度的一致性和准确性。其次,数据集还需按照研发活动的类型和领域进行分类,对数据的质量和分类的准确性提出了较高要求。此外,数据集构建还需考虑到数据隐私和知识产权的问题,确保在公开数据时符合相关法律法规,并在公共领域 dedication and license (PDDL) 下进行合理共享。
常用场景
经典使用场景
在科学研究的领域内,‘Expenditure on Research and Development’数据集的典型应用场景在于对各国研发活动的资金投入进行深入分析。通过该数据集,研究人员可以详细地考察政府、私营部门等不同资金来源的投入情况,以及基础研究、应用研究、实验开发等不同研发活动的资金分配,进而为国家科技创新政策的制定提供数据支持。
实际应用
在实际应用中,此数据集被广泛应用于政策制定、科研机构绩效评估、以及经济预测等多个领域。政府机构可以利用这些数据来监测和评估研发政策的实施效果,而企业和投资者则可借此进行市场趋势分析,以指导研发投资决策。
衍生相关工作
基于此数据集,已经衍生出一系列相关的研究工作,如对各国研发投资效率的比较研究、特定领域如医疗健康科学研发投资的长期趋势分析等。这些工作不仅加深了我们对全球研发活动的理解,也为政策制定者提供了重要的决策参考。
以上内容由遇见数据集搜集并总结生成



