five

ImpactStory|学术研究数据集|影响力分析数据集

收藏
impactstory.org2024-10-26 收录
学术研究
影响力分析
下载链接:
https://impactstory.org/
下载链接
链接失效反馈
资源简介:
ImpactStory是一个用于追踪和展示学术研究影响力的在线平台。它提供了一个数据集,包含了研究人员、出版物、引用数据以及社交媒体上的提及等信息,帮助用户了解其研究成果的影响力和传播情况。
提供机构:
impactstory.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
ImpactStory数据集的构建基于对学术出版物、软件、数据集和其他研究成果的社会影响力进行全面评估。该数据集通过整合多种数据源,包括学术引用、社交媒体提及、政策引用和新闻报道等,系统地量化和分析了研究成果的广泛影响。构建过程中,采用了先进的网络爬虫技术和自然语言处理算法,以确保数据的全面性和准确性。
特点
ImpactStory数据集的显著特点在于其多维度的影响力评估体系,不仅涵盖传统的学术引用,还扩展到社交媒体、政策文件和新闻媒体等多个领域。这种多源数据的整合使得该数据集能够提供更为全面和深入的研究成果影响力分析。此外,数据集的动态更新机制确保了数据的时效性和相关性,使其成为研究影响力评估的重要工具。
使用方法
ImpactStory数据集的使用方法多样,适用于学术研究、政策制定和公众传播等多个领域。研究者可以通过该数据集评估其研究成果的社会影响力,识别潜在的合作机会和研究趋势。政策制定者可以利用数据集中的信息,了解特定研究成果在政策制定中的应用情况,从而做出更为科学的决策。公众则可以通过数据集了解科学研究的广泛影响,增强对科学研究的理解和信任。
背景与挑战
背景概述
ImpactStory数据集源自于2011年,由Jason Priem和Heather Piwowar共同创立,旨在解决学术研究成果的可见性和影响力评估问题。传统上,学术界主要依赖于引用次数来衡量研究的影响力,但这种方法存在局限性,无法全面反映研究成果在社会、政策和教育等领域的实际影响。ImpactStory通过收集和分析多种数据源,如社交媒体提及、新闻报道和政策引用,提供了一个更为全面的影响力评估框架。该数据集的开发不仅推动了学术评价体系的多元化,还为研究人员提供了更丰富的自我展示平台,从而在学术界产生了深远的影响。
当前挑战
ImpactStory数据集在构建过程中面临了多重挑战。首先,数据源的多样性要求开发团队具备跨领域的数据整合能力,确保不同来源的数据能够有效融合。其次,数据的质量和可靠性是一个持续的挑战,因为社交媒体和新闻报道等非传统数据源可能存在偏差和不准确性。此外,如何确保数据分析的透明性和公正性,避免算法偏见,也是该数据集需要解决的重要问题。最后,随着数据量的不断增长,如何高效地存储和处理这些数据,以提供实时的影响力评估,是ImpactStory团队持续面临的挑战。
发展历史
创建时间与更新
ImpactStory数据集的创建时间可追溯至2011年,由Jason Priem和Heather Piwowar共同发起。该数据集在2013年进行了首次重大更新,随后在2015年进行了第二次更新,以适应学术研究领域的需求变化。
重要里程碑
ImpactStory数据集的重要里程碑包括其在2013年推出的开放获取工具,这一工具极大地促进了学术成果的透明度和可访问性。此外,2015年的更新引入了新的指标和分析工具,使得研究人员能够更全面地评估其研究成果的影响力。这些里程碑不仅提升了数据集的功能性,还推动了学术界对研究成果影响力的量化和透明化进程。
当前发展情况
目前,ImpactStory数据集已成为学术研究领域中评估研究成果影响力的重要工具之一。它不仅提供了丰富的数据和分析工具,还通过与多个学术数据库的整合,增强了其数据来源的多样性和可靠性。ImpactStory的持续发展对学术界的影响深远,它不仅帮助研究人员更好地理解其研究的社会和学术影响,还推动了学术评价体系的多元化和透明化。
发展历程
  • ImpactStory首次发表,作为一个开源项目,旨在通过数据分析来衡量科研成果的影响力。
    2011年
  • ImpactStory获得美国国家科学基金会(NSF)的资助,进一步推动其发展和应用。
    2012年
  • ImpactStory发布其首个正式版本,开始在科研社区中广泛应用,帮助研究人员评估其研究成果的影响力。
    2013年
  • ImpactStory与多个学术出版机构和研究机构建立合作关系,扩大其数据集的应用范围。
    2014年
  • ImpactStory推出新的功能,包括对社交媒体和开放获取资源的分析,进一步丰富其数据集的内容和应用。
    2015年
  • ImpactStory获得更多的资金支持,用于扩展其数据集的覆盖范围和提升数据分析的准确性。
    2016年
  • ImpactStory发布其数据集的API,使得更多的第三方应用可以集成和利用其数据。
    2017年
  • ImpactStory与多个国际研究机构合作,推动其数据集在全球范围内的应用和影响力。
    2018年
  • ImpactStory对其数据集进行了重大更新,增加了对新兴研究领域的支持,如人工智能和大数据分析。
    2019年
  • ImpactStory继续扩展其数据集的应用场景,包括在教育、政策制定和商业领域的应用。
    2020年
常用场景
经典使用场景
在学术研究领域,ImpactStory数据集常用于评估和量化科研成果的社会影响力。通过收集和分析科研成果在社交媒体、新闻报道、政策文件等非传统学术渠道中的传播情况,该数据集为研究人员提供了一个全面的影响力评估工具。
衍生相关工作
基于ImpactStory数据集,许多研究工作探讨了科研成果社会影响力的量化方法和模型。例如,有研究提出了基于社交媒体数据的科研影响力评估模型,进一步细化了ImpactStory的分析框架。此外,还有工作探讨了如何将这些量化指标整合到传统的学术评价体系中,以实现更全面的科研评价。
数据集最近研究
最新研究方向
在学术影响力评估领域,ImpactStory数据集的最新研究方向主要集中在开发和验证新的指标,以更全面地衡量学术成果的社会影响力。研究者们致力于整合多源数据,如社交媒体、新闻报道和政策引用,以构建更为综合的影响力评估模型。此外,该领域的研究还关注如何通过数据分析技术,识别和量化学术成果在非传统学术渠道中的传播和影响,从而为学术评价体系提供更为多元和公正的视角。这些研究不仅推动了学术评价的科学化进程,也为政策制定者和学术机构提供了重要的决策支持。
相关研究论文
  • 1
    ImpactStory: A Web-Based Tool for Tracking the Impact of Research OutputsUniversity of Texas at Austin · 2013年
  • 2
    Measuring the Impact of Research: A Review of Tools and IndicatorsUniversity of Granada · 2019年
  • 3
    The Role of Altmetrics in Measuring Research Impact: A Systematic ReviewUniversity of Sheffield · 2020年
  • 4
    Altmetrics: A Review of the State of the ArtUniversity of Amsterdam · 2018年
  • 5
    The Evolution of Altmetrics: From Concept to PracticeUniversity of California, Los Angeles · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Materials Project 在线材料数据库

Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。

超神经 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录