ROSS Index
收藏github2025-10-23 更新2025-10-24 收录
下载链接:
https://github.com/RunaCapital/ROSS-Index
下载链接
链接失效反馈官方服务:
资源简介:
ROSS Index是一个开源初创企业指数数据集,自2020年第二季度起,每季度发布基于GitHub星标相对增长率排名的前20名开源初创企业。数据集包含从2020年到2025年的季度和年度数据,采用透明的方法论,专注于新兴开源项目的趋势分析。
The ROSS Index is an open-source startup index dataset. Since the second quarter of 2020, it has released the top 20 open-source startups ranked by the relative growth rate of GitHub stargazers on a quarterly basis. The dataset covers quarterly and annual data from 2020 through 2025, with a transparent methodology and a focus on trend analysis of emerging open-source projects.
创建时间:
2025-09-29
原始信息汇总
ROSS Index 数据集概述
数据集基本信息
- 数据集名称:ROSS Index
- 维护机构:Runa Capital 风险投资公司
- 创建者:Konstantin Vinogradov
- 数据覆盖时间:2020年第二季度至2025年第三季度
数据内容
时间范围
- 2020年:Q2、Q3、Q4
- 2021年:Q1、Q2、Q3、Q4
- 2022年:Q1、Q2、Q3、Q4、Annual
- 2023年:Q1、Q2、Q3、Q4、Annual
- 2024年:Q1、Q2、Q3、Q4、Annual
- 2025年:Q1、Q2、Q3
数据指标
- 核心指标:GitHub仓库星标相对增长率
- 起始条件:仓库星标数超过1000
- 发布频率:每季度发布一次
- 排名数量:前20名开源初创企业
方法论
指标选择依据
- 使用单一基础指标确保结果可外部验证
- 星标指标可在不同仓库间提供合理比较
- 相对增长率关注新兴项目而非成熟项目
计算方法(2024年第一季度起)
-
观测期要求:
- 仓库星标数≥1000
- 观测期为连续90天
- 观测期结束时间在目标季度内
-
增长率计算:
- 增长率 = (期末星标数)/(期初星标数)
- 按增长率降序排列
初创企业定义
- 成立时间:少于10年
- 融资总额:已知融资少于1亿美元
- 产品关联:产品与开源仓库合理关联
- 状态要求:目标期结束时未被收购或上市
数据来源
- GitHub公开数据
- Crunchbase
- 大众媒体
- 其他公开来源
历史计算方法
- 时间范围:2020-2023年
- 计算方式:固定期间内星标相对增长率
- 年化增长率公式:AGR = (当前值/一季度前值)⁴ - 1
数据特点
- 仅使用英语描述的初创企业
- 关注公司起源地而非仅总部位置
- 基于完全公开数据,不使用私有信息
搜集汇总
数据集介绍

构建方式
在开源创业生态评估领域,ROSS Index采用动态量化方法构建数据集。该数据集通过追踪GitHub仓库的星标增长趋势,选取初始星标数超过1000的开源项目作为观测对象,采用滑动窗口机制计算90日内相对增长率。数据采集严格限定于公开渠道,整合GitHub元数据与Crunchbase融资信息,通过双重验证机制确保企业资质符合初创公司定义——即成立未满十年、融资额低于1亿美元且具有明确产品导向的商业实体。
特点
该数据集的核心特征体现在其纵向连续性与横向可比性。自2020年第二季度起持续更新季度与年度数据,形成跨越五年的观测序列。其独特价值在于聚焦新兴开源项目的爆发式增长阶段,通过相对增长率指标削弱头部项目的马太效应。数据维度涵盖企业地理分布、融资阶段与技术领域分类,既保留原始星标数值的透明度,又通过标准化处理消除项目体量差异带来的评估偏差。
使用方法
研究者在应用该数据集时,可通过GitHub仓库的版本化目录结构按需获取特定时段数据。每个季度子目录包含经过标准化处理的增长率排名清单,配套元数据详细记载企业的成立时间、融资规模及技术栈特征。数据分析应结合年度汇总文件进行纵向对比,注意2024年前后计算方法差异对时间序列分析的影响。使用过程中需遵循数据溯源原则,将原始星标数据与衍生指标进行交叉验证。
背景与挑战
背景概述
在开源软件投资领域量化评估新兴企业潜力的需求催生了ROSS Index的诞生。该数据集由Runa Capital风险投资公司于2020年第二季度正式创建,核心研究员Konstantin Vinogradov通过追踪GitHub仓库星标增长率,构建了面向初创企业的开源项目评估体系。其创新性地采用相对增长率为衡量标准,聚焦突破千星门槛后的项目发展轨迹,为风险投资机构提供了识别高潜力开源初创公司的科学依据。这一方法论不仅革新了传统投资评估模式,更推动了开源生态与商业资本的深度融合。
当前挑战
在解决开源初创企业评估难题时,该数据集面临核心指标单一化的局限。GitHub星标虽具普适性,但无法全面反映代码质量、社区活跃度等关键维度。构建过程中需应对数据源异构性挑战,包括Crunchbase融资信息与GitHub动态的时序对齐,以及多语言项目中英语描述的筛选偏差。此外,开源许可证定义的商业兼容性争议,以及滑动时间窗口算法对短期爆发项目的捕捉灵敏度,均为持续优化的关键课题。
常用场景
经典使用场景
在开源创业生态分析领域,ROSS Index通过追踪GitHub星标增长率为研究者提供动态评估框架。该数据集最经典的应用场景体现在对新兴开源初创企业的成长性量化分析上,其基于90天滑动窗口的星标相对增长率算法,能够精准捕捉开发社区中快速崛起的开源项目。这种以千人星标为起点的计量方式,既规避了成熟项目的规模优势,又为早期创新项目提供了公平的对比基准,成为风险投资机构和学术研究观察开源趋势的重要透镜。
解决学术问题
该数据集有效解决了开源软件生态研究中缺乏标准化评估体系的学术难题。通过构建基于单一可验证指标的评价框架,它克服了传统多维度指标存在的权重分配主观性问题,为量化分析开源项目的社区热度提供了可靠方法。其严格定义的初创企业筛选标准,包括成立年限、融资规模等参数,为研究开源商业模式与技术创新关联性提供了结构化数据支撑,推动了对开源经济价值形成机制的深入探索。
衍生相关工作
基于ROSS Index的衍生研究已形成多个经典方向。在方法论层面,学者们借鉴其星标增长率模型开发了更精细的开源项目评估体系。投资分析领域出现了结合融资数据与星标增长的复合预测模型,显著提升了对开源初创企业的估值准确性。部分研究还延伸至地缘经济分析,通过指数中的企业地域分布探讨全球开源创新格局的演变规律,这些工作持续推动着开源经济学的理论发展。
以上内容由遇见数据集搜集并总结生成



