cwv-bench-v1

Hugging Face2026-02-04 更新2026-02-05 收录

下载链接：

https://huggingface.co/datasets/Ayush-Singh/cwv-bench-v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含与Web性能、代码复杂度和浏览器指标相关的详细数据。数据集结构复杂，包含多个嵌套字段，主要特征包括：ID、REPO_ID、FRAMEWORK、HOST_FILE_PATH等基础信息；IS_LIVE状态检查结果；cwv_mobile移动端性能指标（包括CLS、FCP、FID、INP、LCP、TTFB等核心Web指标的均值、中位数、评分和标准差）；CODE_STATS代码统计信息（包括按语言分类的文件数、行数和大小，以及依赖项）；COMPLEXITY_METRICS代码复杂度指标（如平均嵌套深度、最大嵌套深度、总函数数等）；BROWSER_METRICS浏览器指标（如控制台错误、资源大小、请求统计等）；以及THIRD_PARTY_EXTERNAL第三方集成信息（如Google Analytics、Segment等营销工具的使用情况）。数据集包含3,698个训练样本，总大小约为7.3MB。适用于Web性能分析、代码质量评估和第三方集成研究等任务。

创建时间：

2026-01-26

搜集汇总

数据集介绍

构建方式

在网页性能评估领域，cwv-bench-v1数据集通过系统化的数据采集流程构建而成。该数据集整合了来自多个开源代码仓库的网页项目，利用自动化工具对每个项目的网页进行实时状态检测与核心网页指标测量。数据采集过程涵盖了移动设备与桌面环境下的性能指标，包括首次内容绘制、最大内容绘制、累积布局偏移等关键维度，并通过多次运行确保数据的稳定性与可靠性，最终形成了结构化的性能基准数据集。

使用方法

使用该数据集时，研究人员可依据其结构化字段进行多维度的性能分析。通过ID、仓库标识及框架类型字段可进行样本筛选与分组比较；利用核心网页指标的详细统计数据，能够评估网站性能的整体分布与稳定性；而原始运行数据则支持时间序列分析或异常值检测。数据集适用于机器学习模型训练、前端框架性能基准测试，以及网页优化策略的实证研究，为性能工程领域提供量化的评估基础。

背景与挑战

背景概述

随着Web技术的飞速发展，用户体验成为衡量网站质量的核心指标，其中Core Web Vitals（CWV）作为谷歌提出的关键性能标准，聚焦于页面加载、交互响应和视觉稳定性。cwv-bench-v1数据集由研究机构或团队于近期创建，旨在系统评估开源项目在移动和桌面环境下的CWV表现，通过整合大量真实网页的性能数据，为前端优化、框架比较及性能基准测试提供实证基础。该数据集不仅推动了Web性能研究的定量化进程，还促进了开发社区对性能瓶颈的深入理解，对提升全球Web生态的整体体验具有深远影响。

当前挑战

cwv-bench-v1数据集致力于解决Web性能评估领域的核心问题，即如何准确、可重复地量化Core Web Vitals指标，以应对不同设备和网络条件下的性能波动挑战。在构建过程中，数据集面临多重困难：首先，数据采集需处理动态网页的复杂性，确保性能测量的稳定性和代表性；其次，整合异构开源项目时，需克服框架差异和代码版本不一致带来的数据对齐问题；此外，维护数据时效性以反映快速演进的Web技术也是一项持续挑战。这些因素共同构成了数据集在实用性和可靠性方面的关键障碍。

常用场景

经典使用场景

在网页性能优化领域，cwv-bench-v1数据集为研究者提供了大规模的真实世界网页核心性能指标数据。该数据集通过收集移动端和桌面端的CLS、LCP、FID等关键指标，支持对网页加载速度、交互响应性和视觉稳定性进行量化分析。经典使用场景包括构建基准测试框架，评估不同前端框架或优化策略对用户体验的影响，从而推动性能基准的标准化进程。

解决学术问题

该数据集解决了网页性能研究中缺乏大规模、细粒度真实数据的问题，为性能指标的统计建模和因果推断提供了基础。通过提供多维度聚合指标和原始运行数据，它支持研究者探索性能瓶颈的形成机制，验证性能优化理论的有效性，并促进跨设备、跨场景的性能一致性研究，对提升网络用户体验的学术探索具有重要价值。

实际应用

在实际应用中，cwv-bench-v1被广泛用于前端开发工具链的集成，帮助工程师监控和诊断生产环境中的性能回归。企业可基于该数据集建立自动化性能预警系统，结合A/B测试框架评估页面改版的效果。同时，内容分发网络和云服务提供商利用这些数据优化资源加载策略，最终提升全球用户的网页访问体验和业务转化率。

数据集最近研究