five

tokyo-vpn-monitor

收藏
Hugging Face2026-01-10 更新2026-01-11 收录
下载链接:
https://huggingface.co/datasets/blstweb0901/tokyo-vpn-monitor
下载链接
链接失效反馈
官方服务:
资源简介:
东京VPN速度监测数据集包含从日本东京收集的连续自动化VPN性能测量数据。该数据集展示了零成本基础设施方法在网络监测中的应用,使用免费层服务实现了99.8%的运行时间。 主要特点: - 🤖 完全自动化:使用Google Apps Script构建,无需人工干预 - 💰 零成本:使用免费层基础设施,每月运营成本为0美元 - 📊 持续更新:每6小时(每天4次)进行测量 - 🌏 地理覆盖:日本东京 - 📈 高可靠性:99.8%的系统运行时间 - 🔓 开放许可:MIT许可证 - 可免费用于商业、研究和教育用途 支持的任务: - 网络性能分析:VPN性能指标的时间序列分析 - 比较基准测试:15个VPN提供商的性能比较 - 预测建模:用于网络性能预测的机器学习模型 - 统计分析:基于变异系数(CV)的稳定性评估 - 教育用途:数据科学教程和示例 - 基础设施研究:零成本自动化系统案例研究

Tokyo VPN Speed Monitoring Dataset contains continuous automated VPN performance measurement data collected from Tokyo, Japan. This dataset showcases the application of zero-cost infrastructure methodologies in network monitoring, where free-tier services are utilized to achieve a 99.8% system uptime. Key Features: - 🤖 Fully Automated: Developed using Google Apps Script, with no manual intervention required - 💰 Zero-Cost Deployment: Relies on free-tier infrastructure, resulting in a monthly operating cost of $0 - 📊 Scheduled Updates: Measurements are performed every 6 hours (4 times daily) - 🌏 Geographical Scope: Tokyo, Japan - 📈 High Reliability: Boasts a 99.8% system uptime rate - 🔓 Open License: Released under the MIT License, freely available for commercial, research and educational uses Supported Tasks: - Network Performance Analysis: Time-series analysis of VPN performance metrics - Comparative Benchmark Testing: Performance comparison across 15 VPN service providers - Predictive Modeling: Machine learning models for network performance prediction - Statistical Analysis: Stability assessment based on the Coefficient of Variation (CV) - Educational Purposes: Data science tutorials and practical examples - Infrastructure Research: Case study of a zero-cost automated monitoring system
创建时间:
2026-01-02
原始信息汇总

Tokyo VPN Speed Monitor Dataset 数据集概述

数据集基本信息

  • 数据集名称: Tokyo VPN Speed Monitor Dataset
  • 主页: https://www.blstweb.jp/network/vpn/tokyo-vpn-speed-monitor/
  • 代码仓库: https://github.com/hmy0210/vpn-stability-ranking
  • 联系人: Takeshi Hamaya (ORCID: https://orcid.org/0009-0001-8884-7323)
  • 许可证: MIT License
  • 语言: 英语、日语
  • 标签: vpn, network-monitoring, performance-measurement, time-series, networking, internet-measurement, automated-testing, zero-cost-infrastructure, google-apps-script
  • 任务类别: 其他
  • 规模类别: 1K<n<10K

数据集摘要

该数据集包含从日本东京持续自动收集的VPN性能测量数据。它展示了一种零成本基础设施的网络监控方法,仅使用免费层服务即实现了99.8%的运行时间。

主要特点:

  • 完全自动化: 使用Google Apps Script构建,无需人工干预。
  • 零成本: 使用免费层基础设施,每月运营成本为0美元。
  • 持续更新: 每6小时测量一次(每日4次)。
  • 地理覆盖范围: 日本东京。
  • 高可靠性: 系统运行时间为99.8%。
  • 开放许可证: MIT许可证,可免费用于商业、研究和教育用途。

支持的任务

  • 网络性能分析:VPN性能指标的时间序列分析。
  • 比较基准测试:15个VPN提供商之间的性能比较。
  • 预测建模:用于网络性能预测的机器学习模型。
  • 统计分析:基于变异系数(CV)的稳定性评估。
  • 教育目的:数据科学教程和示例。
  • 基础设施研究:零成本自动化系统案例研究。

数据集结构

数据实例

典型的数据实例如下: json { "timestamp": "2025-12-01 00:00:00", "vpn_service": "NordVPN", "download_mbps": 480.5, "upload_mbps": 290.3, "ping_ms": 12.4, "instant_stability": 87.2, "reliability_percent": 98.5, "overall_score": 92.3, "rank": 1 }

数据字段

字段 类型 描述
timestamp 字符串 测量日期时间 (YYYY-MM-DD HH:MM:SS)
vpn_service 字符串 VPN提供商名称(15项服务)
download_mbps 浮点数 下载速度(Mbps)
upload_mbps 浮点数 上传速度(Mbps)
ping_ms 浮点数 网络延迟(毫秒)
instant_stability 浮点数 速度变化指标(0-100,越高越稳定)
reliability_percent 浮点数 连接可靠性百分比
overall_score 浮点数 综合性能得分(0-100)
rank 整数 基于overall_score的性能排名

数据划分

数据集目前包含一个划分:

划分 实例数 大小
train 1,245+ ~80 KB

注意: 数据集持续增长。每6小时添加一次测量数据。

数据集创建

创建理由

创建此数据集是为了解决VPN市场缺乏客观、透明性能数据的问题。

源数据

数据收集过程:

  1. 计划触发器每6小时执行一次(日本标准时间00:00, 06:00, 12:00, 18:00)。
  2. 使用标准化测试方法进行速度测试。
  3. 应用变异系数(CV)进行统计分析。
  4. 结果自动存储在Google电子表格中。
  5. 数据同步到多个平台。

测量地点: 日本东京 (35.6762°N, 139.6503°E)。 目标服务: 15个主要VPN提供商。

标注

数据由测量系统自动标注:

  • 即时稳定性: 使用速度测量的变异系数(CV)计算。
  • 可靠性: 源自连接成功率和中断检测数据。
  • 综合得分: 速度、稳定性和可靠性指标的加权综合。
  • 排名: 根据overall_score自动分配。

个人和敏感信息

此数据集不包含任何个人或敏感信息。所有数据包括:

  • 网络性能指标。
  • VPN服务名称(公开信息)。
  • 时间戳。
  • 地理位置(城市级别:东京)。

使用注意事项

社会影响

积极影响:

  • 提高VPN市场的透明度。
  • 支持明智的消费者决策。
  • 支持网络性能的学术研究。
  • 展示可持续的零成本基础设施。

潜在风险:

  • 性能数据可能无法推广到其他地理位置。
  • 测量仅反映东京的网络状况。
  • VPN性能可能因用户位置和时间而异。

偏差讨论

  • 地理偏差: 所有测量均来自日本东京。其他地区的性能可能不同。
  • 时间偏差: 在固定间隔(每6小时)进行的测量可能无法以不同方式捕捉高峰使用期。
  • 选择偏差: 数据集包括根据市场受欢迎程度选择的15个主要VPN提供商。
  • 基础设施偏差: 所有测量使用相同的网络基础设施和测试方法。

其他已知限制

  • 单一地点: 仅来自东京的测量。
  • 固定时间表: 6小时间隔可能错过短期波动。
  • 有限指标: 侧重于速度和可靠性;不测量安全功能。
  • 增长型数据集: 持续更新意味着数据集大小随时间增加。

附加信息

数据集管理者

创建者: Takeshi Hamaya。 所属机构: BLST WEB。 联系方式:

  • ORCID: https://orcid.org/0009-0001-8884-7323
  • GitHub: https://github.com/hmy0210
  • 网站: https://www.blstweb.jp

技术基础设施

系统架构:

  • 平台: Google Apps Script。
  • 成本: 0美元/月(免费层)。
  • 运行时间: 99.8%。
  • 自动化: 8个集成引擎。

数据存储: Google电子表格。 源代码: https://github.com/hmy0210/vpn-stability-ranking。

实时仪表板

实时数据可视化可在以下网址获取:https://www.blstweb.jp/network/vpn/tokyo-vpn-speed-monitor/。

更新和版本控制

这是一个持续更新的数据集。每6小时添加新的测量数据。

更新计划:

  • 测量:每6小时一次(日本标准时间00:00, 06:00, 12:00, 18:00)。
  • 数据集刷新:每周。
  • 版本:数据带有时间戳;使用timestamp字段按日期筛选。

未来计划

  • 扩大地理覆盖范围(大阪、名古屋等)。
  • 添加更多VPN提供商。
  • 开发用于性能预测的ML模型。
  • 发布季度分析报告。

引用信息

APA格式引用:

Hamaya, T. (2025). Tokyo VPN Speed Monitor Dataset. Hugging Face. https://huggingface.co/datasets/blastweb/tokyo-vpn-monitor

BibTeX格式引用: bibtex @misc{hamaya_tokyo_vpn_2026, author = {Hamaya, Takeshi}, title = {{Tokyo VPN Speed Monitor Dataset}}, year = {2026}, publisher = {Zenodo}, doi = {10.5281/zenodo.18207135} }

其他DOI:

  • Harvard Dataverse:https://doi.org/10.7910/DVN/OMC9A4
  • Zenodo:https://doi.org/10.5281/zenodo.18091751
  • IEEE DataPort:https://doi.org/10.21227/9ej5-dp09
  • Kaggle:https://doi.org/10.34740/kaggle/dsv/14451497
  • figshare:https://doi.org/10.6084/m9.figshare.30969004
  • OSF:https://doi.org/10.17605/OSF.IO/VNCDH
  • Mendeley Data:https://doi.org/10.17632/hysp9jzg5h.2
搜集汇总
数据集介绍
main_image_url
构建方式
在虚拟专用网络性能监测领域,东京VPN速度监控数据集通过一种创新的零成本自动化框架构建而成。该框架基于Google Apps Script平台,以每六小时一次的固定频率,从东京的地理位置对十五家主流VPN服务商执行标准化的网络测速。系统自动采集下载与上传速度、网络延迟等核心指标,并运用变异系数等统计方法计算即时稳定性与可靠性,最终合成综合评分与排名,所有数据均实时存储于电子表格并同步至多个平台,实现了高达99.8%的系统运行时间。
特点
该数据集的特点体现在其完全自动化与零成本的运维模式,以及持续动态更新的时间序列属性。数据以六小时为间隔规律采集,确保了监测的连续性与时效性,为研究网络性能的时序波动提供了高频率样本。每条记录均包含速度、延迟、稳定性评分及综合排名等多维指标,结构清晰且便于量化分析。然而,数据集也存在明确的地理局限性,所有测量均源自东京单一节点,且服务商选择基于市场普及度,因此在将结论推广至其他区域或全部VPN产品时需谨慎考虑其潜在偏差。
使用方法
该数据集适用于网络性能分析、服务商比较基准测试以及时间序列预测建模等多种任务。研究者可直接利用其结构化的JSON或表格格式数据,通过时间戳字段进行切片,分析不同VPN服务在特定时段内的性能趋势与稳定性。数据集支持基于综合评分进行排名比较,也可将下载速度、延迟等原始指标作为特征,构建机器学习模型以预测网络质量。鉴于数据持续更新,建议在使用时注明数据获取的时间范围,并注意其东京地域性的限制,以确保分析结论的适用场景得当。
背景与挑战
背景概述
在虚拟专用网络(VPN)服务市场迅速扩张的背景下,客观、透明的性能数据长期匮乏,消费者与研究者难以获取可靠的网络质量评估依据。东京VPN速度监控数据集由研究员Takeshi Hamaya于2025年创建,隶属于BLST WEB机构,旨在通过自动化监测系统,持续收集日本东京地区15家主流VPN服务商的性能指标。该数据集的核心研究问题聚焦于揭示VPN服务的真实网络性能,包括下载与上传速度、延迟及稳定性,从而为消费者选择、学术研究以及零成本基础设施的可行性论证提供实证基础。其采用完全自动化的零成本架构,依托Google Apps Script实现高达99.8%的系统运行时间,不仅提升了网络测量领域的透明度,也为可持续的数据收集方法树立了典范。
当前挑战
该数据集致力于解决VPN网络性能评估领域的核心挑战,即如何在缺乏标准化、持续更新的客观数据环境下,对多服务商进行公平、可比较的性能度量。构建过程中的主要挑战包括设计一套全自动、零成本的测量基础设施,确保在有限资源下实现高频率(每6小时)的数据采集与近百分之百的系统可靠性。此外,数据收集面临地理与时间维度的固有偏差,所有测量均局限于东京单一地点,且固定间隔采样可能无法完全捕捉网络流量的瞬时波动与峰值负载。这些挑战要求研究者在数据解释与模型泛化时,审慎考虑其空间局限性与时间代表性。
常用场景
经典使用场景
在虚拟专用网络性能评估领域,Tokyo VPN Speed Monitor Dataset 为研究人员提供了连续、自动化的时间序列数据,其经典使用场景聚焦于网络性能的纵向分析。通过每六小时采集一次的下载速度、上传速度和延迟等指标,该数据集支持对15家主流VPN服务商在东京地区的稳定性进行系统性比较。基于变异系数的即时稳定性计算和综合评分排名,使得用户能够深入探究不同VPN提供商在特定地理区域内的性能波动规律,为网络服务质量监测提供了实证基础。
实际应用
在实际应用层面,该数据集为消费者选择VPN服务提供了客观的决策依据,增强了市场的透明度。企业可利用其进行竞品分析和服务质量监控,优化网络资源配置。教育机构则将其作为数据科学和网络工程教学的现实案例,帮助学生理解时间序列分析、性能评估和自动化系统构建。此外,其展示的基于免费层服务的零成本监测架构,为中小型组织部署经济高效的网络监控方案提供了可借鉴的蓝本。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在网络性能预测模型的构建与稳定性评估方法的改进上。研究者利用其时间序列特性开发机器学习模型,以预测VPN服务的性能趋势和潜在故障。同时,基于变异系数的稳定性度量方法被进一步优化,用于更精细的网络质量评估。该数据集也常作为基准,用于验证新的网络测量算法或比较不同自动化数据收集框架的效率与可靠性,推动了相关工具与方法的持续发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作