tokyo-vpn-monitor
收藏Tokyo VPN Speed Monitor Dataset 数据集概述
数据集基本信息
- 数据集名称: Tokyo VPN Speed Monitor Dataset
- 主页: https://www.blstweb.jp/network/vpn/tokyo-vpn-speed-monitor/
- 代码仓库: https://github.com/hmy0210/vpn-stability-ranking
- 联系人: Takeshi Hamaya (ORCID: https://orcid.org/0009-0001-8884-7323)
- 许可证: MIT License
- 语言: 英语、日语
- 标签: vpn, network-monitoring, performance-measurement, time-series, networking, internet-measurement, automated-testing, zero-cost-infrastructure, google-apps-script
- 任务类别: 其他
- 规模类别: 1K<n<10K
数据集摘要
该数据集包含从日本东京持续自动收集的VPN性能测量数据。它展示了一种零成本基础设施的网络监控方法,仅使用免费层服务即实现了99.8%的运行时间。
主要特点:
- 完全自动化: 使用Google Apps Script构建,无需人工干预。
- 零成本: 使用免费层基础设施,每月运营成本为0美元。
- 持续更新: 每6小时测量一次(每日4次)。
- 地理覆盖范围: 日本东京。
- 高可靠性: 系统运行时间为99.8%。
- 开放许可证: MIT许可证,可免费用于商业、研究和教育用途。
支持的任务
- 网络性能分析:VPN性能指标的时间序列分析。
- 比较基准测试:15个VPN提供商之间的性能比较。
- 预测建模:用于网络性能预测的机器学习模型。
- 统计分析:基于变异系数(CV)的稳定性评估。
- 教育目的:数据科学教程和示例。
- 基础设施研究:零成本自动化系统案例研究。
数据集结构
数据实例
典型的数据实例如下: json { "timestamp": "2025-12-01 00:00:00", "vpn_service": "NordVPN", "download_mbps": 480.5, "upload_mbps": 290.3, "ping_ms": 12.4, "instant_stability": 87.2, "reliability_percent": 98.5, "overall_score": 92.3, "rank": 1 }
数据字段
| 字段 | 类型 | 描述 |
|---|---|---|
timestamp |
字符串 | 测量日期时间 (YYYY-MM-DD HH:MM:SS) |
vpn_service |
字符串 | VPN提供商名称(15项服务) |
download_mbps |
浮点数 | 下载速度(Mbps) |
upload_mbps |
浮点数 | 上传速度(Mbps) |
ping_ms |
浮点数 | 网络延迟(毫秒) |
instant_stability |
浮点数 | 速度变化指标(0-100,越高越稳定) |
reliability_percent |
浮点数 | 连接可靠性百分比 |
overall_score |
浮点数 | 综合性能得分(0-100) |
rank |
整数 | 基于overall_score的性能排名 |
数据划分
数据集目前包含一个划分:
| 划分 | 实例数 | 大小 |
|---|---|---|
| train | 1,245+ | ~80 KB |
注意: 数据集持续增长。每6小时添加一次测量数据。
数据集创建
创建理由
创建此数据集是为了解决VPN市场缺乏客观、透明性能数据的问题。
源数据
数据收集过程:
- 计划触发器每6小时执行一次(日本标准时间00:00, 06:00, 12:00, 18:00)。
- 使用标准化测试方法进行速度测试。
- 应用变异系数(CV)进行统计分析。
- 结果自动存储在Google电子表格中。
- 数据同步到多个平台。
测量地点: 日本东京 (35.6762°N, 139.6503°E)。 目标服务: 15个主要VPN提供商。
标注
数据由测量系统自动标注:
- 即时稳定性: 使用速度测量的变异系数(CV)计算。
- 可靠性: 源自连接成功率和中断检测数据。
- 综合得分: 速度、稳定性和可靠性指标的加权综合。
- 排名: 根据overall_score自动分配。
个人和敏感信息
此数据集不包含任何个人或敏感信息。所有数据包括:
- 网络性能指标。
- VPN服务名称(公开信息)。
- 时间戳。
- 地理位置(城市级别:东京)。
使用注意事项
社会影响
积极影响:
- 提高VPN市场的透明度。
- 支持明智的消费者决策。
- 支持网络性能的学术研究。
- 展示可持续的零成本基础设施。
潜在风险:
- 性能数据可能无法推广到其他地理位置。
- 测量仅反映东京的网络状况。
- VPN性能可能因用户位置和时间而异。
偏差讨论
- 地理偏差: 所有测量均来自日本东京。其他地区的性能可能不同。
- 时间偏差: 在固定间隔(每6小时)进行的测量可能无法以不同方式捕捉高峰使用期。
- 选择偏差: 数据集包括根据市场受欢迎程度选择的15个主要VPN提供商。
- 基础设施偏差: 所有测量使用相同的网络基础设施和测试方法。
其他已知限制
- 单一地点: 仅来自东京的测量。
- 固定时间表: 6小时间隔可能错过短期波动。
- 有限指标: 侧重于速度和可靠性;不测量安全功能。
- 增长型数据集: 持续更新意味着数据集大小随时间增加。
附加信息
数据集管理者
创建者: Takeshi Hamaya。 所属机构: BLST WEB。 联系方式:
- ORCID: https://orcid.org/0009-0001-8884-7323
- GitHub: https://github.com/hmy0210
- 网站: https://www.blstweb.jp
技术基础设施
系统架构:
- 平台: Google Apps Script。
- 成本: 0美元/月(免费层)。
- 运行时间: 99.8%。
- 自动化: 8个集成引擎。
数据存储: Google电子表格。 源代码: https://github.com/hmy0210/vpn-stability-ranking。
实时仪表板
实时数据可视化可在以下网址获取:https://www.blstweb.jp/network/vpn/tokyo-vpn-speed-monitor/。
更新和版本控制
这是一个持续更新的数据集。每6小时添加新的测量数据。
更新计划:
- 测量:每6小时一次(日本标准时间00:00, 06:00, 12:00, 18:00)。
- 数据集刷新:每周。
- 版本:数据带有时间戳;使用timestamp字段按日期筛选。
未来计划
- 扩大地理覆盖范围(大阪、名古屋等)。
- 添加更多VPN提供商。
- 开发用于性能预测的ML模型。
- 发布季度分析报告。
引用信息
APA格式引用:
Hamaya, T. (2025). Tokyo VPN Speed Monitor Dataset. Hugging Face. https://huggingface.co/datasets/blastweb/tokyo-vpn-monitor
BibTeX格式引用: bibtex @misc{hamaya_tokyo_vpn_2026, author = {Hamaya, Takeshi}, title = {{Tokyo VPN Speed Monitor Dataset}}, year = {2026}, publisher = {Zenodo}, doi = {10.5281/zenodo.18207135} }
其他DOI:
- Harvard Dataverse:https://doi.org/10.7910/DVN/OMC9A4
- Zenodo:https://doi.org/10.5281/zenodo.18091751
- IEEE DataPort:https://doi.org/10.21227/9ej5-dp09
- Kaggle:https://doi.org/10.34740/kaggle/dsv/14451497
- figshare:https://doi.org/10.6084/m9.figshare.30969004
- OSF:https://doi.org/10.17605/OSF.IO/VNCDH
- Mendeley Data:https://doi.org/10.17632/hysp9jzg5h.2




