five

VMStartupTimeDataset

收藏
github2023-03-24 更新2024-05-31 收录
下载链接:
https://github.com/UGACloudLab/VMStartupTimeDataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了2020年从AWS和Google Cloud收集的虚拟机启动时间测量数据。数据涵盖多种虚拟机类型、操作系统、数据中心/区域,并详细记录了每种虚拟机的启动时间测量结果。

This dataset comprises measurements of virtual machine startup times collected from AWS and Google Cloud in 2020. It encompasses a variety of virtual machine types, operating systems, and data center/region locations, with detailed records of startup time measurements for each virtual machine.
创建时间:
2020-05-11
原始信息汇总

数据集概述

数据集内容

  • 数据发布日期: 2020年5月
  • 测量周期: 2020年1月至2020年3月
  • VM类型: 包含AWS和Google Cloud的多种VM类型,具体配置包括CPU数量、内存大小及按需价格
  • OS类型: Linux (Ubuntu 18.04 LTS), Windows (Server 2016)
  • 数据中心/区域: 列出了AWS和Google Cloud的多个区域及其可用性区域和地理位置
  • 基础镜像大小: 32GB, 64GB, 128GB, 256GB
  • VM购买模型: AWS支持按需和Spot购买,Google Cloud支持按需和Preemptible购买

数据集文件结构

  • 文件格式: CSV
  • 文件命名: 文件名对应特定的VM类型,例如t2-nano.csv代表AWS中t2.nano类型的VM启动时间测量结果
  • 数据字段:
    • VM类型
    • 提供商 (AWS或Google)
    • 区域
    • 区域 (可用性)
    • 购买模型 (O: On-demand, S: Spot (AWS), P: Preemptible (Google))
    • OS (Linux或Windows)
    • 镜像大小 (32GB - 256GB)
    • 启动类型 (C: Cold Startup, W: Warm Startup)
    • 测量日期时间 (YYYY-MM-DD-HH:MM:SS)
    • 启动时间 (秒)

数据集出版物

  • Jianwei Hao, Ting Jiang, Wei Wang, and In Kee Kim, "An Empirical Analysis of VM Startup Times in Public IaaS Clouds," In 2021 IEEE International Conference on Cloud Computing (CLOUD), September, 2021
  • Jianwei Hao, Ting Jiang, Wei Wang, and In Kee Kim, "An Empirical Analysis of VM Startup Times in Public IaaS Clouds: An Extended Report," arXiv, 2021
搜集汇总
数据集介绍
main_image_url
构建方式
VMStartupTimeDataset的构建基于对AWS和Google Cloud两大云服务提供商的虚拟机启动时间的实测数据。数据收集时间跨度为2020年1月至3月,涵盖了多种虚拟机类型、操作系统、数据中心区域以及不同的购买模型。数据集通过记录每种虚拟机类型在不同条件下的启动时间,确保了数据的多样性和广泛性。
特点
该数据集的特点在于其全面性和细致性。它不仅涵盖了多种虚拟机类型和操作系统,还详细记录了不同数据中心区域、购买模型以及镜像大小对启动时间的影响。此外,数据集还区分了冷启动和热启动两种启动类型,为研究者提供了丰富的分析维度。
使用方法
使用VMStartupTimeDataset时,研究者可以通过分析不同虚拟机类型、操作系统、数据中心区域以及购买模型对启动时间的影响,来优化云服务的性能。数据集以CSV文件格式存储,每个文件对应一种虚拟机类型的启动时间数据,便于直接导入数据分析工具进行进一步处理和分析。
背景与挑战
背景概述
VMStartupTimeDataset由Jianwei Hao等研究人员于2020年5月发布,旨在提供AWS和Google Cloud平台上虚拟机(VM)启动时间的详细测量数据。该数据集涵盖了2020年1月至3月期间的测量结果,涉及多种VM类型、操作系统、数据中心区域以及不同的购买模型。研究团队通过这一数据集,深入分析了公共IaaS云环境中VM启动时间的性能表现,相关研究成果发表于2021年IEEE国际云计算会议(CLOUD)及arXiv预印本平台。该数据集为云计算领域的性能优化、资源调度及成本管理提供了重要的实证基础,推动了云服务提供商和用户对VM启动效率的深入理解。
当前挑战
VMStartupTimeDataset的构建面临多重挑战。首先,VM启动时间的测量受多种因素影响,包括硬件配置、操作系统、镜像大小以及购买模型等,如何在不同条件下保持测量的一致性和可比性是一个关键问题。其次,数据采集过程中需要处理大规模、分布式的云环境,确保数据的完整性和准确性。此外,不同云服务提供商的API接口和数据格式存在差异,增加了数据整合的复杂性。最后,研究团队还需应对数据隐私和安全问题,确保测量过程中不泄露敏感信息。这些挑战不仅影响了数据集的构建过程,也为后续研究提供了重要的技术难题。
常用场景
经典使用场景
在云计算领域,虚拟机的启动时间是衡量云服务性能的关键指标之一。VMStartupTimeDataset通过收集AWS和Google Cloud平台上多种虚拟机类型的启动时间数据,为研究人员提供了一个详尽的基准数据集。该数据集广泛应用于云计算性能优化、资源调度策略设计以及成本效益分析等研究场景中,帮助学者深入理解不同云服务提供商的性能差异。
衍生相关工作
基于VMStartupTimeDataset,学术界衍生了一系列经典研究工作。例如,Jianwei Hao等人发表的论文《An Empirical Analysis of VM Startup Times in Public IaaS Clouds》深入分析了不同云服务提供商的虚拟机启动时间差异,并提出了优化建议。这些研究不仅丰富了云计算领域的文献,还为后续的研究提供了重要的数据和方法论支持。
数据集最近研究
最新研究方向
近年来,随着云计算技术的迅猛发展,虚拟机(VM)启动时间成为影响云服务性能的关键因素之一。VMStartupTimeDataset作为一项针对AWS和Google Cloud平台虚拟机启动时间的实证研究数据集,为学术界和工业界提供了宝贵的数据支持。该数据集的最新研究方向主要集中在优化虚拟机启动时间的算法设计与性能评估上,特别是在冷启动和热启动场景下的性能差异分析。此外,研究还探讨了不同虚拟机类型、操作系统、镜像大小以及购买模型对启动时间的影响,旨在为云服务提供商和用户提供更高效的资源配置策略。这些研究成果不仅推动了云计算领域的性能优化,也为未来云服务的智能化管理奠定了理论基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作