five

QWS Dataset|Web服务质量数据集|数据集数据集

收藏
github2024-01-16 更新2024-05-31 收录
Web服务质量
数据集
下载链接:
https://github.com/qwsdata/qwsdataset
下载链接
链接失效反馈
资源简介:
QWS数据集是第一个测量真实Web服务质量(QoS)的数据集,于2007年推出,是Eyhab Al-Masri博士论文工作的一部分。该数据集已被研究社区广泛接受,自2007年以来已被下载超过9000次。QWS数据集ver 2.0包含2507个Web服务及其质量测量,而ver 1.0包含365个Web服务的九个QoS测量。

The QWS dataset is the first dataset to measure real-world Web Service Quality (QoS), introduced in 2007 as part of Dr. Eyhab Al-Masri's doctoral thesis. This dataset has been widely accepted by the research community and has been downloaded over 9,000 times since 2007. The QWS dataset version 2.0 includes 2,507 web services along with their quality measurements, whereas version 1.0 contains nine QoS measurements for 365 web services.
创建时间:
2019-11-29
原始信息汇总

数据集概述

数据集名称

  • The QWS Dataset

数据集版本

  • ver 1.0: 包含365个Web服务的9个QoS测量,以及基于Web Service Relevancy Function (WsRF)的排名和基于整体性能的分类。
  • ver 2.0: 包含2,507个Web服务的QWS测量,每个服务有9个QWS指标和两个附加参数(服务名称和WSDL文档引用)。

数据集内容

  • QWS Metrics: 包括响应时间、可用性、吞吐量、成功率、可靠性、合规性、最佳实践、延迟和文档化。
  • 附加属性:
    • WsRF: 基于质量指标的Web服务质量排名。
    • 服务分类: 根据整体质量评级将服务分为铂金、金、银、铜四个等级。

数据收集方法

  • 使用Web Service Crawler Engine (WSCE)收集,主要来源于公共网络资源,如UDDI注册表、搜索引擎和服务门户。

数据集应用

  • Web服务分类
  • Web服务组合
  • Web服务QoS性能分析
  • Web服务QoS预测
  • Web服务排名
  • Web服务发现
  • Web服务建模
  • Web服务资源管理
  • Web服务协调
  • 服务导向分析
  • Web服务事务
  • 业务流程集成和管理
  • Web服务推荐系统

下载信息

联系方式

  • 联系人:Eyhab Al-Masri
  • 邮箱:qwsdata[AT]yahoo.com
AI搜集汇总
数据集介绍
main_image_url
构建方式
QWS数据集的构建基于对真实Web服务的服务质量(QoS)的测量,首次于2007年作为Eyhab Al-Masri博士论文的一部分引入。数据集通过Web服务爬虫引擎(WSCE)从公共网络资源中收集,包括UDDI注册表、搜索引擎和服务门户。QWS 2.0版本包含2507个Web服务及其在2008年通过Web服务代理(WSB)框架进行的QoS测量。每个服务对应九项QWS指标,这些指标通过多个Web服务基准工具在六天内测量,并取平均值。
特点
QWS数据集的特点在于其全面覆盖了Web服务的多个关键QoS指标,包括响应时间、可用性、吞吐量、成功率、可靠性、合规性、最佳实践、延迟和文档化程度。此外,数据集还提供了基于Web服务相关性函数(WsRF)的排名和基于整体性能的服务分类。这些特点使得QWS数据集成为Web服务研究领域的重要资源,广泛应用于服务分类、组合、性能预测和排名等研究。
使用方法
QWS数据集的使用方法包括下载数据集文件并解析其内容。数据集以CSV格式提供,每行代表一个Web服务及其对应的QWS指标。研究人员可以通过分析这些指标进行Web服务的分类、性能评估和排名等研究。使用该数据集时,需遵守GNU通用公共许可证,并在相关研究中引用数据集的原作者。数据集适用于Web服务分类、组合、性能预测、发现、建模、资源管理、协调、面向服务分析、事务处理、业务流程集成与管理以及推荐系统等应用场景。
背景与挑战
背景概述
QWS数据集由Eyhab Al-Masri在其博士论文中首次提出,并于2007年正式发布,旨在为Web服务研究提供基础数据支持。该数据集通过Web服务爬虫引擎(WSCE)从公共资源中收集了大量Web服务,并对其服务质量(QoS)进行了详细测量。QWS数据集的核心研究问题在于如何量化Web服务的性能和质量,从而为服务发现、分类、推荐等应用提供依据。自发布以来,QWS数据集已被广泛下载超过9,000次,成为Web服务研究领域的重要资源。其影响力不仅体现在学术研究中,还为工业界的Web服务优化提供了数据支持。
当前挑战
QWS数据集在解决Web服务质量评估问题时面临多重挑战。首先,Web服务的动态性和异构性使得其性能指标的测量和标准化变得复杂,如何确保数据的准确性和一致性成为关键问题。其次,数据集构建过程中,研究人员需要克服Web服务来源的多样性和数据采集的技术难题,例如如何高效地从UDDI注册表、搜索引擎和服务门户中提取有效数据。此外,QWS数据集还需应对Web服务环境的快速变化,确保其测量方法和指标能够适应新兴技术和协议。这些挑战不仅影响了数据集的构建,也对其在实践中的应用提出了更高的要求。
常用场景
经典使用场景
QWS数据集在Web服务研究领域中具有广泛的应用,尤其是在服务质量(QoS)的评估与优化方面。研究者通过该数据集能够对Web服务的响应时间、可用性、吞吐量等关键指标进行深入分析,从而为服务选择、组合和优化提供数据支持。该数据集的使用场景涵盖了从基础研究到实际应用的多个层面,成为Web服务研究的重要基准。
衍生相关工作
QWS数据集衍生了许多经典研究工作,例如基于QoS的Web服务发现与排名算法、服务质量预测模型以及服务组合优化方法。这些研究不仅扩展了数据集的应用范围,还为Web服务研究领域提供了新的理论和方法。许多研究者在QWS数据集的基础上提出了创新的解决方案,进一步推动了该领域的技术进步。
数据集最近研究
最新研究方向
在Web服务领域,QWS数据集作为衡量服务质量(QoS)的基准,近年来在多个前沿研究方向中发挥了重要作用。随着云计算和微服务架构的普及,Web服务的动态性和复杂性显著增加,QWS数据集为研究者提供了丰富的QoS指标,如响应时间、可用性和吞吐量等,这些指标在服务发现、组合和推荐系统中具有重要应用。特别是在服务质量预测和优化方面,QWS数据集被广泛用于训练机器学习模型,以提升服务选择的准确性和效率。此外,随着边缘计算和物联网的兴起,QWS数据集的研究方向逐渐扩展到跨平台服务性能评估和资源管理,为构建高效、可靠的分布式系统提供了理论支持。QWS数据集的研究不仅推动了Web服务技术的发展,也为相关领域的创新提供了坚实的基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

CODrone

CODrone 是一个为无人机设计的全面定向目标检测数据集,它准确反映了真实世界条件。该数据集包含来自多个城市在不同光照条件下的广泛标注图像,增强了基准的逼真度。CODrone 包含超过 10,000 张高分辨率图像,捕获自五个城市的真实无人机飞行,涵盖了各种城市和工业环境,包括港口和码头。为了提高鲁棒性和泛化能力,它包括在正常光线、低光和夜间条件下相同场景的图像。我们采用了三种飞行高度和两种常用的相机角度,从而产生了六个不同的视角配置。所有图像都针对 12 个常见对象类别进行了定向边界框标注,总计超过 590,000 个标记实例。总体而言,这项工作构建了一个综合数据集和基准,用于城市无人机场景中的定向目标检测,旨在满足该领域的研究和实践应用需求。

arXiv 收录

Paper III (Walker et al. 2024)

Data products used in 3-D CMZ Paper III, Walker et al. (2024). The full cloud catalogue is provided in tabular format, along with a full CMZ map showing the clouds and their assigned IDs. For each cloud ID in the published catalogue there are: - Individual cube cutouts from the MOPRA 3mm CMZ survey (HC3N, HCN, and HNCO). - Individual cube cutouts from the APEX 1mm CMZ survey (13CO, C18O, and H2CO). - Cloud-averaged spectra of the ATCA H2CO 4.83 GHz line. - PV slices of the ATCA H2CO 4.83 GHz line, taken across the major axis of the source. - Where applicable, there are mask files which correspond to the different velocity components of the cloud. In these cases, there are two mask files per velocity component, corresponding to the different masking approaches described in the paper.

DataCite Commons 收录