five

ProgrammableWeb 和 Amazon Web service marketplace 数据集

收藏
github2021-12-16 更新2024-05-31 收录
下载链接:
https://github.com/ssea-lab/FSC4WebService
下载链接
链接失效反馈
官方服务:
资源简介:
从ProgrammableWeb和Amazon Web服务市场收集的数据集,用于验证MIF-FWSC模型的有效性。

本数据集源自ProgrammableWeb及Amazon Web服务市场,旨在验证MIF-FWSC模型之有效性。
创建时间:
2021-11-15
原始信息汇总

数据集概述

数据来源

  • ProgrammableWeb: 数据收集日期为2020年1月10日。
  • Amazon Web Service Marketplace: 数据收集日期为2021年8月7日。

数据内容

  • 数据集包含从上述两个在线Web服务注册机构收集的信息。
  • 所有数据集存储在目录data中。

数据用途

  • 用于验证MIF-FWSC(多信息融合基础的少样本Web服务分类)方法的有效性。
  • 通过一系列实验,展示了MIF-FWSC在少样本Web服务分类中的先进性能。

数据处理

  • 使用预训练的FastText词嵌入作为基础,进一步训练word2vec嵌入。
  • 数据处理脚本为w2v.py,可通过命令行参数选择数据集来源(pwaws)。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集构建基于ProgrammableWeb和Amazon Web Service Marketplace两大在线Web服务注册平台。数据分别于2020年1月10日和2021年8月7日从这两个平台采集,涵盖了平台中注册的各类Web服务及其分类信息。通过整合服务描述、类别名称等多源信息,数据集为少样本Web服务分类任务提供了丰富的上下文支持。
特点
该数据集的特点在于其多样性和实时性。ProgrammableWeb和Amazon Web Service Marketplace作为全球最大的Web服务注册平台,数据集涵盖了广泛的Web服务类别和新兴服务类型。此外,数据集通过融合服务描述和类别名称等多源信息,增强了模型的鲁棒性和分类能力,适用于少样本学习场景。
使用方法
使用该数据集时,首先需下载FASTTEXT预训练词向量,并将其置于指定目录。随后,基于预训练的词向量在Web服务数据集上训练word2vec嵌入。通过修改并运行提供的脚本文件,用户可启动模型训练和评估流程。该数据集的使用依赖于Python 3环境及一系列深度学习库,如PyTorch和numpy等,建议在支持CUDA的GPU环境下运行以提升计算效率。
背景与挑战
背景概述
ProgrammableWeb和Amazon Web Service Marketplace数据集是为数不多的专注于Web服务分类的大规模数据集之一,由研究团队于2020年和2021年分别从ProgrammableWeb和Amazon Web Service Marketplace平台收集。这些数据集旨在支持少样本学习(Few-shot Learning)在Web服务分类领域的应用,特别是针对新服务和新类别的快速识别与分类。研究团队提出了一种基于元学习框架的多信息融合方法(MIF-FWSC),通过融合服务描述中的关键词和类别名称中的知识,显著提升了少样本分类的鲁棒性和准确性。该数据集及相关研究为Web服务分类领域提供了新的基准,推动了少样本学习技术在服务计算中的应用。
当前挑战
该数据集面临的挑战主要体现在两个方面。首先,Web服务分类本身具有高度动态性,新服务和新类别不断涌现,传统的分类方法难以应对这种快速变化的场景。少样本学习虽然能够缓解这一问题,但在实际应用中仍面临数据稀疏性和类别不平衡的挑战。其次,数据集的构建过程中,研究团队需要从异构的Web服务描述中提取有效信息,并确保数据的质量和一致性。此外,如何有效地融合多源信息(如服务描述和类别名称)以提升分类性能,也是构建过程中需要解决的关键技术难题。这些挑战不仅影响了模型的训练效果,也对算法的泛化能力提出了更高的要求。
常用场景
经典使用场景
在Web服务分类领域,ProgrammableWeb和Amazon Web Service Marketplace数据集被广泛应用于少样本学习场景。这些数据集通过提供丰富的Web服务描述和类别信息,使得研究者能够开发出高效的分类模型,尤其是在面对新出现的服务类别时,能够快速适应并准确分类。
衍生相关工作
基于该数据集,研究者们开发了多种先进的Web服务分类模型,如基于元学习的少样本分类方法和多信息融合的分类框架。这些工作不仅推动了Web服务分类领域的技术进步,还为相关领域如自然语言处理和机器学习提供了宝贵的参考和借鉴。
数据集最近研究
最新研究方向
在Web服务分类领域,ProgrammableWeb和Amazon Web Service Marketplace数据集的最新研究方向聚焦于少样本学习(Few-shot Learning)技术的应用。随着Web服务数量的激增,传统的分类方法在处理新兴服务类别时面临挑战。基于元学习框架的多信息融合少样本Web服务分类方法(MIF-FWSC)应运而生,该方法通过融合服务描述中的关键词、头部类别的知识以及类别名称中的信息,显著提升了模型在少样本场景下的分类能力。实验结果表明,MIF-FWSC在真实数据集上达到了最先进的性能,为Web服务分类领域提供了新的解决方案。这一研究方向不仅推动了少样本学习在Web服务领域的应用,也为未来智能服务推荐和自动化服务管理奠定了技术基础。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务