five

OCL Expressions on GitHub

收藏
github2018-10-14 更新2024-05-31 收录
下载链接:
https://github.com/tue-mdse/ocl-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自245个系统选定的GitHub仓库中的504个EMF元模型的9188个OCL表达式。数据集不仅包括原始元模型,还包括生成的抽象语法树,适用于多种OCL的实证研究。

This dataset comprises 9,188 OCL expressions derived from 504 EMF (Eclipse Modeling Framework) metamodels, sourced from 245 selected GitHub repositories. In addition to the original metamodels, the dataset also includes generated abstract syntax trees, making it suitable for a variety of empirical studies on OCL.
创建时间:
2017-03-10
原始信息汇总

数据集概述

数据集名称

A Data Set of OCL Expressions on GitHub

数据集内容

  • 包含9188个OCL表达式
  • 源自504个EMF元模型
  • 来自245个系统选定的GitHub仓库

数据集组成部分

  • 原始元模型
  • 生成的抽象语法树

数据集用途

支持对OCL进行多种实证研究

相关出版物

  • 发表于MSR 2017的论文
    • 作者:Jeroen Noten, Josh G.M. Mengerink, Alexander Serebrenik
    • 机构:Eindhoven University of Technology, The Netherlands
搜集汇总
数据集介绍
main_image_url
构建方式
针对对象约束语言(OCL)的研究需求,本数据集通过从GitHub上精心挑选的245个代码仓库中提取,涵盖了504个EMF元模型所生成的9188个OCL表达式。数据集构建时,不仅保留了原始的元模型,亦包含了由此生成的抽象语法树,以便研究者能够开展多元化的实证研究。
特点
本数据集的特色在于其来源的广泛性与内容的完整性。OCL表达式的收集覆盖了不同项目与场景,确保了数据的多样性与代表性。同时,数据集附加了元模型及其抽象语法树的对应关系,为研究者提供了深入分析OCL表达式结构及其语义的坚实基础。
使用方法
用户可依据数据集提供的结构,直接获取OCL表达式及其相关元模型和抽象语法树。数据集以易于处理的格式呈现,便于研究者进行模式识别、代码质量评估、语义分析等研究工作。此外,数据集附带的相关论文为使用提供了详细指导与理论背景支撑。
背景与挑战
背景概述
在软件工程领域,对象约束语言(OCL)作为一种用于指定和约束模型的标准语言,其表达式分析与应用至关重要。OCL Expressions on GitHub数据集应运而生,创建于2017年,由荷兰埃因霍芬科技大学的研究团队Jeroen Noten、Josh G.M. Mengerink和Alexander Serebrenik共同构建。该数据集的问世旨在为研究人员提供一个实证研究的平台,包含了9188个来源于504个EMF元模型的OCL表达式,这些表达式源自245个经过系统筛选的GitHub仓库。该数据集的发布在软件建模与模型工程领域产生了显著影响,为后续的学术研究和软件开发提供了宝贵的资源。
当前挑战
尽管OCL Expressions on GitHub数据集为领域研究提供了坚实基础,但其在构建和应用过程中亦面临多项挑战。首先,数据集的构建过程中需要对海量的GitHub仓库进行筛选和元模型提取,这一过程的技术难度和计算复杂性不容忽视。其次,如何保证所提取OCL表达式的准确性和代表性,避免偏差,是数据集构建中的一大难题。此外,数据集在实际应用中面临的挑战包括如何高效地利用这些数据进行OCL表达式的语义分析、模型验证以及自动化工具的开发等。
常用场景
经典使用场景
在计算机科学领域,尤其是模型驱动的软件开发研究中,OCL(对象约束语言)表达式的分析至关重要。OCL Expressions on GitHub数据集,汇集了源自众多GitHub仓库的OCL表达式,为研究者提供了丰富的实证研究素材。该数据集的经典使用场景在于,通过对OCL表达式的抽象语法树进行分析,研究者能够深入理解OCL的使用模式与特性,从而优化模型转换工具的设计与实现。
衍生相关工作
基于OCL Expressions on GitHub数据集,研究者已衍生出一系列相关工作,如OCL表达式质量评估、代码缺陷预测、以及基于机器学习的OCL代码生成等。这些研究不仅拓宽了模型驱动软件开发领域的视野,也为相关技术的商业化应用奠定了基础。
数据集最近研究
最新研究方向
在模型驱动的软件开发领域,OCL(对象约束语言)的表达式分析正日益成为研究的热点。近期,基于OCL Expressions on GitHub数据集的研究方向主要集中在挖掘EMF元模型中的OCL表达式,以探究编程语言中的约束特性和使用模式。该数据集的发布,为学术界提供了9188个源自GitHub的OCL表达式实例,涵盖了245个精选仓库的504个EMF元模型,不仅包含原始的元模型,还包含了生成的抽象语法树,这对于开展OCL语言的实证研究具有重要价值。研究者们利用此数据集,不仅能够深入理解OCL表达式的实际应用情况,还能够促进软件质量保证、代码理解和自动化工具开发等领域的进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作