five

pyMethods2Test 编程语言处理数据集

收藏
超神经2025-02-13 更新2025-02-15 收录
下载链接:
https://hyper.ai/cn/datasets/37733
下载链接
链接失效反馈
官方服务:
资源简介:
pyMethods2Test 数据集是由内布拉斯加大学林肯分校 (University of Nebraska–Lincoln) 的研究人员于 2025 年创建的,包含大量的开源单元测试方法和对应的焦点映射,旨在为 Python 代码生成有效的单元测试用例,弥补了 Python 语言在大型测试数据集方面的空白。相关论文成果为「pyMethods2Test: A Dataset of Python Tests Mapped to Focal Methods」,该数据集被广泛用于训练大型语言模型 (LLM) 以生成良好的 Python 单元测试用例,为 LLM 提供了丰富的训练数据,使其能够学习如何生成针对 Python 代码的测试。

The pyMethods2Test Dataset was created in 2025 by researchers at the University of Nebraska–Lincoln. It contains a large number of open-source unit test methods and their corresponding focal method mappings, aiming to generate effective unit test cases for Python code and fill the gap of large-scale test datasets for the Python programming language. The associated research paper is titled *pyMethods2Test: A Dataset of Python Tests Mapped to Focal Methods*. This dataset is widely utilized for training Large Language Models (LLMs) to produce high-quality Python unit test cases, providing abundant training data for LLMs to learn how to generate tests for Python code.
创建时间:
2025-02-13
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
pyMethods2Test是一个由内布拉斯加大学林肯分校创建的Python编程语言处理数据集,包含22,662,037个测试方法和2,198,378个焦点映射,用于训练大型语言模型生成有效的Python单元测试用例。数据集以JSON格式存储,包含测试文件路径、焦点文件路径等详细上下文信息,弥补了Python语言在大型测试数据集方面的空白。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务