five

xszheng2020/the_stack_dedup_python_hits_1_qsc_code_cate_autogen

收藏
Hugging Face2025-09-20 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/xszheng2020/the_stack_dedup_python_hits_1_qsc_code_cate_autogen
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于代码质量评估的数据集,包含了多种编程语言编写的代码文件的特性,如文件哈希值、大小、扩展名、代码内容统计特征等。数据集还包含了仓库的星星数、问题数和分支数等信息,以及相关的时间戳。这些数据可能用于训练评估代码质量的机器学习模型。

This is a dataset for code quality assessment, which includes features of code files written in various programming languages, such as file hash, size, extension, code content statistical features, etc. The dataset also contains information about the number of stars, issues, and forks of the repository, as well as related timestamps. These data may be used to train machine learning models for code quality assessment.
提供机构:
xszheng2020
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作