Linux Kernel repository
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/torvalds/linux
下载链接
链接失效反馈官方服务:
资源简介:
该数据集展示了循环神经网络(RNNs)在Linux内核仓库中的表现能力,同时该数据集已被广泛应用于代码补全任务中。在这些任务中,其主要针对的是代码补全这一具体任务。
This dataset demonstrates the performance of Recurrent Neural Networks (RNNs) on the Linux kernel repository, and it has been widely applied to code completion tasks, which primarily target this specific task.
提供机构:
GitHub
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是Linux内核的官方源代码仓库,包含核心操作系统代码,用于管理硬件和系统资源。它是一个大规模开源项目,拥有超过1,446,399次提交和235k星标,代码以C语言为主(98.0%),并提供针对开发者、研究人员等不同角色的详细文档。
以上内容由遇见数据集搜集并总结生成



