five

thepowerfuldeez/the-stack-v2-train-smol-ids-updated

收藏
Hugging Face2025-09-12 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/thepowerfuldeez/the-stack-v2-train-smol-ids-updated
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含代码仓库的数据集,每个仓库都有详细的特征信息,如仓库名称、URL、快照ID、修订ID等。数据集还包含了文件级别的特征,如文件的语言类型、大小、行数等。数据集经过过滤,移除了一些不符合要求的仓库和文件。

This is a dataset containing code repositories, each with detailed feature information such as repository name, URL, snapshot ID, revision ID, etc. The dataset also includes file-level features such as file language type, size, number of lines, etc. The dataset has been filtered to remove repositories and files that do not meet certain criteria.
提供机构:
thepowerfuldeez
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作