five

meryyllebr543/stack-edu-huggingface

收藏
Hugging Face2025-06-29 更新2025-08-30 收录
下载链接:
https://hf-mirror.com/datasets/meryyllebr543/stack-edu-huggingface
下载链接
链接失效反馈
官方服务:
资源简介:
Stack-Edu是一个包含高质量教育代码的数据集,这些代码是从The Stack v2数据集中筛选出来的。该数据集由Hugging Face团队整理,包含多种编程语言的完整文本内容,并以Parquet格式组织,每个语言都有一个单独的配置文件。数据集包括语言、源编码、字节长度、评分、检测到的许可证、许可证类型和代码的完整文本内容等特征。README文件还提供了使用datasets库在Python中加载和使用数据集的说明。

Stack-Edu is a dataset consisting of high-quality, educational code filtered from The Stack v2. It is curated by the Hugging Face team and contains full text content of code in various programming languages, organized into separate Parquet files for each language. The dataset includes features such as language, source encoding, byte length, score, detected licenses, license type, and the full text content of the code. The README provides instructions on how to load and use the dataset using the datasets library in Python.
提供机构:
meryyllebr543
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作