five

tyoc213/split-avelina-python-edu

收藏
Hugging Face2025-04-03 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/tyoc213/split-avelina-python-edu
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含代码片段文本的数据集,不同配置的数据集包含不同数量的示例。每种配置都包括blob_id、仓库名称(repo_name)、文件路径(path)、文件大小(length_bytes)、分数(score)、整数分数(int_score)和文本内容(text)等特征。数据集分为100k、10k、1M、1k和full五种配置,分别包含90000、9000、900000、900和6910602个训练集示例以及10000、1000、100000、100和767845个测试集示例。

This is a dataset containing code snippet texts, with different configurations containing different numbers of examples. Each configuration includes features such as blob_id, repository name (repo_name), file path (path), file size (length_bytes), score (score), integer score (int_score), and text content (text). The dataset is divided into five configurations: 100k, 10k, 1M, 1k, and full, containing 90000, 9000, 900000, 900, and 6910602 training set examples, as well as 10000, 1000, 100000, 100, and 767845 test set examples respectively.
提供机构:
tyoc213
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作