five

quintic/codeparrot_16B_samples

收藏
Hugging Face2024-08-06 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/quintic/codeparrot_16B_samples
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含代码、仓库名称、路径、编程语言、许可证和大小等特征字段。数据集只有一个train分割,包含7,297,376个样本,总大小为60,472,067,619字节。下载大小为20,617,394,014字节。

The dataset includes features such as code, repository name, path, programming language, license, and size. The dataset has only one split, the train split, containing 7,297,376 samples with a total size of 60,472,067,619 bytes. The download size is 20,617,394,014 bytes.
提供机构:
quintic
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作