vikp/pypi_clean
收藏Hugging Face2023-09-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vikp/pypi_clean
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了PyPI上最新的包版本,原始数据来源于py-code.org/datasets。数据处理过程中,提取了`md`, `rst`, `ipynb`, 和 `py`文件,并进行了清洗,包括渲染Notebooks和移除前导注释/许可证。
该数据集包含了PyPI上最新的包版本,原始数据来源于py-code.org/datasets。数据处理过程中,提取了`md`, `rst`, `ipynb`, 和 `py`文件,并进行了清洗,包括渲染Notebooks和移除前导注释/许可证。
提供机构:
vikp
原始信息汇总
数据集信息
特征
- code: 类型为字符串
- package: 类型为字符串
- path: 类型为字符串
- filename: 类型为字符串
数据分割
- train:
- 字节数: 31543801750
- 样本数: 2438172
数据大小
- 下载大小: 9201420527
- 数据集大小: 31543801750
配置
- default:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



