version-control/ds-lib-version-3
收藏Hugging Face2024-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/version-control/ds-lib-version-3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个Python项目的依赖信息,主要特征包括项目名称(repo_name)、版本信息(version)和提交哈希(hexsha)。版本信息中详细列出了pyproject.toml、requirements.txt和setup.py文件中使用的常用Python库,如matplotlib、numpy、pandas等。数据集包含一个train分割,共有10000个例子,总大小为2506652字节。
该数据集包含多个Python项目的依赖信息,主要特征包括项目名称(repo_name)、版本信息(version)和提交哈希(hexsha)。版本信息中详细列出了pyproject.toml、requirements.txt和setup.py文件中使用的常用Python库,如matplotlib、numpy、pandas等。数据集包含一个train分割,共有10000个例子,总大小为2506652字节。
提供机构:
version-control
原始信息汇总
数据集信息
特征
- repo_name: 类型为字符串。
- version: 包含以下列表:
- pyproject.toml: 包含以下结构:
- matplotlib: 类型为字符串。
- numpy: 类型为字符串。
- pandas: 类型为字符串。
- scikit-learn: 类型为字符串。
- scipy: 类型为字符串。
- tensorflow: 类型为字符串。
- torch: 类型为字符串。
- requirements.txt: 包含以下结构:
- matplotlib: 类型为字符串。
- numpy: 类型为字符串。
- pandas: 类型为字符串。
- scikit-learn: 类型为字符串。
- scipy: 类型为字符串。
- tensorflow: 类型为字符串。
- torch: 类型为字符串。
- setup.py: 包含以下结构:
- matplotlib: 类型为字符串。
- numpy: 类型为字符串。
- pandas: 类型为字符串。
- scikit-learn: 类型为字符串。
- scipy: 类型为字符串。
- tensorflow: 类型为字符串。
- torch: 类型为字符串。
- pyproject.toml: 包含以下结构:
- hexsha: 类型为字符串序列。
数据分割
- train: 包含10000个样本,总字节数为2506652。
数据集大小
- 下载大小: 824580字节。
- 数据集大小: 2506652字节。
配置
- default: 包含以下数据文件:
- train: 路径为
data/train-*。
- train: 路径为



