five

ManyTypes4Py

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/ManyTypes4Py
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集于 2020 年 9 月 17 日收集。它在 GitHub 上托管了超过 5.4K 个 Python 存储库。查看文件 ManyTypes4PyDataset.spec 以获取存储库 URL 及其提交 SHA。 数据集也使用 CD4Py 工具进行了重复数据删除。重复文件列表在 duplicate_files.txt 文件中提供。 它的所有 Python 项目都以 JSON 格式的文件处理。它们包含每个文件的 seq2seq 表示、与类型相关的提示和机器学习模型的信息。 JSON 格式文件的结构在 JSONOutput.md 文件中描述。 数据集按源代码文件分为训练集、验证集和测试集。 dataset_split.csv 文件中提供了文件列表及其对应集。 已处理项目的基于名称的可见类型提示存储在 extract_visible_types 文件夹中。 CHANGELOG.md 中记录了对数据集的每个版本的显着更改。
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作