GitHub Python dataset|Python数据集|GitHub数据集
收藏数据集概述
数据集名称
GitHub Python dataset
数据集内容
- 包含的Python仓库数量:21,631
- 涉及的用户数量:3,895
- 数据收集截止日期:2016年10月21日
数据集文件说明
-
list_repo_21631.txt
- 内容:包含的仓库列表
-
list_user_3895.txt
- 内容:包含的用户列表
-
user_repo_commit.txt
- 格式:[用户] [仓库] [提交次数]
- 用户:对应list_user_3895.txt中的用户
- 仓库:对应list_repo_21631.txt中的仓库
- 提交次数:用户在特定仓库的提交次数
- 字段分隔符:单个空格
- 格式:[用户] [仓库] [提交次数]
-
repo_api (目录)
- 每个文件名对应list_repo_21631.txt中的一个仓库
- 内容:对应仓库使用的模块/包集合
-
index.txt
- 内容:repo_api目录的统计数据
-
top30.txt
- 格式:[排名] [用户]
- 排名:用户在Git Awards的实际排名
- 用户:数据集中的前30名用户
- 格式:[排名] [用户]

giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9
该数据集包含了用户与助手之间的对话,其中包含两个字段:用户发言和助手回应,均为字符串类型。训练集大小为38646852字节,共有44096条对话记录。
huggingface 收录
UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录
O*NET
O*NET(Occupational Information Network)是一个综合性的职业信息数据库,提供了关于各种职业的详细描述,包括技能要求、工作活动、知识领域、工作环境等。该数据集被广泛用于职业分析、教育和劳动力市场研究。
www.onetonline.org 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录