five

loubnabnl/old_python

收藏
Hugging Face2023-10-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/loubnabnl/old_python
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: __id__ dtype: int64 - name: blob_id dtype: string - name: directory_id dtype: string - name: path dtype: string - name: content_id dtype: string - name: detected_licenses sequence: string - name: license_type dtype: string - name: repo_name dtype: string - name: repo_url dtype: string - name: snapshot_id dtype: string - name: revision_id dtype: string - name: branch_name dtype: string - name: visit_date dtype: timestamp[ns] - name: revision_date dtype: timestamp[ns] - name: committer_date dtype: timestamp[ns] - name: github_id dtype: int64 - name: star_events_count dtype: int64 - name: fork_events_count dtype: int64 - name: gha_license_id dtype: string - name: gha_fork dtype: bool - name: gha_event_created_at dtype: timestamp[ns] - name: gha_created_at dtype: timestamp[ns] - name: gha_updated_at dtype: timestamp[ns] - name: gha_pushed_at dtype: timestamp[ns] - name: gha_size dtype: int64 - name: gha_stargazers_count dtype: int32 - name: gha_forks_count dtype: int32 - name: gha_open_issues_count dtype: int32 - name: gha_language dtype: string - name: gha_archived dtype: bool - name: gha_disabled dtype: bool - name: content dtype: string - name: src_encoding dtype: string - name: language dtype: string - name: is_vendor dtype: bool - name: is_generated dtype: bool - name: year dtype: int64 splits: - name: train num_bytes: 205861897.66555908 num_examples: 42509 download_size: 91464746 dataset_size: 205861897.66555908 --- # Dataset Card for "old_python" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
loubnabnl
原始信息汇总

数据集概述

数据集特征

  • id: 数据类型为 int64
  • blob_id: 数据类型为 string
  • directory_id: 数据类型为 string
  • path: 数据类型为 string
  • content_id: 数据类型为 string
  • detected_licenses: 数据类型为 string 的序列
  • license_type: 数据类型为 string
  • repo_name: 数据类型为 string
  • repo_url: 数据类型为 string
  • snapshot_id: 数据类型为 string
  • revision_id: 数据类型为 string
  • branch_name: 数据类型为 string
  • visit_date: 数据类型为 timestamp[ns]
  • revision_date: 数据类型为 timestamp[ns]
  • committer_date: 数据类型为 timestamp[ns]
  • github_id: 数据类型为 int64
  • star_events_count: 数据类型为 int64
  • fork_events_count: 数据类型为 int64
  • gha_license_id: 数据类型为 string
  • gha_fork: 数据类型为 bool
  • gha_event_created_at: 数据类型为 timestamp[ns]
  • gha_created_at: 数据类型为 timestamp[ns]
  • gha_updated_at: 数据类型为 timestamp[ns]
  • gha_pushed_at: 数据类型为 timestamp[ns]
  • gha_size: 数据类型为 int64
  • gha_stargazers_count: 数据类型为 int32
  • gha_forks_count: 数据类型为 int32
  • gha_open_issues_count: 数据类型为 int32
  • gha_language: 数据类型为 string
  • gha_archived: 数据类型为 bool
  • gha_disabled: 数据类型为 bool
  • content: 数据类型为 string
  • src_encoding: 数据类型为 string
  • language: 数据类型为 string
  • is_vendor: 数据类型为 bool
  • is_generated: 数据类型为 bool
  • year: 数据类型为 int64

数据集分割

  • train: 包含 42509 个样本,总大小为 205861897.66555908 字节

数据集大小

  • 下载大小: 91464746 字节
  • 数据集大小: 205861897.66555908 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作