five

loubnabnl/old_py

收藏
Hugging Face2023-10-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/loubnabnl/old_py
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: __id__ dtype: int64 - name: blob_id dtype: string - name: directory_id dtype: string - name: path dtype: string - name: content_id dtype: string - name: detected_licenses sequence: string - name: license_type dtype: string - name: repo_name dtype: string - name: repo_url dtype: string - name: snapshot_id dtype: string - name: revision_id dtype: string - name: branch_name dtype: string - name: visit_date dtype: timestamp[ns] - name: revision_date dtype: timestamp[ns] - name: committer_date dtype: timestamp[ns] - name: github_id dtype: int64 - name: star_events_count dtype: int64 - name: fork_events_count dtype: int64 - name: gha_license_id dtype: string - name: gha_fork dtype: bool - name: gha_event_created_at dtype: timestamp[ns] - name: gha_created_at dtype: timestamp[ns] - name: gha_updated_at dtype: timestamp[ns] - name: gha_pushed_at dtype: timestamp[ns] - name: gha_size dtype: int64 - name: gha_stargazers_count dtype: int32 - name: gha_forks_count dtype: int32 - name: gha_open_issues_count dtype: int32 - name: gha_language dtype: string - name: gha_archived dtype: bool - name: gha_disabled dtype: bool - name: content dtype: string - name: src_encoding dtype: string - name: language dtype: string - name: is_vendor dtype: bool - name: is_generated dtype: bool - name: year dtype: int64 splits: - name: train num_bytes: 4842783.826144089 num_examples: 1000 download_size: 2031848 dataset_size: 4842783.826144089 --- # Dataset Card for "old_py" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
loubnabnl
原始信息汇总

数据集概述

特征信息

数据集包含以下特征:

  • __id__: 类型为 int64
  • blob_id: 类型为 string
  • directory_id: 类型为 string
  • path: 类型为 string
  • content_id: 类型为 string
  • detected_licenses: 类型为 string 的序列
  • license_type: 类型为 string
  • repo_name: 类型为 string
  • repo_url: 类型为 string
  • snapshot_id: 类型为 string
  • revision_id: 类型为 string
  • branch_name: 类型为 string
  • visit_date: 类型为 timestamp[ns]
  • revision_date: 类型为 timestamp[ns]
  • committer_date: 类型为 timestamp[ns]
  • github_id: 类型为 int64
  • star_events_count: 类型为 int64
  • fork_events_count: 类型为 int64
  • gha_license_id: 类型为 string
  • gha_fork: 类型为 bool
  • gha_event_created_at: 类型为 timestamp[ns]
  • gha_created_at: 类型为 timestamp[ns]
  • gha_updated_at: 类型为 timestamp[ns]
  • gha_pushed_at: 类型为 timestamp[ns]
  • gha_size: 类型为 int64
  • gha_stargazers_count: 类型为 int32
  • gha_forks_count: 类型为 int32
  • gha_open_issues_count: 类型为 int32
  • gha_language: 类型为 string
  • gha_archived: 类型为 bool
  • gha_disabled: 类型为 bool
  • content: 类型为 string
  • src_encoding: 类型为 string
  • language: 类型为 string
  • is_vendor: 类型为 bool
  • is_generated: 类型为 bool
  • year: 类型为 int64

数据分割

数据集包含一个名为 train 的分割,包含 1000 个样本,总字节数为 4842783.826144089。

数据大小

  • 下载大小: 2031848 字节
  • 数据集大小: 4842783.826144089 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作