five

mamiksik/processed-commit-diffs

收藏
Hugging Face2023-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mamiksik/processed-commit-diffs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个开源项目的信息,主要字段包括内容类型、主要语言、消息、SHA、补丁和文件数量。数据集被划分为训练集、测试集和验证集,分别包含62272、7784和7784个样本。数据集总大小为325754095字节,下载大小为112191621字节。数据集中包含的项目涵盖了多种编程语言,如Go、Java、Javascript、PHP、Python和Ruby,具体项目包括Moby、Rxjava、Spring-framework、Chart.js、Three.js、Redux、React-native、React、Pdf.js、Node、Next.js、Moment、Video.js、Immutable-js、Jquery、Webpack、Angular.js、Atom、Ember.js、Axios、D3、Framework、Cakephp、Laravel、Transformers、Python、Airflow、Spacy、Freecodecamp、Glances、Django-rest-framework、Libcloud、Numpy、Flask、Celery、Keras、Models、Django、Brew和Rails。

该数据集包含多个开源项目的信息,主要字段包括内容类型、主要语言、消息、SHA、补丁和文件数量。数据集被划分为训练集、测试集和验证集,分别包含62272、7784和7784个样本。数据集总大小为325754095字节,下载大小为112191621字节。数据集中包含的项目涵盖了多种编程语言,如Go、Java、Javascript、PHP、Python和Ruby,具体项目包括Moby、Rxjava、Spring-framework、Chart.js、Three.js、Redux、React-native、React、Pdf.js、Node、Next.js、Moment、Video.js、Immutable-js、Jquery、Webpack、Angular.js、Atom、Ember.js、Axios、D3、Framework、Cakephp、Laravel、Transformers、Python、Airflow、Spacy、Freecodecamp、Glances、Django-rest-framework、Libcloud、Numpy、Flask、Celery、Keras、Models、Django、Brew和Rails。
提供机构:
mamiksik
原始信息汇总

数据集概述

数据集特征

  • content_type: 数据类型 - string
  • main_lang: 数据类型 - string
  • message: 数据类型 - string
  • sha: 数据类型 - string
  • patch: 数据类型 - string
  • file_count: 数据类型 - int64

数据集划分

  • train:
    • 样本数量: 62272
    • 数据大小: 260603276.0 bytes
  • test:
    • 样本数量: 7784
    • 数据大小: 32575409.5 bytes
  • valid:
    • 样本数量: 7784
    • 数据大小: 32575409.5 bytes

数据集大小

  • 下载大小: 112191621 bytes
  • 数据集总大小: 325754095.0 bytes

包含的项目列表

  • Moby: 语言 - Go, 获取次数 - 5943
  • Rxjava: 语言 - Java, 获取次数 - 516
  • Spring-framework: 语言 - Java, 获取次数 - 2529
  • Chart.js: 语言 - Javascript, 获取次数 - 641
  • Three.js: 语言 - Javascript, 获取次数 - 1512
  • Redux: 语言 - Javascript, 获取次数 - 592
  • React-native: 语言 - Javascript, 获取次数 - 2901
  • React: 语言 - Javascript, 获取次数 - 2335
  • Pdf.js: 语言 - Javascript, 获取次数 - 966
  • Node: 语言 - Javascript, 获取次数 - 7779
  • Next.js: 语言 - Javascript, 获取次数 - 1183
  • Moment: 语言 - Javascript, 获取次数 - 422
  • Video.js: 语言 - Javascript, 获取次数 - 254
  • Immutable-js: 语言 - Javascript, 获取次数 - 112
  • Jquery: 语言 - Javascript, 获取次数 - 527
  • Webpack: 语言 - Javascript, 获取次数 - 1715
  • Angular.js: 语言 - Javascript, 获取次数 - 1938
  • Atom: 语言 - Javascript, 获取次数 - 1090
  • Ember.js: 语言 - Javascript, 获取次数 - 2094
  • Axios: 语言 - Javascript, 获取次数 - 110
  • D3: 语言 - Javascript, 获取次数 - 371
  • Framework: 语言 - PHP, 获取次数 - 4668
  • Cakephp: 语言 - PHP, 获取次数 - 5827
  • Laravel: 语言 - PHP, 获取次数 - 769
  • Transformers: 语言 - Python, 获取次数 - 1735
  • Python: 语言 - Python, 获取次数 - 330
  • Airflow: 语言 - Python, 获取次数 - 1592
  • Spacy: 语言 - Python, 获取次数 - 2033
  • Freecodecamp: 语言 - Python, 获取次数 - 2773
  • Glances: 语言 - Python, 获取次数 - 494
  • Django-rest-framework: 语言 - Python, 获取次数 - 1084
  • Libcloud: 语言 - Python, 获取次数 - 1104
  • Numpy: 语言 - Python, 获取次数 - 2512
  • Flask: 语言 - Python, 获取次数 - 277
  • Celery: 语言 - Python, 获取次数 - 565
  • Keras: 语言 - Python, 获取次数 - 1466
  • Models: 语言 - Python, 获取次数 - 930
  • Django: 语言 - Python, 获取次数 - 170
  • Brew: 语言 - Ruby, 获取次数 - 5560
  • Rails: 语言 - Ruby, 获取次数 - 8421
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作