mamiksik/processed-commit-diffs
收藏Hugging Face2023-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mamiksik/processed-commit-diffs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个开源项目的信息,主要字段包括内容类型、主要语言、消息、SHA、补丁和文件数量。数据集被划分为训练集、测试集和验证集,分别包含62272、7784和7784个样本。数据集总大小为325754095字节,下载大小为112191621字节。数据集中包含的项目涵盖了多种编程语言,如Go、Java、Javascript、PHP、Python和Ruby,具体项目包括Moby、Rxjava、Spring-framework、Chart.js、Three.js、Redux、React-native、React、Pdf.js、Node、Next.js、Moment、Video.js、Immutable-js、Jquery、Webpack、Angular.js、Atom、Ember.js、Axios、D3、Framework、Cakephp、Laravel、Transformers、Python、Airflow、Spacy、Freecodecamp、Glances、Django-rest-framework、Libcloud、Numpy、Flask、Celery、Keras、Models、Django、Brew和Rails。
该数据集包含多个开源项目的信息,主要字段包括内容类型、主要语言、消息、SHA、补丁和文件数量。数据集被划分为训练集、测试集和验证集,分别包含62272、7784和7784个样本。数据集总大小为325754095字节,下载大小为112191621字节。数据集中包含的项目涵盖了多种编程语言,如Go、Java、Javascript、PHP、Python和Ruby,具体项目包括Moby、Rxjava、Spring-framework、Chart.js、Three.js、Redux、React-native、React、Pdf.js、Node、Next.js、Moment、Video.js、Immutable-js、Jquery、Webpack、Angular.js、Atom、Ember.js、Axios、D3、Framework、Cakephp、Laravel、Transformers、Python、Airflow、Spacy、Freecodecamp、Glances、Django-rest-framework、Libcloud、Numpy、Flask、Celery、Keras、Models、Django、Brew和Rails。
提供机构:
mamiksik
原始信息汇总
数据集概述
数据集特征
- content_type: 数据类型 - string
- main_lang: 数据类型 - string
- message: 数据类型 - string
- sha: 数据类型 - string
- patch: 数据类型 - string
- file_count: 数据类型 - int64
数据集划分
- train:
- 样本数量: 62272
- 数据大小: 260603276.0 bytes
- test:
- 样本数量: 7784
- 数据大小: 32575409.5 bytes
- valid:
- 样本数量: 7784
- 数据大小: 32575409.5 bytes
数据集大小
- 下载大小: 112191621 bytes
- 数据集总大小: 325754095.0 bytes
包含的项目列表
- Moby: 语言 - Go, 获取次数 - 5943
- Rxjava: 语言 - Java, 获取次数 - 516
- Spring-framework: 语言 - Java, 获取次数 - 2529
- Chart.js: 语言 - Javascript, 获取次数 - 641
- Three.js: 语言 - Javascript, 获取次数 - 1512
- Redux: 语言 - Javascript, 获取次数 - 592
- React-native: 语言 - Javascript, 获取次数 - 2901
- React: 语言 - Javascript, 获取次数 - 2335
- Pdf.js: 语言 - Javascript, 获取次数 - 966
- Node: 语言 - Javascript, 获取次数 - 7779
- Next.js: 语言 - Javascript, 获取次数 - 1183
- Moment: 语言 - Javascript, 获取次数 - 422
- Video.js: 语言 - Javascript, 获取次数 - 254
- Immutable-js: 语言 - Javascript, 获取次数 - 112
- Jquery: 语言 - Javascript, 获取次数 - 527
- Webpack: 语言 - Javascript, 获取次数 - 1715
- Angular.js: 语言 - Javascript, 获取次数 - 1938
- Atom: 语言 - Javascript, 获取次数 - 1090
- Ember.js: 语言 - Javascript, 获取次数 - 2094
- Axios: 语言 - Javascript, 获取次数 - 110
- D3: 语言 - Javascript, 获取次数 - 371
- Framework: 语言 - PHP, 获取次数 - 4668
- Cakephp: 语言 - PHP, 获取次数 - 5827
- Laravel: 语言 - PHP, 获取次数 - 769
- Transformers: 语言 - Python, 获取次数 - 1735
- Python: 语言 - Python, 获取次数 - 330
- Airflow: 语言 - Python, 获取次数 - 1592
- Spacy: 语言 - Python, 获取次数 - 2033
- Freecodecamp: 语言 - Python, 获取次数 - 2773
- Glances: 语言 - Python, 获取次数 - 494
- Django-rest-framework: 语言 - Python, 获取次数 - 1084
- Libcloud: 语言 - Python, 获取次数 - 1104
- Numpy: 语言 - Python, 获取次数 - 2512
- Flask: 语言 - Python, 获取次数 - 277
- Celery: 语言 - Python, 获取次数 - 565
- Keras: 语言 - Python, 获取次数 - 1466
- Models: 语言 - Python, 获取次数 - 930
- Django: 语言 - Python, 获取次数 - 170
- Brew: 语言 - Ruby, 获取次数 - 5560
- Rails: 语言 - Ruby, 获取次数 - 8421



