five

Weyaxi/huggingface-spaces-codes

收藏
Hugging Face2023-11-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Weyaxi/huggingface-spaces-codes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了截至2023年11月10日Huggingface Spaces中获得超过0个点赞的代码文件,涵盖了多种编程语言,总大小为672 MB(压缩)和2.05 GB(未压缩)。数据字段包括repository、sdk和license。数据结构以作者和空间的形式组织。数据集统计信息详细列出了不同编程语言的文件数量、文件大小和行数。数据集的创建过程包括从Huggingface Hub API抓取数据、过滤点赞数大于0的空间、克隆空间到本地以及处理数据以生成统计信息。
提供机构:
Weyaxi
原始信息汇总

📊 数据集描述

该数据集包含截至2023年11月10日拥有超过0个点赞的Huggingface Spaces代码文件。数据集包含多种编程语言,总计压缩后为672 MB,未压缩为2.05 GB。

📝 数据字段

字段 类型 描述
repository string Huggingface Spaces仓库名称
sdk string 空间的软件开发工具包
license string 空间的许可证类型

🧩 数据结构

数据结构如下:

spaces/ ├─ author1/ │ ├─ space1 │ ├─ space2 ├─ author2/ │ ├─ space1 │ ├─ space2 │ ├─ space3

🏛️ 许可证

Huggingface Spaces包含多种许可证。以下是该数据集包含的许可证列表:

python [ None, mit, apache-2.0, openrail, gpl-3.0, other, afl-3.0, unknown, creativeml-openrail-m, cc-by-nc-4.0, cc-by-4.0, cc, cc-by-nc-sa-4.0, bigscience-openrail-m, bsd-3-clause, agpl-3.0, wtfpl, gpl, artistic-2.0, lgpl-3.0, cc-by-sa-4.0, Configuration error, bsd, cc-by-nc-nd-4.0, cc0-1.0, unlicense, llama2, bigscience-bloom-rail-1.0, gpl-2.0, bsd-2-clause, osl-3.0, cc-by-2.0, cc-by-3.0, cc-by-nc-3.0, cc-by-nc-2.0, cc-by-nd-4.0, openrail++, bigcode-openrail-m, bsd-3-clause-clear, eupl-1.1, cc-by-sa-3.0, mpl-2.0, c-uda, gfdl, cc-by-nc-sa-2.0, cc-by-2.5, bsl-1.0, odc-by, deepfloyd-if-license, ms-pl, ecl-2.0, pddl, ofl-1.1, lgpl-2.1, postgresql, lppl-1.3c, ncsa, cc-by-nc-sa-3.0 ]

📊 数据集统计

语言 文件扩展名 文件数量 文件大小 (MB) 行数
Python .py 141,560 1079.0 28,653,744
SQL .sql 21 523.6 645
JavaScript .js 6,790 369.8 2,137,054
Markdown .md 63,237 273.4 3,110,443
HTML .html 1,953 265.8 516,020
C .c 1,320 132.2 3,558,826
Go .go 429 46.3 6,331
CSS .css 3,097 25.6 386,334
C Header .h 2,824 20.4 570,948
C++ .cpp 1,117 15.3 494,939
TypeScript .ts 4,158 14.8 439,551
TSX .tsx 4,273 9.4 306,416
Shell .sh 3,294 5.5 171,943
Perl .pm 92 4.2 128,594
C# .cs 22 3.9 41,265
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作