crumb/js-free-sites
收藏Hugging Face2023-12-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/crumb/js-free-sites
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含2000个不运行JavaScript的网站,这些网站可能非常古老且简单。需要进行过滤以去除失效的网站和错误信息。
该数据集包含2000个不运行JavaScript的网站,这些网站可能非常古老且简单。需要进行过滤以去除失效的网站和错误信息。
提供机构:
crumb
原始信息汇总
数据集信息
特征
- content: 数据类型为字符串
- markdown: 数据类型为字符串
- url: 数据类型为字符串
数据分割
- train:
- 字节数: 82642012
- 样本数: 2067
数据大小
- 下载大小: 34862377
- 数据集大小: 82642012
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



