ltsab1618033988/safekids-5m-urls
收藏Hugging Face2024-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ltsab1618033988/safekids-5m-urls
下载链接
链接失效反馈官方服务:
资源简介:
---
size_categories:
- 1M<n<10M
task_categories:
- text-classification
dataset_info:
features:
- name: url
dtype: string
- name: visible_text
dtype: string
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
splits:
- name: infer
num_bytes: 27794610011
num_examples: 4708906
download_size: 12536791752
dataset_size: 27794610011
configs:
- config_name: default
data_files:
- split: infer
path: data/infer-*
---
提供机构:
ltsab1618033988
原始信息汇总
数据集概述
数据集大小
- 下载大小: 12536791752 字节
- 数据集大小: 27794610011 字节
数据集分类
- 大小分类: 1M < n < 10M
- 任务分类: 文本分类
数据集特征
- 特征列表:
- 名称: url
- 数据类型: string
- 名称: visible_text
- 数据类型: string
- 名称: input_ids
- 数据类型: sequence of int32
- 名称: attention_mask
- 数据类型: sequence of int8
- 名称: url
数据集分割
- 分割名称: infer
- 字节数: 27794610011 字节
- 样本数量: 4708906 个样本
配置信息
- 配置名称: default
- 数据文件:
- 分割: infer
- 路径: data/infer-*
- 分割: infer
- 数据文件:



