cc-platform-links/platform-urls-sample-roberta-tiny-filtered
收藏Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cc-platform-links/platform-urls-sample-roberta-tiny-filtered
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: url
dtype: string
- name: label
dtype: int64
- name: true_label
dtype: int64
splits:
- name: train
num_bytes: 1738881
num_examples: 20739
download_size: 756212
dataset_size: 1738881
---
# Dataset Card for "platform-urls-sample-roberta-tiny-filtered"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
配置项:
- 配置名称:default
数据文件:
- 拆分:train(训练集)
路径:data/train-*
数据集信息:
特征:
- 字段名:url,数据类型:string
- 字段名:label,数据类型:int64
- 字段名:true_label,数据类型:int64
拆分:
- 拆分名称:train(训练集),字节数:1738881,样本数:20739
下载大小:756212,数据集总大小:1738881
---
# 「platform-urls-sample-roberta-tiny-filtered」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
cc-platform-links
原始信息汇总
数据集概述
数据集名称
- platform-urls-sample-roberta-tiny-filtered
配置信息
- 默认配置 (
default)- 数据文件路径:
data/train-*
- 数据文件路径:
数据特征
- 特征列表
url: 类型为stringlabel: 类型为int64true_label: 类型为int64
数据分割
- 训练集 (
train)- 字节数: 1738881
- 样本数: 20739
数据大小
- 下载大小: 756212
- 数据集大小: 1738881



