hayesyang/diff_sitemap_and_direct
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hayesyang/diff_sitemap_and_direct
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: url
dtype: string
- name: sitemap
dtype: string
- name: local
dtype: string
- name: quick_ratio
dtype: float64
splits:
- name: zh
num_bytes: 74903836
num_examples: 2771
- name: en
num_bytes: 69187224
num_examples: 2258
- name: fr
num_bytes: 38867616
num_examples: 1201
- name: es
num_bytes: 56906331
num_examples: 1695
- name: ru
num_bytes: 35285827
num_examples: 926
- name: ar
num_bytes: 34554954
num_examples: 883
download_size: 84893570
dataset_size: 309705788
---
# Dataset Card for "diff_sitemap_and_direct"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
hayesyang
原始信息汇总
数据集概述
数据集名称
- 名称: diff_sitemap_and_direct
数据集特征
- 特征列表:
url: 数据类型为stringsitemap: 数据类型为stringlocal: 数据类型为stringquick_ratio: 数据类型为float64
数据集分割
- 分割详情:
- 语言: zh
- 字节数: 74903836
- 示例数: 2771
- 语言: en
- 字节数: 69187224
- 示例数: 2258
- 语言: fr
- 字节数: 38867616
- 示例数: 1201
- 语言: es
- 字节数: 56906331
- 示例数: 1695
- 语言: ru
- 字节数: 35285827
- 示例数: 926
- 语言: ar
- 字节数: 34554954
- 示例数: 883
- 语言: zh
数据集大小
- 下载大小: 84893570
- 数据集总大小: 309705788



