five

hayesyang/diff_sitemap_and_direct

收藏
Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hayesyang/diff_sitemap_and_direct
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: url dtype: string - name: sitemap dtype: string - name: local dtype: string - name: quick_ratio dtype: float64 splits: - name: zh num_bytes: 74903836 num_examples: 2771 - name: en num_bytes: 69187224 num_examples: 2258 - name: fr num_bytes: 38867616 num_examples: 1201 - name: es num_bytes: 56906331 num_examples: 1695 - name: ru num_bytes: 35285827 num_examples: 926 - name: ar num_bytes: 34554954 num_examples: 883 download_size: 84893570 dataset_size: 309705788 --- # Dataset Card for "diff_sitemap_and_direct" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
hayesyang
原始信息汇总

数据集概述

数据集名称

  • 名称: diff_sitemap_and_direct

数据集特征

  • 特征列表:
    • url: 数据类型为 string
    • sitemap: 数据类型为 string
    • local: 数据类型为 string
    • quick_ratio: 数据类型为 float64

数据集分割

  • 分割详情:
    • 语言: zh
      • 字节数: 74903836
      • 示例数: 2771
    • 语言: en
      • 字节数: 69187224
      • 示例数: 2258
    • 语言: fr
      • 字节数: 38867616
      • 示例数: 1201
    • 语言: es
      • 字节数: 56906331
      • 示例数: 1695
    • 语言: ru
      • 字节数: 35285827
      • 示例数: 926
    • 语言: ar
      • 字节数: 34554954
      • 示例数: 883

数据集大小

  • 下载大小: 84893570
  • 数据集总大小: 309705788
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作