five

ndamulelonemakh/za_vocabulary

收藏
Hugging Face2024-05-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ndamulelonemakh/za_vocabulary
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: Sepedi features: - name: text dtype: string splits: - name: train num_bytes: 106455 num_examples: 7157 download_size: 77498 dataset_size: 106455 - config_name: isixhosa features: - name: text dtype: string splits: - name: train num_bytes: 160054 num_examples: 9460 download_size: 116205 dataset_size: 160054 - config_name: isizulu features: - name: text dtype: string splits: - name: train num_bytes: 104923 num_examples: 6380 download_size: 77641 dataset_size: 104923 - config_name: sesotho sa leboa features: - name: text dtype: string splits: - name: train num_bytes: 106455 num_examples: 7157 download_size: 77498 dataset_size: 106455 - config_name: setswana features: - name: text dtype: string splits: - name: train num_bytes: 180211 num_examples: 11972 download_size: 131381 dataset_size: 180211 - config_name: tshivenda features: - name: text dtype: string splits: - name: train num_bytes: 631602 num_examples: 51973 download_size: 535754 dataset_size: 631602 configs: - config_name: Sepedi data_files: - split: train path: Sepedi/train-* - config_name: isixhosa data_files: - split: train path: isixhosa/train-* - config_name: isizulu data_files: - split: train path: isizulu/train-* - config_name: sesotho sa leboa data_files: - split: train path: sesotho sa leboa/train-* - config_name: setswana data_files: - split: train path: setswana/train-* - config_name: tshivenda data_files: - split: train path: tshivenda/train-* ---
提供机构:
ndamulelonemakh
原始信息汇总

数据集概述

数据集配置信息

Sepedi

  • 特征:
    • name: text
    • dtype: string
  • 分割:
    • 名称: train
    • 字节数: 106455
    • 示例数: 7157
  • 下载大小: 77498
  • 数据集大小: 106455

isixhosa

  • 特征:
    • name: text
    • dtype: string
  • 分割:
    • 名称: train
    • 字节数: 160054
    • 示例数: 9460
  • 下载大小: 116205
  • 数据集大小: 160054

isizulu

  • 特征:
    • name: text
    • dtype: string
  • 分割:
    • 名称: train
    • 字节数: 104923
    • 示例数: 6380
  • 下载大小: 77641
  • 数据集大小: 104923

sesotho sa leboa

  • 特征:
    • name: text
    • dtype: string
  • 分割:
    • 名称: train
    • 字节数: 106455
    • 示例数: 7157
  • 下载大小: 77498
  • 数据集大小: 106455

setswana

  • 特征:
    • name: text
    • dtype: string
  • 分割:
    • 名称: train
    • 字节数: 180211
    • 示例数: 11972
  • 下载大小: 131381
  • 数据集大小: 180211

tshivenda

  • 特征:
    • name: text
    • dtype: string
  • 分割:
    • 名称: train
    • 字节数: 631602
    • 示例数: 51973
  • 下载大小: 535754
  • 数据集大小: 631602
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作