five

WillHeld/uniform_top

收藏
Hugging Face2022-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/WillHeld/uniform_top
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: utterance dtype: string - name: locale dtype: string - name: semantic_parse dtype: string splits: - name: eval_en num_bytes: 283034 num_examples: 2235 - name: test_en num_bytes: 554754 num_examples: 4386 - name: train_en num_bytes: 1973838 num_examples: 15667 - name: eval_de num_bytes: 242996 num_examples: 1815 - name: test_de num_bytes: 471105 num_examples: 3549 - name: train_de num_bytes: 1804566 num_examples: 13424 - name: eval_es num_bytes: 207924 num_examples: 1527 - name: test_es num_bytes: 402468 num_examples: 2998 - name: train_es num_bytes: 1473681 num_examples: 10934 - name: eval_fr num_bytes: 208175 num_examples: 1577 - name: test_fr num_bytes: 427290 num_examples: 3193 - name: train_fr num_bytes: 1578716 num_examples: 11814 - name: eval_hi num_bytes: 435694 num_examples: 2012 - name: test_hi num_bytes: 576384 num_examples: 2789 - name: train_hi num_bytes: 2356893 num_examples: 11330 - name: eval_th num_bytes: 363531 num_examples: 1671 - name: test_th num_bytes: 586408 num_examples: 2765 - name: train_th num_bytes: 2303175 num_examples: 10759 - name: eval_cstop num_bytes: 74530 num_examples: 559 - name: test_cstop num_bytes: 153728 num_examples: 1167 - name: train_cstop num_bytes: 540817 num_examples: 4077 - name: eval_top_v2 num_bytes: 2565386 num_examples: 17160 - name: test_top_v2 num_bytes: 5759599 num_examples: 38785 - name: train_top_v2 num_bytes: 18815125 num_examples: 124597 - name: validation_hinglish_top num_bytes: 220386 num_examples: 1390 - name: test_hinglish_top num_bytes: 1069867 num_examples: 6513 - name: train_hinglish_top num_bytes: 478317 num_examples: 2993 - name: eval_cstop_artificial num_bytes: 70248 num_examples: 559 - name: test_cstop_artificial num_bytes: 144553 num_examples: 1167 - name: train_cstop_artificial num_bytes: 508926 num_examples: 4077 download_size: 17110962 dataset_size: 46652114 --- # Dataset Card for "uniform_top" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
WillHeld
原始信息汇总

数据集概述

数据集名称

"uniform_top"

数据集特征

  • utterance: 数据类型为字符串。
  • locale: 数据类型为字符串。
  • semantic_parse: 数据类型为字符串。

数据集分割

  • 英语(en)
    • train: 15667个样本,1973838字节。
    • test: 4386个样本,554754字节。
    • eval: 2235个样本,283034字节。
  • 德语(de)
    • train: 13424个样本,1804566字节。
    • test: 3549个样本,471105字节。
    • eval: 1815个样本,242996字节。
  • 西班牙语(es)
    • train: 10934个样本,1473681字节。
    • test: 2998个样本,402468字节。
    • eval: 1527个样本,207924字节。
  • 法语(fr)
    • train: 11814个样本,1578716字节。
    • test: 3193个样本,427290字节。
    • eval: 1577个样本,208175字节。
  • 印地语(hi)
    • train: 11330个样本,2356893字节。
    • test: 2789个样本,576384字节。
    • eval: 2012个样本,435694字节。
  • 泰语(th)
    • train: 10759个样本,2303175字节。
    • test: 2765个样本,586408字节。
    • eval: 1671个样本,363531字节。
  • 其他(cstop, cstop_artificial, top_v2, hinglish_top)
    • 详细信息如上。

数据集大小

  • 下载大小: 17110962字节。
  • 数据集大小: 46652114字节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作