WillHeld/uniform_top
收藏Hugging Face2022-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/WillHeld/uniform_top
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: utterance
dtype: string
- name: locale
dtype: string
- name: semantic_parse
dtype: string
splits:
- name: eval_en
num_bytes: 283034
num_examples: 2235
- name: test_en
num_bytes: 554754
num_examples: 4386
- name: train_en
num_bytes: 1973838
num_examples: 15667
- name: eval_de
num_bytes: 242996
num_examples: 1815
- name: test_de
num_bytes: 471105
num_examples: 3549
- name: train_de
num_bytes: 1804566
num_examples: 13424
- name: eval_es
num_bytes: 207924
num_examples: 1527
- name: test_es
num_bytes: 402468
num_examples: 2998
- name: train_es
num_bytes: 1473681
num_examples: 10934
- name: eval_fr
num_bytes: 208175
num_examples: 1577
- name: test_fr
num_bytes: 427290
num_examples: 3193
- name: train_fr
num_bytes: 1578716
num_examples: 11814
- name: eval_hi
num_bytes: 435694
num_examples: 2012
- name: test_hi
num_bytes: 576384
num_examples: 2789
- name: train_hi
num_bytes: 2356893
num_examples: 11330
- name: eval_th
num_bytes: 363531
num_examples: 1671
- name: test_th
num_bytes: 586408
num_examples: 2765
- name: train_th
num_bytes: 2303175
num_examples: 10759
- name: eval_cstop
num_bytes: 74530
num_examples: 559
- name: test_cstop
num_bytes: 153728
num_examples: 1167
- name: train_cstop
num_bytes: 540817
num_examples: 4077
- name: eval_top_v2
num_bytes: 2565386
num_examples: 17160
- name: test_top_v2
num_bytes: 5759599
num_examples: 38785
- name: train_top_v2
num_bytes: 18815125
num_examples: 124597
- name: validation_hinglish_top
num_bytes: 220386
num_examples: 1390
- name: test_hinglish_top
num_bytes: 1069867
num_examples: 6513
- name: train_hinglish_top
num_bytes: 478317
num_examples: 2993
- name: eval_cstop_artificial
num_bytes: 70248
num_examples: 559
- name: test_cstop_artificial
num_bytes: 144553
num_examples: 1167
- name: train_cstop_artificial
num_bytes: 508926
num_examples: 4077
download_size: 17110962
dataset_size: 46652114
---
# Dataset Card for "uniform_top"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
WillHeld
原始信息汇总
数据集概述
数据集名称
"uniform_top"
数据集特征
- utterance: 数据类型为字符串。
- locale: 数据类型为字符串。
- semantic_parse: 数据类型为字符串。
数据集分割
- 英语(en)
- train: 15667个样本,1973838字节。
- test: 4386个样本,554754字节。
- eval: 2235个样本,283034字节。
- 德语(de)
- train: 13424个样本,1804566字节。
- test: 3549个样本,471105字节。
- eval: 1815个样本,242996字节。
- 西班牙语(es)
- train: 10934个样本,1473681字节。
- test: 2998个样本,402468字节。
- eval: 1527个样本,207924字节。
- 法语(fr)
- train: 11814个样本,1578716字节。
- test: 3193个样本,427290字节。
- eval: 1577个样本,208175字节。
- 印地语(hi)
- train: 11330个样本,2356893字节。
- test: 2789个样本,576384字节。
- eval: 2012个样本,435694字节。
- 泰语(th)
- train: 10759个样本,2303175字节。
- test: 2765个样本,586408字节。
- eval: 1671个样本,363531字节。
- 其他(cstop, cstop_artificial, top_v2, hinglish_top)
- 详细信息如上。
数据集大小
- 下载大小: 17110962字节。
- 数据集大小: 46652114字节。



