kiet-ha/spoken-norm
收藏Hugging Face2025-12-17 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/kiet-ha/spoken-norm
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: src
list: string
- name: tgt
list: string
- name: tag
list: string
splits:
- name: train
num_bytes: 5995984495
num_examples: 4999987
- name: valid
num_bytes: 39745189
num_examples: 50000
- name: test
num_bytes: 39336444
num_examples: 50000
download_size: 1451131914
dataset_size: 6075066128
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: valid
path: data/valid-*
- split: test
path: data/test-*
---
数据集信息:
特征项:
- 特征名:src(源序列),数据类型:字符串列表
- 特征名:tgt(目标序列),数据类型:字符串列表
- 特征名:tag(标签序列),数据类型:字符串列表
数据集拆分:
- 拆分名称:train(训练集),数据字节数:5995984495,样本总数:4999987
- 拆分名称:valid(验证集),数据字节数:39745189,样本总数:50000
- 拆分名称:test(测试集),数据字节数:39336444,样本总数:50000
下载总大小:1451131914
总数据体量:6075066128
配置项:
- 配置名称:default,数据文件路径:
- 训练集拆分:对应路径 data/train-*
- 验证集拆分:对应路径 data/valid-*
- 测试集拆分:对应路径 data/test-*
提供机构:
kiet-ha



