chronbmm/ud-lemma
收藏Hugging Face2024-06-15 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/chronbmm/ud-lemma
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence
dtype: string
- name: unsandhied
dtype: string
splits:
- name: train
num_bytes: 5209305
num_examples: 20385
- name: validation
num_bytes: 663889
num_examples: 2962
- name: test
num_bytes: 637306
num_examples: 2938
download_size: 3726974
dataset_size: 6510500
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征集:
- 字段名:句子(sentence),数据类型:字符串
- 字段名:非连音形式(unsandhied),数据类型:字符串
数据集划分:
- 划分名称:训练集(train),字节占用:5209305,样本数量:20385
- 划分名称:验证集(validation),字节占用:663889,样本数量:2962
- 划分名称:测试集(test),字节占用:637306,样本数量:2938
下载大小:3726974,数据集总大小:6510500
配置项:
- 配置名称:默认(default),数据文件:
- 训练集划分:数据路径为 data/train-*
- 验证集划分:数据路径为 data/validation-*
- 测试集划分:数据路径为 data/test-*
提供机构:
chronbmm



