chronbmm/sanskrit-sandhi-split-sighum
收藏Hugging Face2023-04-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chronbmm/sanskrit-sandhi-split-sighum
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence
dtype: string
- name: unsandhied
dtype: string
splits:
- name: train
num_bytes: 10973642
num_examples: 99889
- name: validation
num_bytes: 470141
num_examples: 4200
- name: test
num_bytes: 470141
num_examples: 4200
- name: test_500
num_bytes: 58711
num_examples: 500
- name: validation_500
num_bytes: 58711
num_examples: 500
download_size: 7463353
dataset_size: 12031346
---
# Dataset Card for "sanskrit-sandhi-split-sighum"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
chronbmm
原始信息汇总
数据集概述
数据集名称
sanskrit-sandhi-split-sighum
数据集特征
- sentence:字符串类型
- unsandhied:字符串类型
数据集分割
- train
- 样本数量:99889
- 数据大小:10973642字节
- validation
- 样本数量:4200
- 数据大小:470141字节
- test
- 样本数量:4200
- 数据大小:470141字节
- test_500
- 样本数量:500
- 数据大小:58711字节
- validation_500
- 样本数量:500
- 数据大小:58711字节
数据集大小
- 下载大小:7463353字节
- 数据集总大小:12031346字节



