chronbmm/sanskrit-sandhi-split-hackathon
收藏Hugging Face2023-04-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chronbmm/sanskrit-sandhi-split-hackathon
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence
dtype: string
- name: unsandhied
dtype: string
splits:
- name: train
num_bytes: 9350944
num_examples: 89323
- name: validation
num_bytes: 1164083
num_examples: 10235
- name: test
num_bytes: 1169683
num_examples: 9965
- name: test_500
num_bytes: 62539
num_examples: 500
- name: validation_500
num_bytes: 53738
num_examples: 500
download_size: 7114072
dataset_size: 11800987
---
# Dataset Card for "sanskrit-sandhi-split-hackathon"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
chronbmm
原始信息汇总
数据集概述
数据集名称
- 名称: sanskrit-sandhi-split-hackathon
数据集特征
- 特征1: sentence
- 数据类型: string
- 特征2: unsandhied
- 数据类型: string
数据集分割
- 训练集
- 字节数: 9350944
- 示例数: 89323
- 验证集
- 字节数: 1164083
- 示例数: 10235
- 测试集
- 字节数: 1169683
- 示例数: 9965
- 测试集_500
- 字节数: 62539
- 示例数: 500
- 验证集_500
- 字节数: 53738
- 示例数: 500
数据集大小
- 下载大小: 7114072
- 数据集大小: 11800987



