procesaur/STARS

Name: procesaur/STARS
Creator: procesaur
Published: 2024-06-04 16:38:05
License: 暂无描述

Hugging Face2024-06-04 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/procesaur/STARS

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为S.T.A.R.S.，是一个高质量的塞尔维亚语博士论文集合，包含11,624份文档，总计超过5.56亿字。这些文档对于训练塞尔维亚语语言模型至关重要。每个文档通过双换行符分隔，每行代表一个段落，段落内的句子有标记。此外，还提供了完整的元数据和并行翻译文本的相关数据集。

提供机构：

procesaur

原始信息汇总