five

mad0perator/torah-verses-transliterated

收藏
Hugging Face2025-04-04 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/mad0perator/torah-verses-transliterated
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是希伯来语《托拉》文本的拉丁文字符转写版本,每个文件包含一行一句《托拉》的内容,单词之间由空格分隔。数据集被随机划分为训练集、验证集和测试集,比例分别为80%、10%和10%,且每个集合的内容都保持了文本原有的总体流向。数据集由mad0perator维护,并遵循MIT许可证。

This dataset is a Latin script transliteration of the Hebrew Torah text, with each file containing one verse per line, space-separated tokens. The dataset is randomly split into training, validation, and testing sets at ratios of 80%, 10%, and 10% respectively, while maintaining the original general flow direction of the text. The dataset is curated by mad0perator and is licensed under MIT.
提供机构:
mad0perator
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作