five

BeitTigreAI/tigre-data-kenLM

收藏
Hugging Face2025-11-19 更新2025-11-30 收录
下载链接:
https://hf-mirror.com/datasets/BeitTigreAI/tigre-data-kenLM
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个针对Tigre语言的3-gram语言模型,使用KenLM工具包训练而成。模型以高度优化的二进制格式提供,适用于生产环境中的高效使用。该模型基于Tigre Monolingual Text Dataset (Tigre-Data 1.0)进行训练,具有316,548个唯一1-gram词汇和1,285,462个唯一N-gram (1-to-3)。模型的困惑度为147.12。

This is a 3-gram Language Model for the Tigre language, trained using the KenLM toolkit. The model is provided in a highly optimized binary format, suitable for efficient use in production environments. It was trained on the Tigre Monolingual Text Dataset (Tigre-Data 1.0) and has a vocabulary size of 316,548 unique 1-grams and 1,285,462 unique N-grams (1-to-3). The models perplexity is 147.12.
提供机构:
BeitTigreAI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作