BeitTigreAI/tigre-data-kenLM
收藏Hugging Face2025-11-19 更新2025-11-30 收录
下载链接:
https://hf-mirror.com/datasets/BeitTigreAI/tigre-data-kenLM
下载链接
链接失效反馈官方服务:
资源简介:
这是一个针对Tigre语言的3-gram语言模型,使用KenLM工具包训练而成。模型以高度优化的二进制格式提供,适用于生产环境中的高效使用。该模型基于Tigre Monolingual Text Dataset (Tigre-Data 1.0)进行训练,具有316,548个唯一1-gram词汇和1,285,462个唯一N-gram (1-to-3)。模型的困惑度为147.12。
This is a 3-gram Language Model for the Tigre language, trained using the KenLM toolkit. The model is provided in a highly optimized binary format, suitable for efficient use in production environments. It was trained on the Tigre Monolingual Text Dataset (Tigre-Data 1.0) and has a vocabulary size of 316,548 unique 1-grams and 1,285,462 unique N-grams (1-to-3). The models perplexity is 147.12.
提供机构:
BeitTigreAI



