TurboPascal/tokenizers_example_zh_en
收藏Hugging Face2023-04-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TurboPascal/tokenizers_example_zh_en
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- text-generation
language:
- zh
- en
size_categories:
- 1M<n<10M
---
用于训练分词器的基础文本
提供机构:
TurboPascal
原始信息汇总
数据集概述
许可协议
- 许可证:Apache-2.0
任务类别
- 任务类别:文本生成
支持语言
- 中文
- 英文
数据集大小
- 数据集大小:1M<n<10M
数据用途
- 用于训练分词器的基础文本



