miesepeter/CEFR_vocab_tokens
收藏Hugging Face2023-09-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/miesepeter/CEFR_vocab_tokens
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含按CEFR(欧洲共同语言参考框架)分类的英语单词,并基于sentencepiece分词器进行了分词处理。
This dataset contains English words categorized in accordance with the CEFR (Common European Framework of Reference for Languages), and has been tokenized using the SentencePiece tokenizer.
提供机构:
miesepeter
原始信息汇总
数据集概述
数据集内容
- 语言:英语
- 分类:按照CEFR(欧洲共同语言参考框架)类别分类
- 格式:基于sentencepiece分词器的分词形式
许可证
- 类型:其他
- 基础数据集许可证:可访问http://www.englishprofile.org/wordlists/terms-of-use获取



