NolanChai/wik_eng_wikipedia_en_20m_words-1-conllu
收藏Hugging Face2026-04-22 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/NolanChai/wik_eng_wikipedia_en_20m_words-1-conllu
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个CoNLL-U解析文件:`wik_eng_wikipedia_en_20m_words-1.conllu`。标记计数(仅包括CoNLL-U整数ID,不包括注释、MWT范围和空节点):12,746,154。由`puddin`解析。
This dataset contains a CoNLL-U parse file: `wik_eng_wikipedia_en_20m_words-1.conllu`. Token count (CoNLL-U integer IDs only, excluding comments, MWT ranges, and empty nodes): 12,746,154. Parsed by `puddin`.
提供机构:
NolanChai



