five

维基百科中文高质量词条子集

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/liding/wikipedia-cn-filtered
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集基于中文维基2023年7月20日的dump存档。作为一项以数据为中心的工作,使用启发式的方法和自有的NLU模型过滤了一部分质量较低或内容不合规的词条。
提供机构:
liding
创建时间:
2023-08-10
二维码
社区交流群
二维码
科研交流群
商业服务