LongWanjuan(万卷长文)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenLMLab/LongWanjuan
下载链接
链接失效反馈官方服务:
资源简介:
A 160B bilingual long-text dataset with 3 categories: holistic, aggregated and chaotic long texts.(万卷长文是一个160B 的双语长文本数据集,分为 3 类:整体长文本、聚合长文本和混沌长文本)
提供机构:
OpenLMLab
创建时间:
2024-02-21



