five

opendatalab/WanJuan-Korean

收藏
Hugging Face2025-04-23 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/opendatalab/WanJuan-Korean
下载链接
链接失效反馈
官方服务:
资源简介:
万卷丝路-韩语是一个超过280GB的韩语语料库,包含7个主要类别和34个子类别。它包括了历史、政治、文化、房地产、购物、天气、餐饮、百科全书和专业知识等多个领域的本地特定内容,适合用于文本生成等多种NLP任务。

WanJuan-Korean is a Korean corpus exceeding 280GB, consisting of 7 major categories and 34 subcategories. It includes local-specific content from various fields such as history, politics, culture, real estate, shopping, weather, dining, encyclopedias, and professional knowledge, suitable for tasks like text generation and other NLP applications.
提供机构:
opendatalab
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作