WanJuan-Korean(万卷丝路-韩语)
收藏魔搭社区2026-01-06 更新2025-03-01 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/WanJuan-Korean
下载链接
链接失效反馈官方服务:
资源简介:
WanJuan-Korean(万卷丝路-韩语)语料库,体积超过280GB,包含7个大类和34个小类,覆盖历史、政治、文化、房产、购物、天气、餐饮、百科、专业知识等多个当地特色内容。丰富的主题分类不仅方便了研究人员根据具体需求检索数据,也确保了该语料能够适应不同研究领域多种需求。
The WanJuan-Korean Corpus (WanJuan Silk Road-Korean) has a total size exceeding 280 GB, comprising 7 major categories and 34 subcategories. It covers a wide range of region-specific content, including history, politics, culture, real estate, shopping, weather, food and beverage, encyclopedic knowledge, professional knowledge, and other similar content. The comprehensive thematic classification not only facilitates researchers in retrieving data tailored to their specific needs, but also ensures that the corpus can meet diverse demands across various research fields.
提供机构:
maas
创建时间:
2025-02-26
搜集汇总
数据集介绍

背景与挑战
背景概述
WanJuan-Korean(万卷丝路-韩语)是一个超过280GB的大规模韩语语料库,涵盖7个主要类别和34个子类别,包括历史、政治、文化、房地产、购物、天气、餐饮、百科全书和专业知识等本地化内容。该数据集采用CC BY 4.0许可证,由OpenDataLab发布并更新于2025年11月26日,适用于多样化的研究需求。
以上内容由遇见数据集搜集并总结生成



