five

Geonwoohong/modu-morph-train-encoded-ko

收藏
Hugging Face2025-10-23 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/Geonwoohong/modu-morph-train-encoded-ko
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个形态编码的韩语语料库,用于形态相关研究。它整合了八个清理过的韩语来源,包括书面语、口语、非出版物、报纸、即时通讯、情感方面、情感和对话。每个样本都被编码成结构化的形态素序列,分为语义和风格流。

This dataset is a morphologically encoded Korean corpus constructed for morph-related research. It integrates eight cleaned Korean sources — written, spoken, nonpublication, newspaper, messenger, aspect_emotion, emotion, and dialogue — and encodes each sample into structured morpheme sequences for semantic and stylistic streams.
提供机构:
Geonwoohong
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作