five

aimandaniel/kamus-dewan

收藏
Hugging Face2025-09-13 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/aimandaniel/kamus-dewan
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含28,515个条目的数字化提取数据集,来源于《Kamus Dewan》第四版权威马来词典。数据集通过半自动化管道从PDF内容转换为机器可读的JSON格式,适用于自然语言处理、搜索或教育应用。数据集在转换过程中保持了高保真度,但存在一些解析错误,可能影响少于1%的条目。

This dataset contains a digital extraction of 28,515 entries from the fourth edition of the authoritative Malay dictionary *Kamus Dewan*. It is converted into a machine-readable JSON format through a semi-automated pipeline suitable for natural language processing, search, or educational applications. The dataset maintains high fidelity in the conversion process but has some parsing errors affecting fewer than 1% of the entries.
提供机构:
aimandaniel
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作