MOLD (Marathi Offensive Language Dataset)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MOLD
下载链接
链接失效反馈官方服务:
资源简介:
MOLD 是为马拉地语编译的第一个此类数据集,从而为低资源印度-雅利安语言的研究开辟了一个新领域。我们展示了对该数据集进行的多项机器学习实验的结果,包括基于孟加拉语、英语和印地语现有数据的最先进跨语言转换器的零短和其他迁移学习实验。
提供机构:
OpenDataLab
创建时间:
2022-05-07
搜集汇总
数据集介绍

背景与挑战
背景概述
MOLD是首个马拉地语攻击性语言数据集,为低资源印度-雅利安语言的研究开辟了新领域。该数据集已用于多项机器学习实验,包括基于多语言数据的跨语言转换器零样本和迁移学习测试。
以上内容由遇见数据集搜集并总结生成



