five

mteb/NaijaSenti

收藏
Hugging Face2025-05-06 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/mteb/NaijaSenti
下载链接
链接失效反馈
官方服务:
资源简介:
NaijaSenti 是尼日利亚四种主要语言的第一个大规模人类标注的Twitter情感数据集,包括豪萨语、伊博语、尼日利亚 pidgin 语和约鲁巴语。每个语言大约有 30,000 条标注的推文,包括大量代码混合的推文。该数据集用于文本分类、情感分析、情感评分、情感分类和仇恨言论检测等任务。该数据集是多语言的,并遵循 CC BY 4.0 许可。

NaijaSenti is the first large-scale human-annotated Twitter sentiment dataset for the four most widely spoken languages in Nigeria — Hausa, Igbo, Nigerian-Pidgin, and Yorùbá — consisting of around 30,000 annotated tweets per language, including a significant fraction of code-mixed tweets.
提供机构:
mteb
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作