mteb/NaijaSenti
收藏Hugging Face2025-05-06 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/mteb/NaijaSenti
下载链接
链接失效反馈官方服务:
资源简介:
NaijaSenti 是尼日利亚四种主要语言的第一个大规模人类标注的Twitter情感数据集,包括豪萨语、伊博语、尼日利亚 pidgin 语和约鲁巴语。每个语言大约有 30,000 条标注的推文,包括大量代码混合的推文。该数据集用于文本分类、情感分析、情感评分、情感分类和仇恨言论检测等任务。该数据集是多语言的,并遵循 CC BY 4.0 许可。
NaijaSenti is the first large-scale human-annotated Twitter sentiment dataset for the four most widely spoken languages in Nigeria — Hausa, Igbo, Nigerian-Pidgin, and Yorùbá — consisting of around 30,000 annotated tweets per language, including a significant fraction of code-mixed tweets.
提供机构:
mteb



