five

DGurgurov/bengali_sa

收藏
Hugging Face2024-05-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/DGurgurov/bengali_sa
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个用于情感分析的数据集,来源于Sazzed等人(2020)的研究。数据集主要用于孟加拉语的情感分析,包含大约12000条孟加拉语评论的注释语料库。研究还探讨了利用机器翻译从英语资源中获取数据的方法,并比较了在机器翻译的英语语料库和原始孟加拉语语料库中监督机器学习分类器的性能。实验结果表明,基于机器翻译的跨语言方法在孟加拉语的情感分类中是有效的。

该数据集包含一个用于情感分析的数据集,来源于Sazzed等人(2020)的研究。数据集主要用于孟加拉语的情感分析,包含大约12000条孟加拉语评论的注释语料库。研究还探讨了利用机器翻译从英语资源中获取数据的方法,并比较了在机器翻译的英语语料库和原始孟加拉语语料库中监督机器学习分类器的性能。实验结果表明,基于机器翻译的跨语言方法在孟加拉语的情感分类中是有效的。
提供机构:
DGurgurov
原始信息汇总

数据集概述

数据集名称

Sentiment Analysis Data for the Bengali Language

数据集描述

本数据集包含Sazzed等人在2020年发布的情感分析数据,主要用于研究低资源语言的词嵌入改进项目。

数据结构

数据用于支持项目improving word embeddings with graph knowledge for Low Resource Languages

语言

本数据集使用的语言为Bengali(孟加拉语)。

任务类别

  • 文本分类

许可证

MIT

引用信息

bibtex @inproceedings{sazzed-2020-cross, title = "Cross-lingual sentiment classification in low-resource {B}engali language", author = "Sazzed, Salim", editor = "Xu, Wei and Ritter, Alan and Baldwin, Tim and Rahimi, Afshin", booktitle = "Proceedings of the Sixth Workshop on Noisy User-generated Text (W-NUT 2020)", month = nov, year = "2020", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2020.wnut-1.8", doi = "10.18653/v1/2020.wnut-1.8", pages = "50--60", abstract = "..." }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作