Investigating Sentences Features for Subjectivity and Polarity Classification in Brazilian Portuguese
收藏NIAID Data Ecosystem2026-03-11 收录
下载链接:
https://data.mendeley.com/datasets/hsn6g3dbsk
下载链接
链接失效反馈官方服务:
资源简介:
O dataset consiste de uma coleta que que os autores fizeram de 350 comentários de usuários sobre restaurantes no Brasil no site TripAdvisor[1], no período de janeiro a março de 2020. Os comentários foram divididos em 1.049 sentenças e cada sentença foi manualmente anotada pelos autores. Inicialmente, as sentenças foram classificadas em objetivas e subjetivas. Foi possível observar que existe um equilíbrio no número de sentenças em cada uma dessas classes. Em seguida, as sentenças subjetivas foram manualmente classificadas em positivas e negativas. As sentenças que eram subjetivas, mas com polaridade neutra, foram desconsideradas. Na prática, foi possível observar que existem poucas sentenças que são subjetivas e neutras. Também foi possível observar que há uma quantidade bastante superior de sentenças positivas do que sentenças negativas no dataset.
[1] https://www.tripadvisor.com.br
创建时间:
2020-08-20



