MonoHime/ru_sentiment_dataset
收藏Hugging Face2021-05-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MonoHime/ru_sentiment_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从六个不同来源聚合的俄语文本,用于情感分析和文本分类。数据集中的标签含义为:0表示中性,1表示积极,2表示消极。数据集来源包括俄语新闻的情感分析、俄语有毒评论、汽车评论、不同领域的评论、LINIS Crowd的文本集合以及俄语酒店评论。
This dataset aggregates Russian-language text from six distinct sources, tailored for sentiment analysis and text classification tasks. The label definitions are as follows: 0 denotes neutral sentiment, 1 denotes positive sentiment, and 2 denotes negative sentiment. The dataset’s sources include sentiment analysis datasets for Russian news, Russian toxic comments, automotive reviews, reviews from diverse domains, the text corpus from LINIS Crowd, and Russian hotel reviews.
提供机构:
MonoHime
原始信息汇总
俄语文本情感分析数据集概述
数据集内容
本数据集包含来自6个不同源的俄语文本数据,主要用于情感分析。
标签含义
- 0: NEUTRAL(中性)
- 1: POSITIVE(积极)
- 2: NEGATIVE(消极)
数据集来源
-
俄语情感分析
- 来源:Kaggle
- 描述:包含俄语新闻的情感(积极、消极或中性)。
-
俄语毒性评论
- 来源:Kaggle
- 描述:来自2ch.hk和pikabu.ru的标记评论小数据集。
-
汽车评论数据集(用于机器学习情感分析)
- 来源:GitHub
- 描述:包含汽车评论数据。
-
Blinov的情感数据集
- 来源:GitHub
- 描述:包含不同领域的评论数据。
-
LINIS Crowd
- 来源:LINIS Crowd
- 描述:由Sergei Koltcov, Olessia Koltsova和Svetlana Alexeeva创建的情感字典和文本集合。
-
俄语酒店评论数据集
- 来源:Google Drive
- 描述:包含俄语酒店评论。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



