matiss/Latvian-Twitter-Eater-Corpus-Sentiment
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/matiss/Latvian-Twitter-Eater-Corpus-Sentiment
下载链接
链接失效反馈官方服务:
资源简介:
该子语料库包含5420条带有情感标注的推文,情感分为正面(pos)、中性(neu)和负面(neg)三类。其中,1631条推文为正面,2507条为中性,1282条为负面。数据集文件包括:ltec-sentiment-annotated.json(包含人工标注情感的推文)、ltec-sentiment-annotated-test.json(用于论文的测试集)和ltec-sentiment-automatic.json(基于表情符号自动分配情感的推文)。推文结构包括情感、用户名、推文ID和推文文本。
该子语料库包含5420条带有情感标注的推文,情感分为正面(pos)、中性(neu)和负面(neg)三类。其中,1631条推文为正面,2507条为中性,1282条为负面。数据集文件包括:ltec-sentiment-annotated.json(包含人工标注情感的推文)、ltec-sentiment-annotated-test.json(用于论文的测试集)和ltec-sentiment-automatic.json(基于表情符号自动分配情感的推文)。推文结构包括情感、用户名、推文ID和推文文本。
提供机构:
matiss
原始信息汇总
Latvian Twitter Eater Corpus - Sentiment Analysis Sub-corpus 概述
数据集基本信息
- 许可证: MIT
- 任务类别: 文本分类
- 任务ID: 情感分类
- 语言: 拉脱维亚语
- 标签: 情感, 情感分析, 情感分类, 拉脱维亚语, Twitter, 社交媒体, 短文本
- 美观名称: Latvian Twitter Eater Corpus - Sentiment
- 大小类别: 1K<n<10K
数据集内容
- ltec-sentiment-annotated.json: 包含5420条经过人工标注情感的推文,其中1631条为正面情感,2507条为中性,1282条为负面。
- ltec-sentiment-annotated-test.json: 包含用于论文的测试集。
- ltec-sentiment-automatic.json: 包含根据表情符号自动分配情感的推文。
推文结构
json { "sentiment":"pos", "screen_name":"artisare", "tweet_id":221520985738846209, "tweet_text":"@mazheks Burgā ir brančs?!? Es jau sāku domāt ka uz Pērli jāmauc ēst pirms tam Illy paķerot kafiju. Cikos domā?" }
相关数据集
- Pinnis: ~ 7000 推文,来自政治家和企业
- Peisenieks: ~ 1000 一般推文,情感由多个注释者标注
- Vīksna: ~ 4000 一般推文
- Nicmanis: ~ 2000 一般推文
- Špats: ~ 6000 一般推文(小写)



