five

matiss/Latvian-Twitter-Eater-Corpus-Sentiment

收藏
Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/matiss/Latvian-Twitter-Eater-Corpus-Sentiment
下载链接
链接失效反馈
官方服务:
资源简介:
该子语料库包含5420条带有情感标注的推文,情感分为正面(pos)、中性(neu)和负面(neg)三类。其中,1631条推文为正面,2507条为中性,1282条为负面。数据集文件包括:ltec-sentiment-annotated.json(包含人工标注情感的推文)、ltec-sentiment-annotated-test.json(用于论文的测试集)和ltec-sentiment-automatic.json(基于表情符号自动分配情感的推文)。推文结构包括情感、用户名、推文ID和推文文本。

该子语料库包含5420条带有情感标注的推文,情感分为正面(pos)、中性(neu)和负面(neg)三类。其中,1631条推文为正面,2507条为中性,1282条为负面。数据集文件包括:ltec-sentiment-annotated.json(包含人工标注情感的推文)、ltec-sentiment-annotated-test.json(用于论文的测试集)和ltec-sentiment-automatic.json(基于表情符号自动分配情感的推文)。推文结构包括情感、用户名、推文ID和推文文本。
提供机构:
matiss
原始信息汇总

Latvian Twitter Eater Corpus - Sentiment Analysis Sub-corpus 概述

数据集基本信息

  • 许可证: MIT
  • 任务类别: 文本分类
  • 任务ID: 情感分类
  • 语言: 拉脱维亚语
  • 标签: 情感, 情感分析, 情感分类, 拉脱维亚语, Twitter, 社交媒体, 短文本
  • 美观名称: Latvian Twitter Eater Corpus - Sentiment
  • 大小类别: 1K<n<10K

数据集内容

  • ltec-sentiment-annotated.json: 包含5420条经过人工标注情感的推文,其中1631条为正面情感,2507条为中性,1282条为负面。
  • ltec-sentiment-annotated-test.json: 包含用于论文的测试集。
  • ltec-sentiment-automatic.json: 包含根据表情符号自动分配情感的推文。

推文结构

json { "sentiment":"pos", "screen_name":"artisare", "tweet_id":221520985738846209, "tweet_text":"@mazheks Burgā ir brančs?!? Es jau sāku domāt ka uz Pērli jāmauc ēst pirms tam Illy paķerot kafiju. Cikos domā?" }

相关数据集

  • Pinnis: ~ 7000 推文,来自政治家和企业
  • Peisenieks: ~ 1000 一般推文,情感由多个注释者标注
  • Vīksna: ~ 4000 一般推文
  • Nicmanis: ~ 2000 一般推文
  • Špats: ~ 6000 一般推文(小写)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作