five

Weibo-Emotion-Corpus|情感分析数据集|社交媒体数据集

收藏
github2023-06-20 更新2024-05-31 收录
情感分析
社交媒体
下载链接:
https://github.com/Wenjun-Hou/Weibo-Emotion-Corpus
下载链接
链接失效反馈
资源简介:
一个包含多用户结构的中文微博情感原因语料库,用于支持论文An Emotion Cause Corpus for Chinese Microblogs with Multiple-User Structures的研究。

本语料库汇集了包含多用户结构的中文微博情感原因文本,旨在为研究论文《An Emotion Cause Corpus for Chinese Microblogs with Multiple-User Structures》提供数据支撑。
创建时间:
2019-12-10
原始信息汇总

Weibo-Emotion-Corpus 概述

数据集描述

  • 名称: Weibo-Emotion-Corpus
  • 来源: 该数据集用于支持论文 "An Emotion Cause Corpus for Chinese Microblogs with Multiple-User Structures"。

论文信息

  • 标题: An Emotion Cause Corpus for Chinese Microblogs with Multiple-User Structures
  • 作者: Cheng, Xiyao; Chen, Ying; Cheng, Bixiao; Li, Shoushan; Zhou, Guodong
  • 发表期刊: ACM Trans. Asian Low-Resour. Lang. Inf. Process.
  • 发表时间: November 2017
  • 卷号: 17
  • 期号: 1
  • 页码: 6:1--6:19
  • 文章编号: 6
  • 关键词: Emotion cause annotation, emotion cause corpus, emotion cause detection

数据集用途

  • 用于研究中文微博中的情感原因及其在多用户结构中的表现。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Weibo-Emotion-Corpus数据集的构建基于中文微博平台,旨在研究多用户结构下的情感原因标注。研究者从微博中收集了大量用户生成内容,并通过人工标注的方式,对每条微博的情感及其原因进行了详细标注。标注过程中,特别关注了情感表达的多样性和复杂性,确保数据集能够全面反映真实社交环境中的情感动态。
使用方法
Weibo-Emotion-Corpus数据集适用于情感原因检测、情感分析以及社交网络情感动态研究。研究者可以通过该数据集训练和测试情感原因检测模型,分析微博用户的情感表达模式。使用该数据集时,建议结合自然语言处理技术,如情感分类和文本挖掘,以充分利用其丰富的标注信息。此外,数据集的多用户结构也为研究社交网络中的情感传播提供了独特视角。
背景与挑战
背景概述
Weibo-Emotion-Corpus数据集由Xiyao Cheng等人于2017年创建,旨在为中文微博中的情感原因分析提供高质量的数据支持。该数据集由多个用户结构组成,涵盖了丰富的情感表达及其背后的原因,为情感计算和自然语言处理领域的研究提供了重要的资源。该数据集的研究背景源于对社交媒体中情感表达的深入理解,特别是在中文语境下,情感原因的识别与分析具有独特的挑战。通过构建这一数据集,研究人员能够更好地探索情感与语言结构之间的关系,推动了情感计算领域的发展。
当前挑战
Weibo-Emotion-Corpus数据集在构建过程中面临了多方面的挑战。首先,情感原因的标注需要高度的语义理解,尤其是在中文微博中,情感表达往往隐含在复杂的语言结构中,这对标注者的语言能力和情感理解提出了较高要求。其次,微博文本的多样性和非正式性增加了数据清洗和标注的难度,如何准确捕捉情感原因成为一大挑战。此外,数据集的构建还需要考虑用户结构的多样性,确保数据能够反映真实社交场景中的情感动态。这些挑战不仅影响了数据集的构建过程,也对后续的情感原因检测算法提出了更高的要求。
常用场景
经典使用场景
Weibo-Emotion-Corpus数据集在情感计算领域具有重要应用,尤其是在中文微博情感分析中。该数据集通过标注微博文本中的情感及其原因,为研究者提供了一个丰富的资源,用于训练和测试情感分析模型。其经典使用场景包括情感原因检测、情感分类以及情感与文本内容的关联分析。
解决学术问题
Weibo-Emotion-Corpus数据集解决了情感计算领域中的关键问题,即情感原因的识别与标注。传统的情感分析模型往往仅关注情感的分类,而忽略了情感产生的原因。该数据集通过提供详细的情感原因标注,使得研究者能够深入探讨情感与文本内容之间的因果关系,从而推动了情感原因检测技术的发展。
实际应用
在实际应用中,Weibo-Emotion-Corpus数据集被广泛用于社交媒体监控、舆情分析以及用户行为研究。例如,企业可以通过分析微博用户的情感及其原因,了解消费者对产品或服务的真实反馈,从而优化营销策略。此外,政府部门也可以利用该数据集进行舆情监控,及时发现并应对社会热点问题。
数据集最近研究
最新研究方向
在情感计算领域,Weibo-Emotion-Corpus数据集为研究者提供了丰富的微博情感及其成因的标注数据。近年来,随着社交媒体数据的爆炸性增长,情感分析技术逐渐成为自然语言处理中的热点。该数据集不仅支持情感分类任务,还特别关注情感成因的检测,为理解用户情感背后的深层次原因提供了可能。研究者们利用这一数据集,探索了基于深度学习的情感成因识别模型,这些模型在处理复杂多变的社交媒体语言时表现出色。此外,该数据集还被用于跨语言情感分析研究,促进了中文与其他语言在情感表达上的对比分析,为全球情感计算研究提供了重要参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

Titanic Dataset

Titanic Data Analysis: A Journey into Passenger Profiles and Survival Dynamics

kaggle 收录