five

Chinese Esports Video's Danmaku Comments Entity-Level Sentiment Analysis Dataset

收藏
DataCite Commons2025-04-27 更新2025-04-16 收录
下载链接:
https://www.scidb.cn/detail?dataSetId=1badf91b7d774ecd88c8811855d2501f
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset is a Chinese entity level sentiment analysis dataset, containing 124574 Chinese esports bullet comments crawled from the 2023 League of Legends professional league and mid season invitational match videos on the Bilibili bullet screen video website. After data cleaning, 14272 raw data were obtained, which were divided into training and testing sets in an 8:2 ratio. This dataset also ensures that under the same polarity distribution, 80%, 60%, 40%, and 20% of the data are selected for downsampling processing.

本数据集为中文实体级情感分析数据集(Chinese entity level sentiment analysis dataset),包含从哔哩哔哩(Bilibili)弹幕视频网站爬取的、源自2023年英雄联盟职业联赛与季中冠军赛(Mid-Season Invitational)赛事视频的124574条中文电竞弹幕。经数据清洗后,共得到14272条有效原始数据,并以8:2的比例划分为训练集与测试集。本数据集还保障在相同情感极性分布的前提下,分别选取80%、60%、40%与20%的数据进行下采样处理。
提供机构:
Science Data Bank
创建时间:
2024-01-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个中文实体级情感分析数据集,专门针对电子竞技领域,包含从Bilibili平台2023年英雄联盟职业联赛和季中邀请赛视频爬取的124574条弹幕评论,经过清洗后得到14272条数据,并划分为训练集和测试集。其特点在于支持按相同极性分布进行不同比例的下采样处理,适用于情感分析模型的研究和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作