five

gulnuravci/reddit_sentiment_analysis_results

收藏
Hugging Face2024-07-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/gulnuravci/reddit_sentiment_analysis_results
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与Reddit子论坛相关的数据,主要涉及子论坛的数量、关键词过滤后的子论坛数量、自动包含的旧子论坛数量、通过模型的子论坛数量、与技术相关的子论坛总数、每个母公司包含的子论坛数量、提取帖子时失败的子论坛数量、每个母公司提取的评论数量、每个母公司的互动数量、每个母公司的中性、正面和负面情感数量、每个母公司的平均情感以及每个母公司提取的帖子数量。数据集仅包含一个训练集,共有13个样本,大小为21218字节。

该数据集包含与Reddit子论坛相关的数据,主要涉及子论坛的数量、关键词过滤后的子论坛数量、自动包含的旧子论坛数量、通过模型的子论坛数量、与技术相关的子论坛总数、每个母公司包含的子论坛数量、提取帖子时失败的子论坛数量、每个母公司提取的评论数量、每个母公司的互动数量、每个母公司的中性、正面和负面情感数量、每个母公司的平均情感以及每个母公司提取的帖子数量。数据集仅包含一个训练集,共有13个样本,大小为21218字节。
提供机构:
gulnuravci
原始信息汇总

数据集概述

数据集特征

  • Datetime:时间数据,数据类型为字符串。
  • Num subreddits with subsidiary/parent company name in its name or description:包含子公司或母公司名称的子版块数量,数据类型为整数。
  • Num subreddits after using keywords filter:使用关键词过滤后的子版块数量,数据类型为整数。
  • Num old subreddits that were automatically included:自动包含的老子版块数量,数据类型为整数。
  • Num subreddits that ran through the model:通过模型的子版块数量,数据类型为整数。
  • Total subreddits that are technology related (including old and new subreddits):与技术相关的子版块总数(包括新旧子版块),数据类型为整数。
  • Num subreddits that were included per parent company:每个母公司包含的子版块数量,数据类型为字符串。
  • Failed subreddits while extracting posts:在提取帖子时失败的子版块数量,数据类型为字符串。
  • Num of comments extracted for each parent company:每个母公司提取的评论数量,数据类型为字符串。
  • Num of interactions for each parent company:每个母公司的互动数量,数据类型为字符串。
  • Num of neutral sentiments for each parent company:每个母公司的中性情感数量,数据类型为字符串。
  • Num of positive sentiments for each parent company:每个母公司的积极情感数量,数据类型为字符串。
  • Num of negative sentiments for each parent company:每个母公司的消极情感数量,数据类型为字符串。
  • Average sentiment for each parent company:每个母公司的平均情感,数据类型为字符串。
  • Num of posts extracted for each parent company:每个母公司提取的帖子数量,数据类型为字符串。

数据集分割

  • train:训练集,包含9个示例,数据大小为14877字节。

数据集大小

  • 下载大小:25206字节。
  • 数据集大小:14877字节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作