gulnuravci/reddit_sentiment_analysis_results
收藏Hugging Face2024-07-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/gulnuravci/reddit_sentiment_analysis_results
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与Reddit子论坛相关的数据,主要涉及子论坛的数量、关键词过滤后的子论坛数量、自动包含的旧子论坛数量、通过模型的子论坛数量、与技术相关的子论坛总数、每个母公司包含的子论坛数量、提取帖子时失败的子论坛数量、每个母公司提取的评论数量、每个母公司的互动数量、每个母公司的中性、正面和负面情感数量、每个母公司的平均情感以及每个母公司提取的帖子数量。数据集仅包含一个训练集,共有13个样本,大小为21218字节。
该数据集包含与Reddit子论坛相关的数据,主要涉及子论坛的数量、关键词过滤后的子论坛数量、自动包含的旧子论坛数量、通过模型的子论坛数量、与技术相关的子论坛总数、每个母公司包含的子论坛数量、提取帖子时失败的子论坛数量、每个母公司提取的评论数量、每个母公司的互动数量、每个母公司的中性、正面和负面情感数量、每个母公司的平均情感以及每个母公司提取的帖子数量。数据集仅包含一个训练集,共有13个样本,大小为21218字节。
提供机构:
gulnuravci
原始信息汇总
数据集概述
数据集特征
- Datetime:时间数据,数据类型为字符串。
- Num subreddits with subsidiary/parent company name in its name or description:包含子公司或母公司名称的子版块数量,数据类型为整数。
- Num subreddits after using keywords filter:使用关键词过滤后的子版块数量,数据类型为整数。
- Num old subreddits that were automatically included:自动包含的老子版块数量,数据类型为整数。
- Num subreddits that ran through the model:通过模型的子版块数量,数据类型为整数。
- Total subreddits that are technology related (including old and new subreddits):与技术相关的子版块总数(包括新旧子版块),数据类型为整数。
- Num subreddits that were included per parent company:每个母公司包含的子版块数量,数据类型为字符串。
- Failed subreddits while extracting posts:在提取帖子时失败的子版块数量,数据类型为字符串。
- Num of comments extracted for each parent company:每个母公司提取的评论数量,数据类型为字符串。
- Num of interactions for each parent company:每个母公司的互动数量,数据类型为字符串。
- Num of neutral sentiments for each parent company:每个母公司的中性情感数量,数据类型为字符串。
- Num of positive sentiments for each parent company:每个母公司的积极情感数量,数据类型为字符串。
- Num of negative sentiments for each parent company:每个母公司的消极情感数量,数据类型为字符串。
- Average sentiment for each parent company:每个母公司的平均情感,数据类型为字符串。
- Num of posts extracted for each parent company:每个母公司提取的帖子数量,数据类型为字符串。
数据集分割
- train:训练集,包含9个示例,数据大小为14877字节。
数据集大小
- 下载大小:25206字节。
- 数据集大小:14877字节。



