five

AlexSham/yelp_filtered

收藏
Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/AlexSham/yelp_filtered
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从产品、电影和餐厅评论中提取的带有正面或负面情感标签的句子。每个句子都有一个分数,1表示正面,0表示负面。句子来源于三个不同的网站/领域:imdb.com、amazon.com和yelp.com。每个网站有500个正面和500个负面句子,这些句子是从更大的评论数据集中随机选择的,目的是选择具有明显正面或负面含义的句子,避免选择中性句子。

该数据集包含从产品、电影和餐厅评论中提取的带有正面或负面情感标签的句子。每个句子都有一个分数,1表示正面,0表示负面。句子来源于三个不同的网站/领域:imdb.com、amazon.com和yelp.com。每个网站有500个正面和500个负面句子,这些句子是从更大的评论数据集中随机选择的,目的是选择具有明显正面或负面含义的句子,避免选择中性句子。
提供机构:
AlexSham
原始信息汇总

数据集概述

数据集来源

数据内容

  • 类型: 情感标记的句子
  • 来源: 产品、电影和餐厅的评论
  • 标签: 每个句子标记为正面(1)或负面(0)

数据格式

  • 结构: 每行包含一个句子及其对应的情感分数,格式为 sentence score

数据详情

  • 情感分类: 正面(1)和负面(0)
  • 数据源:
    • imdb.com: 500 正面句子和 500 负面句子
    • amazon.com: 500 正面句子和 500 负面句子
    • yelp.com: 500 正面句子和 500 负面句子
  • 选择标准: 选择具有明确正面或负面含义的句子,避免中性句子

相关研究

  • imdb: Maas et. al., 2011 Learning word vectors for sentiment analysis
  • amazon: McAuley et. al., 2013 Hidden factors and hidden topics: Understanding rating dimensions with review text
  • yelp: Yelp dataset challenge http://www.yelp.com/dataset_challenge
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作