AlexSham/yelp_filtered
收藏Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/AlexSham/yelp_filtered
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从产品、电影和餐厅评论中提取的带有正面或负面情感标签的句子。每个句子都有一个分数,1表示正面,0表示负面。句子来源于三个不同的网站/领域:imdb.com、amazon.com和yelp.com。每个网站有500个正面和500个负面句子,这些句子是从更大的评论数据集中随机选择的,目的是选择具有明显正面或负面含义的句子,避免选择中性句子。
该数据集包含从产品、电影和餐厅评论中提取的带有正面或负面情感标签的句子。每个句子都有一个分数,1表示正面,0表示负面。句子来源于三个不同的网站/领域:imdb.com、amazon.com和yelp.com。每个网站有500个正面和500个负面句子,这些句子是从更大的评论数据集中随机选择的,目的是选择具有明显正面或负面含义的句子,避免选择中性句子。
提供机构:
AlexSham
原始信息汇总
数据集概述
数据集来源
- 名称: Sentiment Labelled Sentences
- 链接: UCI 数据集仓库
数据内容
- 类型: 情感标记的句子
- 来源: 产品、电影和餐厅的评论
- 标签: 每个句子标记为正面(1)或负面(0)
数据格式
- 结构: 每行包含一个句子及其对应的情感分数,格式为
sentence score
数据详情
- 情感分类: 正面(1)和负面(0)
- 数据源:
- imdb.com: 500 正面句子和 500 负面句子
- amazon.com: 500 正面句子和 500 负面句子
- yelp.com: 500 正面句子和 500 负面句子
- 选择标准: 选择具有明确正面或负面含义的句子,避免中性句子
相关研究
- imdb: Maas et. al., 2011 Learning word vectors for sentiment analysis
- amazon: McAuley et. al., 2013 Hidden factors and hidden topics: Understanding rating dimensions with review text
- yelp: Yelp dataset challenge http://www.yelp.com/dataset_challenge



