five

xcz0/Aspect-Based_Sentiment_Analysis_for_Catering

收藏
Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xcz0/Aspect-Based_Sentiment_Analysis_for_Catering
下载链接
链接失效反馈
官方服务:
资源简介:
数据集来源于AI Challenger 2018,主要用于文本分类任务。数据集包含训练集、验证集、测试集A和测试集B四部分,总数据量在10M到100M之间。数据集中的评论数据按照评价对象的粒度分为两个层次:第一层为粗粒度的评价对象,如服务、位置等;第二层为细粒度的情感对象,如服务人员态度、排队等候时间等。每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及,分别用1, 0, -1, -2表示。

数据集来源于AI Challenger 2018,主要用于文本分类任务。数据集包含训练集、验证集、测试集A和测试集B四部分,总数据量在10M到100M之间。数据集中的评论数据按照评价对象的粒度分为两个层次:第一层为粗粒度的评价对象,如服务、位置等;第二层为细粒度的情感对象,如服务人员态度、排队等候时间等。每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及,分别用1, 0, -1, -2表示。
提供机构:
xcz0
原始信息汇总

数据集概述

数据集来源

数据集来源于AI Challenger 2018。

数据文件

  • sentiment_analysis_trainingset.csv:训练集数据文件,共105000条评论数据。
  • sentiment_analysis_validationset.csv:验证集数据文件,共15000条评论数据。
  • sentiment_analysis_testa.csv:测试集A数据文件,共15000条评论数据。

数据集划分

数据集分为训练、验证、测试A与测试B四部分。

评价对象划分

数据集中的评价对象按照粒度不同划分为两个层次:

  • 层次一:粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素。
  • 层次二:细粒度的情感对象,例如“服务”属性中的“服务人员态度”、“排队等候时间”等细粒度要素。

具体划分

层次一(The first layer) 层次二(The second layer)
位置(location) 交通是否便利(traffic convenience)
距离商圈远近(distance from business district)
是否容易寻找(easy to find)
服务(service) 排队等候时间(wait time)
服务人员态度(waiter’s attitude)
是否容易停车(parking convenience)
点菜/上菜速度(serving speed)
价格(price) 价格水平(price level)
性价比(cost-effective)
折扣力度(discount)
环境(environment) 装修情况(decoration)
嘈杂情况(noise)
就餐空间(space)
卫生情况(cleaness)
菜品(dish) 分量(portion)
口感(taste)
外观(look)
推荐程度(recommendation)
其他(others) 本次消费感受(overall experience)
再次消费的意愿(willing to consume again)

情感倾向标注

每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及。使用[1,0,-1,-2]四个值对情感倾向进行描述:

情感倾向值(Sentimental labels) 含义(Meaning)
1 正面情感(Positive)
0 中性情感(Neutral)
-1 负面情感(Negative)
-2 情感倾向未提及(Not mentioned)

数据标注示例

以下是一个标注示例:

味道不错的面馆,性价比也相当之高,分量很足~女生吃小份,胃口小的,可能吃不完呢,。环境在面馆来说算是好的,至少看上去堂子很亮,也比较干净,一般苍蝇馆子还是比不上这个卫生状况的。中午饭点的时候,人很多,人行道上也是要坐满的,隔壁的冒菜馆子,据说是一家,有时候也会开放出来坐吃面的人。

层次一(The first layer) 层次二(The second layer) 标注 (Label)
位置(location) 交通是否便利(traffic convenience) -2
距离商圈远近(distance from business district) -2
是否容易寻找(easy to find) -2
服务(service) 排队等候时间(wait time) -2
服务人员态度(waiter’s attitude) -2
是否容易停车(parking convenience) -2
点菜/上菜速度(serving speed) -2
价格(price) 价格水平(price level) -2
性价比(cost-effective) 1
折扣力度(discount) -2
环境(environment) 装修情况(decoration) 1
嘈杂情况(noise) -2
就餐空间(space) -2
卫生情况(cleaness) 1
菜品(dish) 分量(portion) 1
口感(taste) 1
外观(look) -2
推荐程度(recommendation) -2
其他(others) 本次消费感受(overall experience) 1
再次消费的意愿(willing to consume again) -2
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作