xcz0/Aspect-Based_Sentiment_Analysis_for_Catering
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xcz0/Aspect-Based_Sentiment_Analysis_for_Catering
下载链接
链接失效反馈官方服务:
资源简介:
数据集来源于AI Challenger 2018,主要用于文本分类任务。数据集包含训练集、验证集、测试集A和测试集B四部分,总数据量在10M到100M之间。数据集中的评论数据按照评价对象的粒度分为两个层次:第一层为粗粒度的评价对象,如服务、位置等;第二层为细粒度的情感对象,如服务人员态度、排队等候时间等。每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及,分别用1, 0, -1, -2表示。
数据集来源于AI Challenger 2018,主要用于文本分类任务。数据集包含训练集、验证集、测试集A和测试集B四部分,总数据量在10M到100M之间。数据集中的评论数据按照评价对象的粒度分为两个层次:第一层为粗粒度的评价对象,如服务、位置等;第二层为细粒度的情感对象,如服务人员态度、排队等候时间等。每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及,分别用1, 0, -1, -2表示。
提供机构:
xcz0
原始信息汇总
数据集概述
数据集来源
数据集来源于AI Challenger 2018。
数据文件
sentiment_analysis_trainingset.csv:训练集数据文件,共105000条评论数据。sentiment_analysis_validationset.csv:验证集数据文件,共15000条评论数据。sentiment_analysis_testa.csv:测试集A数据文件,共15000条评论数据。
数据集划分
数据集分为训练、验证、测试A与测试B四部分。
评价对象划分
数据集中的评价对象按照粒度不同划分为两个层次:
- 层次一:粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素。
- 层次二:细粒度的情感对象,例如“服务”属性中的“服务人员态度”、“排队等候时间”等细粒度要素。
具体划分
| 层次一(The first layer) | 层次二(The second layer) |
|---|---|
| 位置(location) | 交通是否便利(traffic convenience) |
| 距离商圈远近(distance from business district) | |
| 是否容易寻找(easy to find) | |
| 服务(service) | 排队等候时间(wait time) |
| 服务人员态度(waiter’s attitude) | |
| 是否容易停车(parking convenience) | |
| 点菜/上菜速度(serving speed) | |
| 价格(price) | 价格水平(price level) |
| 性价比(cost-effective) | |
| 折扣力度(discount) | |
| 环境(environment) | 装修情况(decoration) |
| 嘈杂情况(noise) | |
| 就餐空间(space) | |
| 卫生情况(cleaness) | |
| 菜品(dish) | 分量(portion) |
| 口感(taste) | |
| 外观(look) | |
| 推荐程度(recommendation) | |
| 其他(others) | 本次消费感受(overall experience) |
| 再次消费的意愿(willing to consume again) |
情感倾向标注
每个细粒度要素的情感倾向有四种状态:正向、中性、负向、未提及。使用[1,0,-1,-2]四个值对情感倾向进行描述:
| 情感倾向值(Sentimental labels) | 含义(Meaning) |
|---|---|
| 1 | 正面情感(Positive) |
| 0 | 中性情感(Neutral) |
| -1 | 负面情感(Negative) |
| -2 | 情感倾向未提及(Not mentioned) |
数据标注示例
以下是一个标注示例:
味道不错的面馆,性价比也相当之高,分量很足~女生吃小份,胃口小的,可能吃不完呢,。环境在面馆来说算是好的,至少看上去堂子很亮,也比较干净,一般苍蝇馆子还是比不上这个卫生状况的。中午饭点的时候,人很多,人行道上也是要坐满的,隔壁的冒菜馆子,据说是一家,有时候也会开放出来坐吃面的人。
| 层次一(The first layer) | 层次二(The second layer) | 标注 (Label) |
|---|---|---|
| 位置(location) | 交通是否便利(traffic convenience) | -2 |
| 距离商圈远近(distance from business district) | -2 | |
| 是否容易寻找(easy to find) | -2 | |
| 服务(service) | 排队等候时间(wait time) | -2 |
| 服务人员态度(waiter’s attitude) | -2 | |
| 是否容易停车(parking convenience) | -2 | |
| 点菜/上菜速度(serving speed) | -2 | |
| 价格(price) | 价格水平(price level) | -2 |
| 性价比(cost-effective) | 1 | |
| 折扣力度(discount) | -2 | |
| 环境(environment) | 装修情况(decoration) | 1 |
| 嘈杂情况(noise) | -2 | |
| 就餐空间(space) | -2 | |
| 卫生情况(cleaness) | 1 | |
| 菜品(dish) | 分量(portion) | 1 |
| 口感(taste) | 1 | |
| 外观(look) | -2 | |
| 推荐程度(recommendation) | -2 | |
| 其他(others) | 本次消费感受(overall experience) | 1 |
| 再次消费的意愿(willing to consume again) | -2 |



