jordiclive/FABSA
收藏Hugging Face2024-03-24 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/jordiclive/FABSA
下载链接
链接失效反馈官方服务:
资源简介:
FABSA数据集是一个专注于客户反馈领域的基于方面的情感分析(ABSA)数据集,由Chattermill AI发布。该数据集适用于方面类别检测(ACD)和方面类别情感分类(ACSC),包含约10,500条评论,涵盖10个不同领域(如时尚、咨询、旅行预订等)。数据集采用多标签分类方案,每条评论可能涉及多个方面和情感极性(正面、负面、中性)。注释方案包括父类和子类方面类别,每个类别都有相关的情感标签。
FABSA数据集是一个专注于客户反馈领域的基于方面的情感分析(ABSA)数据集,由Chattermill AI发布。该数据集适用于方面类别检测(ACD)和方面类别情感分类(ACSC),包含约10,500条评论,涵盖10个不同领域(如时尚、咨询、旅行预订等)。数据集采用多标签分类方案,每条评论可能涉及多个方面和情感极性(正面、负面、中性)。注释方案包括父类和子类方面类别,每个类别都有相关的情感标签。
提供机构:
jordiclive
原始信息汇总
数据集概述
数据集特征
- id: 整数类型
- org_index: 整数类型
- data_source: 字符串类型
- industry: 字符串类型
- text: 字符串类型
- labels: 序列类型,包含字符串序列
- label_codes: 字符串类型
数据集分割
- 训练集: 7930个样本,存储大小为2599501.8469831664字节
- 验证集: 1057个样本,存储大小为346490.977586533字节
- 测试集: 1587个样本,存储大小为520228.17543030076字节
数据集大小
- 下载大小: 1010316字节
- 数据集总大小: 3466221.0字节
配置文件
- 默认配置: 包含训练、验证和测试数据的路径配置
任务描述
- Aspect Category Sentiment Analysis
- Aspect Category Detection (ACD)
- Aspect Category Sentiment Classification (ACSC)
预定义的Aspect Categories
- 12个Aspect Categories,每个类别有对应的类别代码
注释方案
- 采用层次化注释方案,包括父和子Aspect Categories
- 每个Aspect Category关联一个情感标签(正、负、中)
- 多标签分类方案,单个评论可包含多个Aspect + 情感标签
数据集发布
- 包含约10,500条评论,覆盖10个领域
- 旨在推动学术进展,提供大规模、多领域的ABSA数据集
引用信息
@article{KONTONATSIOS2023126867, title = {FABSA: An aspect-based sentiment analysis dataset of user reviews}, journal = {Neurocomputing}, volume = {562}, pages = {126867}, year = {2023}, issn = {0925-2312}, doi = {https://doi.org/10.1016/j.neucom.2023.126867}, url = {https://www.sciencedirect.com/science/article/pii/S0925231223009906}, author = {Georgios Kontonatsios and Jordan Clive and Georgia Harrison and Thomas Metcalfe and Patrycja Sliwiak and Hassan Tahir and Aji Ghose}, keywords = {ABSA, Multi-domain dataset, Deep learning}, }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



