five

jordiclive/FABSA

收藏
Hugging Face2024-03-24 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/jordiclive/FABSA
下载链接
链接失效反馈
官方服务:
资源简介:
FABSA数据集是一个专注于客户反馈领域的基于方面的情感分析(ABSA)数据集,由Chattermill AI发布。该数据集适用于方面类别检测(ACD)和方面类别情感分类(ACSC),包含约10,500条评论,涵盖10个不同领域(如时尚、咨询、旅行预订等)。数据集采用多标签分类方案,每条评论可能涉及多个方面和情感极性(正面、负面、中性)。注释方案包括父类和子类方面类别,每个类别都有相关的情感标签。

FABSA数据集是一个专注于客户反馈领域的基于方面的情感分析(ABSA)数据集,由Chattermill AI发布。该数据集适用于方面类别检测(ACD)和方面类别情感分类(ACSC),包含约10,500条评论,涵盖10个不同领域(如时尚、咨询、旅行预订等)。数据集采用多标签分类方案,每条评论可能涉及多个方面和情感极性(正面、负面、中性)。注释方案包括父类和子类方面类别,每个类别都有相关的情感标签。
提供机构:
jordiclive
原始信息汇总

数据集概述

数据集特征

  • id: 整数类型
  • org_index: 整数类型
  • data_source: 字符串类型
  • industry: 字符串类型
  • text: 字符串类型
  • labels: 序列类型,包含字符串序列
  • label_codes: 字符串类型

数据集分割

  • 训练集: 7930个样本,存储大小为2599501.8469831664字节
  • 验证集: 1057个样本,存储大小为346490.977586533字节
  • 测试集: 1587个样本,存储大小为520228.17543030076字节

数据集大小

  • 下载大小: 1010316字节
  • 数据集总大小: 3466221.0字节

配置文件

  • 默认配置: 包含训练、验证和测试数据的路径配置

任务描述

  • Aspect Category Sentiment Analysis
  • Aspect Category Detection (ACD)
  • Aspect Category Sentiment Classification (ACSC)

预定义的Aspect Categories

  • 12个Aspect Categories,每个类别有对应的类别代码

注释方案

  • 采用层次化注释方案,包括父和子Aspect Categories
  • 每个Aspect Category关联一个情感标签(正、负、中)
  • 多标签分类方案,单个评论可包含多个Aspect + 情感标签

数据集发布

  • 包含约10,500条评论,覆盖10个领域
  • 旨在推动学术进展,提供大规模、多领域的ABSA数据集

引用信息

@article{KONTONATSIOS2023126867, title = {FABSA: An aspect-based sentiment analysis dataset of user reviews}, journal = {Neurocomputing}, volume = {562}, pages = {126867}, year = {2023}, issn = {0925-2312}, doi = {https://doi.org/10.1016/j.neucom.2023.126867}, url = {https://www.sciencedirect.com/science/article/pii/S0925231223009906}, author = {Georgios Kontonatsios and Jordan Clive and Georgia Harrison and Thomas Metcalfe and Patrycja Sliwiak and Hassan Tahir and Aji Ghose}, keywords = {ABSA, Multi-domain dataset, Deep learning}, }

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作