NEUDM/absa-quad
收藏Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NEUDM/absa-quad
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为ABSA(基于方面的情感分析)领域的数据集,主要任务是从句子中抽取方面术语、方面类别、情感极性以及观点词。数据集被改造为生成任务,要求模型按照特定格式生成抽取结果。数据集包含多个子数据集(如acos, arts, aste-data-v2等),每个子数据集都有相同的instruction模板,但内容有细微差异。数据集的语言为英语,大小在1K到10K之间。
该数据集为ABSA(基于方面的情感分析)领域的数据集,主要任务是从句子中抽取方面术语、方面类别、情感极性以及观点词。数据集被改造为生成任务,要求模型按照特定格式生成抽取结果。数据集包含多个子数据集(如acos, arts, aste-data-v2等),每个子数据集都有相同的instruction模板,但内容有细微差异。数据集的语言为英语,大小在1K到10K之间。
提供机构:
NEUDM
原始信息汇总
数据集概述
任务类别
- 文本生成
语言
- 英语
数据规模
- 1K<n<10K
数据集描述
- 该数据集属于ABSA(基于方面的情感分析)领域,主要用于从句子中抽取方面术语、方面类别、情感极性和观点词。数据集的“instruction”键中详细说明了不同数据集抽取的不同信息。
数据示例
- 数据集:acos
- 输入示例:["the computer has difficulty switching between tablet and computer ."]
- 输出示例:[[computer, laptop usability, negative, difficulty]]
- 任务说明:
- 任务:抽取方面术语及其对应的方面类别、情感极性和观点词。
- 输入:一个句子
- 输出:一个包含4元组的列表,每个元组包含抽取的方面术语、其方面类别、情感极性和观点词(如果有)。
- 补充说明:“Null”表示句子中没有出现相关内容。
原始数据集
- 原始数据集由Rest15和Rest16两个文件夹的数据组成,本次改造将两个数据集的数据合并并区分为train、validation与test。
当前SOTA
- 评价指标:F1 score
- SOTA模型:E2H-large
- Rest15上F1 Score:52.39
- Rest16上F1 Score:61.86



