five

NEUDM/absa-quad

收藏
Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NEUDM/absa-quad
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为ABSA(基于方面的情感分析)领域的数据集,主要任务是从句子中抽取方面术语、方面类别、情感极性以及观点词。数据集被改造为生成任务,要求模型按照特定格式生成抽取结果。数据集包含多个子数据集(如acos, arts, aste-data-v2等),每个子数据集都有相同的instruction模板,但内容有细微差异。数据集的语言为英语,大小在1K到10K之间。

该数据集为ABSA(基于方面的情感分析)领域的数据集,主要任务是从句子中抽取方面术语、方面类别、情感极性以及观点词。数据集被改造为生成任务,要求模型按照特定格式生成抽取结果。数据集包含多个子数据集(如acos, arts, aste-data-v2等),每个子数据集都有相同的instruction模板,但内容有细微差异。数据集的语言为英语,大小在1K到10K之间。
提供机构:
NEUDM
原始信息汇总

数据集概述

任务类别

  • 文本生成

语言

  • 英语

数据规模

  • 1K<n<10K

数据集描述

  • 该数据集属于ABSA(基于方面的情感分析)领域,主要用于从句子中抽取方面术语、方面类别、情感极性和观点词。数据集的“instruction”键中详细说明了不同数据集抽取的不同信息。

数据示例

  • 数据集:acos
  • 输入示例:["the computer has difficulty switching between tablet and computer ."]
  • 输出示例:[[computer, laptop usability, negative, difficulty]]
  • 任务说明:
    • 任务:抽取方面术语及其对应的方面类别、情感极性和观点词。
    • 输入:一个句子
    • 输出:一个包含4元组的列表,每个元组包含抽取的方面术语、其方面类别、情感极性和观点词(如果有)。
    • 补充说明:“Null”表示句子中没有出现相关内容。

原始数据集

  • 原始数据集由Rest15和Rest16两个文件夹的数据组成,本次改造将两个数据集的数据合并并区分为train、validation与test。

当前SOTA

  • 评价指标:F1 score
  • SOTA模型:E2H-large
    • Rest15上F1 Score:52.39
    • Rest16上F1 Score:61.86
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作