five

NEUDM/mams

收藏
Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NEUDM/mams
下载链接
链接失效反馈
官方服务:
资源简介:
> 上述数据集为ABSA(Aspect-Based Sentiment Analysis)领域数据集,基本形式为从句子中抽取:方面术语、方面类别(术语类别)、术语在上下文中情感极性以及针对该术语的观点词,不同数据集抽取不同的信息,这点在jsonl文件的“instruction”键中有分别提到,在此我将其改造为了生成任务,需要模型按照一定格式生成抽取结果。 #### 以acos数据集中抽取的jsonl文件一条数据举例: ``` { "task_type": "generation", "dataset": "acos", "input": ["the computer has difficulty switching between tablet and computer ."], "output": "[['computer', 'laptop usability', 'negative', 'difficulty']]", "situation": "none", "label": "", "extra": "", "instruction": " Task: Extracting aspect terms and their corresponding aspect categories, sentiment polarities, and opinion words. Input: A sentence Output: A list of 4-tuples, where each tuple contains the extracted aspect term, its aspect category, sentiment polarity, and opinion words (if any). Supplement: \"Null\" means that there is no occurrence in the sentence. Example: Sentence: \"Also it's not a true SSD drive in there but eMMC, which makes a difference.\" Output: [['SSD drive', 'hard_disc operation_performance', 'negative', 'NULL']]' " } ``` > 此处未设置label和extra,在instruction中以如上所示的字符串模板,并给出一个例子进行one-shot,ABSA领域数据集(absa-quad,acos,arts,aste-data-v2,mams,semeval-2014,semeval-2015,semeval-2016,towe)每个数据集对应instruction模板相同,内容有细微不同,且部分数据集存在同一数据集不同数据instruction内容不同的情况。 #### 原始数据集 - 数据[链接](https://github.com/siat-nlp/MAMS-for-ABSA) - Paper:[A Challenge Dataset and Effective Models for Aspect-Based Sentiment Analysis](https://aclanthology.org/D19-1654.pdf) - 说明:原始数据由MAMS-ACSA和MAMS-ATSA组成,两部分数据集为不同任务,抽取不同元素。 #### 当前SOTA *数据来自[PaperWithCode](https://paperswithcode.com/sota/aspect-based-sentiment-analysis-on-mams)* - 评价指标:Accuracy 、 Macro-F1 - 模型:RGAT+ (Accuracy: **84.52** , Macro-F1: **83.74**) - Paper:[Investigating Typed Syntactic Dependencies for Targeted Sentiment Classification Using Graph Attention Neural Network](https://paperswithcode.com/paper/exploiting-typed-syntactic-dependencies-for)
提供机构:
NEUDM
原始信息汇总

数据集概述

数据集类型

  • 领域:Aspect-Based Sentiment Analysis (ABSA)
  • 任务类型:Generation

数据集内容

  • 数据结构:每条数据包含以下字段:
    • task_type:任务类型,固定为"generation"。
    • dataset:数据集名称,如"acos"。
    • input:输入句子。
    • output:输出结果,格式为包含四个元素的列表,分别表示方面术语、方面类别、情感极性和观点词。
    • instruction:任务说明,包括任务描述、输入输出格式及示例。

数据集特点

  • 任务说明:从句子中抽取方面术语、方面类别、情感极性和观点词。
  • 输出格式:每个输出为一个四元组,包含方面术语、方面类别、情感极性和观点词。
  • 示例
    • 输入句子:"the computer has difficulty switching between tablet and computer ."
    • 输出:[[computer, laptop usability, negative, difficulty]]

原始数据集信息

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作