SilvioLima/absa
收藏Hugging Face2024-04-08 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/SilvioLima/absa
下载链接
链接失效反馈官方服务:
资源简介:
absa数据集是通过合并两个数据集(DMASTE和ASTE)生成的,主要用于基于方面的情感分析。数据集包含四个主要字段:source(来源)、domain(领域)、sentence(句子)和triples(三元组)。这些字段用于训练模型,以识别新句子中的方面、意见和情感极性。数据集被分为训练集、验证集和测试集,分别包含10810、1351和1352个样本。数据集的来源包括多个领域的产品和服务评价,如电子产品、时尚、家居等。
absa数据集是通过合并两个数据集(DMASTE和ASTE)生成的,主要用于基于方面的情感分析。数据集包含四个主要字段:source(来源)、domain(领域)、sentence(句子)和triples(三元组)。这些字段用于训练模型,以识别新句子中的方面、意见和情感极性。数据集被分为训练集、验证集和测试集,分别包含10810、1351和1352个样本。数据集的来源包括多个领域的产品和服务评价,如电子产品、时尚、家居等。
提供机构:
SilvioLima
原始信息汇总
数据集概述
数据集结构
数据字段
- source: 数据类型为字符串
- domain: 数据类型为字符串
- sentence: 数据类型为字符串
- triples: 数据类型为字符串
数据分割
- train: 包含10810个样本,总大小为3520964.114556353字节
- test: 包含1352个样本,总大小为440364.799526382字节
- valid: 包含1351个样本,总大小为440039.08591726486字节
数据集创建
源数据
- 源数据集:
- DMASTE: 包含8个领域的评价数据
- ASTE: 包含3个子集,每个子集包含餐厅和笔记本电脑的评价数据
源语言生产者
- 数据集由人工填写和审核



