ABSA-datasets|情感分析数据集|数据集标准化数据集
收藏数据集概述
目标
- 收集所有Aspect-Based Sentiment Analysis (ABSA) 数据集。
- 提供统一的接口以读取这些数据集。
- 为大多数没有官方训练和开发分割的ABSA数据集提供标准分割。
支持的数据集
- SemEval-2014 Task 4
- SemEval-2014-Task-4-LAPT
- SemEval-2014-Task-4-REST
- SemEval-2015 Task 12
- SemEval-2015-Task-12-LAPT
- SemEval-2015-Task-12-REST
- SemEval-2015-Task-12-HOTEL
- SemEval-2016 Task 5
- SemEval-2016-Task-5-CH-CAME-SB1
- SemEval-2016-Task-5-CH-PHNS-SB1
- SemEval-2016-Task-5-LAPT-SB1
- SemEval-2016-Task-5-LAPT-SB2
- SemEval-2016-Task-5-REST-SB1
- SemEval-2016-Task-5-REST-SB2
- bdci2019
- bdci2019-internet-news-sa
- bdci2019-financial-negative
- A Challenge Dataset and Effective Models for Aspect-Based Sentiment Analysis
- MAMSACSA
- MAMSATSA
- nlpcc2012
- nlpcc2012-weibo-sa
使用示例
Python from data_adapter.data_object import get_dataset_class_by_name
dataset_name = SemEval-2014-Task-4-REST dataset = get_dataset_class_by_name(dataset_name)()

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录