stanfordnlp/sentiment140|情感分析数据集|文本分类数据集
收藏数据集概述
数据集名称
- 名称: Sentiment140
- 配置名称: sentiment140
数据集特征
- 文本: 字符串类型
- 日期: 字符串类型
- 用户: 字符串类型
- 情感: 整数类型 (int32)
- 查询: 字符串类型
数据集分割
- 训练集: 1600000条记录
- 测试集: 498条记录
数据集大小
- 下载大小: 81.36 MB
- 数据集大小: 225.82 MB
训练与评估指标
- 任务: 文本分类
- 任务ID: multi_class_classification
- 训练分割: train
- 评估分割: test
- 列映射:
text
: 文本sentiment
: 目标
- 评估指标:
- 准确率 (Accuracy)
- F1 macro
- F1 micro
- F1 weighted
- 精确率 macro
- 精确率 micro
- 精确率 weighted
- 召回率 macro
- 召回率 micro
- 召回率 weighted
引用信息
@article{go2009twitter, title={Twitter sentiment classification using distant supervision}, author={Go, Alec and Bhayani, Richa and Huang, Lei}, journal={CS224N project report, Stanford}, volume={1}, number={12}, pages={2009}, year={2009} }
贡献者

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Apple Stock Price Data
Historical stock price data for AAPL (apple)
kaggle 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录