财经新闻情感分类数据集|财经新闻数据集|情感分析数据集
收藏财经新闻情感分类数据集概述
数据集描述
本数据集专为财经新闻情感分类的深度学习模型训练而设计。原始数据来源于雪球网上万得资讯发布的正负面新闻标题,通过爬虫技术采集得到7046条新闻标题,其中正面新闻5147条,负面新闻1899条。为增加数据量,采用了搜索引擎搜索和筛选的方式进行数据扩充。
数据集内容
数据集共包含17149条新闻数据,每条数据包含以下字段:
- 日期
- 公司
- 代码
- 正/负面
- 标题
- 正文 其中,正面新闻12514条,负面新闻4635条。
文件组成
news_seed.xlsx
: 种子数据集,包含7046条新闻标题。train_data.csv
: 用于训练的数据集。test_data.csv
: 用于测试的数据集。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
reereererreereererreereererreereererreereererreereererreereererreereererreereererreereererreereererreereerer
阿里云天池 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录