CanariaView/GlobalCopperDemandForecastingDataset|铜需求预测数据集|时间序列分析数据集
收藏CanariaView Global Copper Demand Forecasting Dataset
描述
该数据集包含构建铜需求预测模型所需的关键经济和工业指标。
覆盖期间:从1995年1月至2023年3月的月度数据,共339个月。
列描述和来源:
HSI_value (美国住房开工指数)
:Y-ChartCCI_value (消费者信心指数)
:OECDIPI_value (工业生产总指数)
:FREDGDPC_value (实际国内生产总值)
:FREDCopper price (铜价)
:MacroTrends
预处理方法和数据收集细节:
- 对数据结构进行全面分析后进行必要的预处理。
- 适当处理缺失值。
- 将每日和季度数据统一扩展到月度时间尺度以保持一致性。
- 每日数据(例如,铜价)和季度数据(例如,GDPC_value)
- 模型中使用的因变量数据从1995年开始可用,指导从该年开始收集自变量数据。
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
红外谱图数据库
收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。
国家基础学科公共科学数据中心 收录