Byrd-ICP Data|古气候学数据集|冰芯研究数据集
收藏Byrd-ICP Data App 数据集概述
数据集目的
本数据集旨在加速获取Byrd Polar & Climate Research Center的Ice Core Paleoclimatology Group(Byrd-ICP)的冰芯数据。数据可通过NOAA NCEI Paleo Data Search网页获取,需选择“Ice Cores”数据类型,并指定“Mosley-Thompson, E.”和“Thompson, L.G.”为研究者。
数据集内容
数据集包含多个冰芯数据,如Elbrus冰芯和Guliya高原冰芯的41,000年数据。数据以Excel文件形式存储,可通过Zenodo平台下载。
数据集更新历史
- 2023年12月18日:更新至版本2.3,新增Elbrus冰芯和Guliya高原冰芯数据导入功能,增加额外的绘图能力。
- 2023年10月10日:更新至版本2.2,更新数据仓库,修复地理轴上冰芯位置的绘图问题。
- 2023年10月9日:更新至版本2.0,移除废弃功能。
数据集使用方法
Byrd-ICP Data App是一个交互式MATLAB GUI,允许用户无需编写代码即可使用数据集功能。通过MATLAB命令行调用ByrdApp
函数即可启动应用。
数据集操作指南
- 从“Choose a core”下拉菜单选择冰芯。
- “Choose dataset”下拉菜单将自动填充。
- 点击“Import”按钮从Zenodo仓库导入数据。
- 数据集的原始引用将在“Original reference”文本区域显示。
- 数据自动在可排序表格中显示。
- 冰芯的纬度、经度和海拔将在“Location”文本区域显示。
- 使用“Save as...”按钮保存数据为
.csv
,.xlsx
, 或.txt
文件。 - 使用“Map View”按钮查看冰芯位置。
- 选择
X-Data
,Y-Data
, 和Chart Style
下拉菜单中的参数进行数据绘图。 - 使用“Plot”按钮在显示区域可视化参数。
- 使用“Clear”按钮清除显示区域。
- 使用“Save as...”按钮保存绘图为
.jpeg
,.png
, 或.tif
文件。
数据集函数文档
readICP
: 从Byrd-ICP组导入冰芯数据集为表格。ICP_get_dataset_names
: 生成指定冰芯站点数据集名称的单元数组。ICPmapshow
: 显示Byrd-ICP组收集的所有冰芯站点位置。
参考文献
- Lindsey Davidge, Hanna L. Brooks, & Merlin L. Mah. (2022). Global ice drilling and archive location data for select ice cores (1.0.1) [Dataset]. Zenodo.
- Weber, Austin M. (2023). Byrd Polar and Climate Research Center Ice Core Paleoclimatology Datasets in a Standardized Excel Format (1.1.0) [Data set]. Zenodo.

Awesome JSON Datasets
一个精选的无需认证的JSON数据集列表。
github 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
CIFAR-10
CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。
OpenDataLab 收录
中国高分辨率高质量PM2.5数据集(2000-2023)
ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。
国家青藏高原科学数据中心 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录