Number of grocery delivery services in Kazakhstan 2023, by city|电子商务数据集|杂货配送服务数据集
收藏Shanghai Stock Exchange Composite Index
该数据集包含上海证券交易所综合指数(上证综指)的历史数据,涵盖了指数的每日开盘价、收盘价、最高价、最低价以及成交量等信息。
www.sse.com.cn 收录
UniMed
UniMed是一个大规模、开源的多模态医学数据集,包含超过530万张图像-文本对,涵盖六种不同的医学成像模态:X射线、CT、MRI、超声、病理学和眼底。该数据集通过利用大型语言模型(LLMs)将特定模态的分类数据集转换为图像-文本格式,并结合现有的医学领域的图像-文本数据,以促进可扩展的视觉语言模型(VLM)预训练。
github 收录
CCNC
CCNC是一个包含365万姓名样本的大型中文姓名语料库,数据来源于姓名大全和中文人名语料库,经过处理和注音,用于中文姓名研究和实体识别。
github 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录
Digital Typhoon
Digital Typhoon数据集是由日本国立情报学研究所创建的,包含自1978年至2022年共44个台风季节的189,364张卫星图像。该数据集旨在为机器学习模型提供长期时空数据基准,特别适用于深度学习模型的分类和回归任务。数据集通过Lambert等面积投影技术处理,确保图像质量,并解决了传感器噪声、数据缺失和长期传感器校准等数据质量问题。该数据集的应用领域包括气象分析、社会影响评估和气候变化研究,旨在通过机器学习技术提升对台风活动的理解和预测,从而减少灾害风险和应对气候变化。
arXiv 收录