johannssky/mica-commands
收藏数据集概述
许可协议
- 本数据集遵循Apache-2.0许可协议。
支持语言
- 数据集支持以下两种语言:
- 他加禄语 (tl)
- 英语 (en)
N-MNIST (Neuromorphic-MNIST)
简要说明 Neuromorphic-MNIST (N-MNIST) 数据集是原始基于帧的 MNIST 数据集的尖峰版本。它由与原始 MNIST 数据集相同的 60 000 个训练样本和 10 000 个测试样本组成,并以与原始 MNIST 数据集(28x28 像素)相同的视觉比例捕获。 N-MNIST 数据集是通过将 ATIS 传感器安装在电动云台装置上并让传感器在 LCD 监视器上查看 MNIST 示例时移动来捕获的,如本视频所示。可以在下面的论文中找到对数据集及其创建方式的完整描述。如果您使用数据集,请引用本文。果园,G。科恩,G。贾亚万特,A。和 Thakor, N. “Converting Static Image Datasets to Spiking Neuromorphic Datasets Using Saccades”,《神经科学前沿》,第 9 卷,第 437 期,2015 年 10 月
OpenDataLab 收录
基于OFES数据计算台湾以东逐月位涡(1993-2017)
基于1993-2017年间OFES高分辨率模式数据集中的温度和盐度数据计算的台湾以东位势涡度逐月三维分布。所使用OFES数据为开源数据。
国家海洋科学数据中心 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
TPTP
TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。
www.tptp.org 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
