深圳市财政局-卫生健康支出信息|政府财政支出数据集|卫生健康数据集
收藏PRBench
PRBench是一个大规模专家标注的专业领域高风险推理基准测试数据集,当前版本覆盖法律和金融领域。包含1,100个专家编写的跨金融和法律领域的对话,19,356个专家策划的评估标准(每个任务10-30条),覆盖114个国家、47个美国司法管辖区和25个专业主题,并包含最具挑战性任务的硬子集(Finance-300, Legal-250)。
github 收录
N-MNIST (Neuromorphic-MNIST)
简要说明 Neuromorphic-MNIST (N-MNIST) 数据集是原始基于帧的 MNIST 数据集的尖峰版本。它由与原始 MNIST 数据集相同的 60 000 个训练样本和 10 000 个测试样本组成,并以与原始 MNIST 数据集(28x28 像素)相同的视觉比例捕获。 N-MNIST 数据集是通过将 ATIS 传感器安装在电动云台装置上并让传感器在 LCD 监视器上查看 MNIST 示例时移动来捕获的,如本视频所示。可以在下面的论文中找到对数据集及其创建方式的完整描述。如果您使用数据集,请引用本文。果园,G。科恩,G。贾亚万特,A。和 Thakor, N. “Converting Static Image Datasets to Spiking Neuromorphic Datasets Using Saccades”,《神经科学前沿》,第 9 卷,第 437 期,2015 年 10 月
OpenDataLab 收录
MNBVC
MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。
github 收录
XS-Video
XS-Video数据集是由中国科学院自动化研究所MAIS实验室提出的一个大规模现实世界短视频传播数据集。该数据集收集了来自中国五大平台(抖音、快手、西瓜视频、今日头条、哔哩哔哩)的117720个短视频,包含381926个样本和535个话题,覆盖了从发布后的互动信息,如观看、点赞、分享、收藏、粉丝和评论等。数据集通过跨平台指标对齐方法,对视频的长期传播影响力进行评分,分为0到9级,旨在为短视频传播研究提供全面的互动信息和内容特征。
arXiv 收录
SafetyHelmetWearing-Dataset
安全帽佩戴检测数据集(SHWD),用于安全帽佩戴和人体头部检测。数据集包含7581张图像,其中9044个安全帽佩戴对象(正例)和111514个正常头部对象(未佩戴或负例)。正例对象来自Google或百度,并通过LabelImg手动标注。部分负例对象来自SCUT-HEAD数据集,我们对其进行了修正以适应Pascal VOC格式。
github 收录
