CREMI|神经科学数据集|生物信息学数据集

OpenDataLab2025-04-05 更新2024-05-09 收录

神经科学

生物信息学

下载链接：

https://opendatalab.org.cn/OpenScienceLab/CREMI

下载链接

链接失效反馈

资源简介：

这一挑战的目标是评估从串行切片电子显微镜数据中自动重建神经元和神经元连接的算法。不仅通过评估神经元分割的质量，还通过评估检测突触和识别突触伙伴的准确性来进行比较。该挑战是在来自成年黑腹果蝇大脑组织的三个大型且多样化的数据集上进行的，包括神经元分割基础事实和突触连接的注释。一个成功的解决方案将证明其效率和普遍性，并具有巨大的潜力，可以减少在电子显微镜体积中手动重建神经回路所花费的时间。

提供机构：

OpenScienceLab

创建时间：

2022-05-23

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库，由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音，录音在安静的室内环境中使用高保真麦克风进行，并下采样至16kHz。通过专业的语音标注和严格的质量检查，手动转录的准确率超过95%。该数据集免费供学术使用，旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准，由华东师范大学等机构创建。该数据集包含33,735个问题，涵盖14个核心临床场景，主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制，确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力，解决医疗领域中模型性能评估的不足问题。

arXiv 收录

google/speech_commands

SpeechCommands数据集包含一秒钟的.wav音频文件，每个文件包含一个单独的英语单词或背景噪音。这些单词来自一组命令，并由不同的说话者录制。数据集有两个版本，v0.01和v0.02，分别包含64,727和105,829个音频文件。数据集的主要任务是关键词检测，即通过分类将话语分类为预定义的单词集。数据集的语言为英语，数据集的创建目的是为了帮助训练简单的机器学习模型。

hugging_face 收录