five

Pseudoteredinibacter isoporae Chen et al. 2011|微生物学数据集|分类学数据集

收藏
DataCite Commons2025-01-07 更新2025-03-18 收录
微生物学
分类学
下载链接:
https://bacdive.dsmz.de/index.php?site=pdf_view&id=17919&doi=doi:10.13145/bacdive17919.20240916.9.1
下载链接
链接失效反馈
资源简介:
The range of data encompasses taxonomy, morphology, physiology, sampling and concomitant environmental conditions as well as molecular biology.
提供机构:
DSMZ
创建时间:
2024-09-17
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Tropicos

Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。

www.tropicos.org 收录

OpenPose

OpenPose数据集包含人体姿态估计的相关数据,主要用于训练和评估人体姿态检测算法。数据集包括多视角的图像和视频,标注了人体关键点位置,适用于研究人体姿态识别和动作分析。

github.com 收录

WenetSpeech

WenetSpeech是一个大规模的多领域普通话语音数据集,总时长超过22400小时,包括10000+小时高质量标注语音、2400+小时弱标注语音和约10000小时未标注语音。数据来源于YouTube和Podcast,覆盖多种说话风格、场景、领域、话题和噪声条件。通过光学字符识别(OCR)方法和高质量自动语音识别(ASR)转录系统生成音频/文本分割候选,并采用端到端标签错误检测方法进行验证和过滤。此外,提供三个手动标注的高质量测试集用于评估。WenetSpeech是目前最大的开源普通话语音语料库,适用于生产级语音识别研究。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

TSOD10K

TSOD10K是首个大规模的交通显著目标检测数据集,由湖南师范大学信息科学与工程学院、南开大学人工智能学院和湖南大学机器人学院共同创建。该数据集包含13753张车辆捕获的图像,并带有像素级的精确注释。TSOD10K覆盖了各种真实世界交通场景,包括城市交叉口、高速公路、乡村道路和停车场,涵盖了雨、雪、雾、晴、低光等不同的天气/光照组合。数据集旨在支持动态风险分层下游服务,特别编码了视觉显著性和隐含的风险语义。

arXiv 收录