GTSRB - German Traffic Sign Recognition Benchmark|交通标志识别数据集|图像分类数据集
收藏
- GTSRB数据集首次发表,由德国弗劳恩霍夫研究所和德国图宾根大学的研究团队共同创建,旨在为交通标志识别研究提供一个标准化的基准。
- GTSRB数据集首次应用于国际神经网络联合会议(IJCNN)的交通标志识别挑战赛,成为该领域的重要基准数据集。
- GTSRB数据集的扩展版本发布,增加了更多的交通标志样本,进一步提升了其在深度学习研究中的应用价值。
- GTSRB数据集被广泛应用于自动驾驶和智能交通系统的研究中,成为评估和比较不同算法性能的重要工具。
- GTSRB数据集的相关研究成果在国际顶级期刊和会议上发表,推动了交通标志识别技术的发展。
- GTSRB数据集的在线平台更新,提供了更便捷的数据访问和下载方式,促进了全球研究者的使用和交流。
- 1The German Traffic Sign Recognition Benchmark: A Multi-class Classification CompetitionInternational Joint Conference on Neural Networks · 2011年
- 2Traffic Sign Recognition with Multi-Scale Convolutional NetworksInternational Joint Conference on Neural Networks · 2011年
- 3Deep Neural Networks for Traffic Sign Recognition Systems: An Analysis of Spatial Transformer NetworksIEEE Transactions on Intelligent Transportation Systems · 2018年
- 4A Survey on Traffic Sign Recognition: Challenges and OpportunitiesExpert Systems with Applications · 2020年
- 5Adversarial Attacks on Traffic Sign Recognition SystemsarXiv · 2021年
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
VQA
我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。
OpenDataLab 收录
CIFAR-10
CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。
OpenDataLab 收录
ChemBL
ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。
www.ebi.ac.uk 收录