SNIPS|自然语言处理数据集|意图识别数据集
收藏
- SNIPS数据集首次发表,由法国公司Snips AI发布,旨在为语音助手领域提供一个公开的、高质量的意图分类数据集。
- SNIPS数据集在多个自然语言处理竞赛中被广泛应用,成为评估模型在意图分类任务上性能的标准数据集之一。
- 随着深度学习技术的发展,SNIPS数据集被用于训练和验证多种先进的神经网络模型,显著提升了语音助手系统的准确性和响应速度。
- SNIPS数据集的扩展版本发布,增加了更多的语言和领域,进一步丰富了数据集的多样性和应用范围。
- 1Neural Architectures for Named Entity RecognitionStanford University · 2016年
- 2BERT: Pre-training of Deep Bidirectional Transformers for Language UnderstandingGoogle AI Language · 2019年
- 3RoBERTa: A Robustly Optimized BERT Pretraining ApproachFacebook AI Research · 2019年
- 4ALBERT: A Lite BERT for Self-supervised Learning of Language RepresentationsGoogle Research · 2020年
- 5T5: Exploring the Limits of Transfer Learning with a Unified Text-to-Text TransformerGoogle AI · 2020年
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
Alexa Domains
该数据集由前 100 万个网站的 URL 组成。 域名使用 Alexa 流量排名进行排名 是使用浏览行为的组合来确定的 网站上的用户数、唯一身份访问者的数量和网页浏览量。更详细地说,唯一身份访问者是 在给定日期访问网站的唯一用户数, 和 pageviews 是用户 URL 请求的总数 网站。但是,对同一网站的多个请求 在同一天被计为一次综合浏览量。网站 独立访问者和综合浏览量的最高组合 排名最高
OpenDataLab 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
UAVDT
UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。
arXiv 收录