five

WLASL, MSASL, NMFs-CSL, SLR500, Slovo, BOBSL, 27 Class Sign Language Dataset, AUTSL, BosphorusSign22k, GSL, LSA16, LSA64, Rendered Handpose Dataset, YouTube-ASL, LSFB-ISOL, ASLLVD, AASL, KArSL, BdSLImset, HaGRID, Phoenix-2014, Phoenix-2014T|手语识别数据集|手语翻译数据集

收藏
github2024-04-15 更新2024-05-31 收录
手语识别
手语翻译
下载链接:
https://github.com/YangyangQu/Sign_Language_Datasets
下载链接
链接失效反馈
资源简介:
该仓库收集了多种与手语识别和翻译相关的数据集,旨在为研究者、开发者和爱好者提供一个集中的资源。数据集包括不同类型(如RGB、深度、骨骼)和来自不同国家的数据,用于支持手语识别和翻译技术的研究。

This repository aggregates a variety of datasets related to sign language recognition and translation, aiming to provide a centralized resource for researchers, developers, and enthusiasts. The datasets encompass different types (such as RGB, depth, skeletal) and data from various countries, supporting research in sign language recognition and translation technologies.
创建时间:
2024-04-11
原始信息汇总

数据集概述

孤立手语识别数据集

数据集 下载链接 论文链接 类型 长度/视频数 大小 国家
WLASL link link RGB 2,000 单词 美国
MSASL link RGB 25,000 视频
NMFs-CSL link link RGB 1,067 单词 中国
SLR500 link RGB, Depth, Skeleton 500 类别 中国
Slovo link link RGB 20400 视频 16 GB 俄罗斯
BOBSL link link RGB 英格兰
27 Class Sign Language Dataset link link RGB 1G 美国
AUTSL link RGB, depth, skeleton 38,336 视频
BosphorusSign22k link link RGB, Depth, Skeleton 22,542 视频 英格兰
GSL link link RGB, Depth 希腊
LSA16 link link RGB 800 图像 阿根廷
LSA64 link RGB 3200 视频 阿根廷
Rendered Handpose Dataset link link RGB, Depth, Segmentation masks 43986 样本 7.1G 阿根廷
YouTube-ASL link link RGB 11,093 视频 美国
LSFB-ISOL link RGB 比利时
ASLLVD link RGB 3,300 视频 美国
AASL link link RGB 7,857 图像 5G 阿拉伯
KArSL link link RGB, Depth, Skeleton 75,300 视频 阿拉伯
BdSLImset link link RGB 4,000,000 图像 孟加拉国
HaGRID link link RGB 554,800 图像 723GB 孟加拉国

连续手语识别数据集

数据集 下载链接 论文链接 类型 长度/视频数 大小 国家
Phoenix-2014 link link RGB 386 版本 53GB 德国
Phoenix-2014T link link RGB 386 版本 39GB 德国
GSL link link RGB, Depth 希腊
ASLG-PC12 link link RGB 24002570 句子 美国
LSFB-CONT link RGB 比利时

手语翻译数据集

数据集 下载链接 论文链接 类型 长度/视频数 大小 国家
Phoenix-2014T link link RGB 386 版本 39GB 德国
BOBSL link link RGB 1,940 集 英格兰
CSL-Daily link link RGB 中国
OpenASL link link RGB 英格兰
How2Sign link link RGB 英格兰
GSL link link RGB, Depth 希腊
Content4All link RGB
ISLTranslate link link RGB 印度

许可证

本仓库中包含的数据集均受其各自的许可证约束。请参考各个数据集目录以获取更多信息。

AI搜集汇总
数据集介绍
main_image_url
构建方式
本数据集集合致力于收集与手语识别和翻译相关的多种数据集,旨在为从事手语识别和翻译技术的研究人员、开发者和爱好者提供一个集中的资源。这些数据集涵盖了不同国家和地区的多种手语,包括美国、中国、俄罗斯、英国、希腊、阿根廷、阿拉伯、孟加拉国和德国等。数据集的构建方式多样,包括RGB视频、深度图像、骨骼数据等多种类型,以满足不同研究需求。
特点
该数据集集合的特点在于其多样性和广泛性。它包含了从孤立手语识别到连续手语识别,再到手语翻译的多种数据集。每个数据集都提供了详细的下载链接和相关论文,便于研究者深入了解其背景和应用。此外,数据集的规模从几千到几百万不等,覆盖了从简单的词汇识别到复杂的连续手语翻译任务,为不同层次的研究提供了丰富的资源。
使用方法
使用该数据集集合时,研究者可以根据自己的研究需求选择合适的数据集。首先,通过提供的下载链接获取数据集文件。其次,参考相关论文了解数据集的详细信息和使用方法。最后,根据研究目标,利用数据集进行模型训练和测试。每个数据集都有其特定的使用许可,使用前请务必查阅并遵守相应的许可协议。
背景与挑战
背景概述
手语识别与翻译数据集的收集与研究自21世纪初以来逐渐成为人工智能领域的重要分支。这些数据集的创建旨在解决手语识别与翻译中的核心问题,即如何准确、高效地将手语转化为文本或语音,从而促进聋哑人与听觉正常人之间的沟通。主要研究人员和机构包括微软、牛津大学、中国科学技术大学等,他们通过收集和标注大量手语视频数据,推动了这一领域的发展。这些数据集不仅为手语识别算法的研究提供了丰富的资源,还对手语翻译技术的实际应用产生了深远影响。
当前挑战
手语识别与翻译数据集的构建面临多重挑战。首先,手语的多样性和复杂性使得数据标注和分类变得极为困难,不同地区和文化背景下的手语存在显著差异。其次,数据集的规模和质量直接影响模型的训练效果,大规模高质量的手语数据集的获取和维护成本高昂。此外,手语视频中的光照、背景噪声、手势速度变化等因素增加了数据处理的复杂性。最后,如何确保数据集的多样性和代表性,以避免模型训练中的偏见和误差,也是当前研究中的重要课题。
常用场景
经典使用场景
在手语识别与翻译领域,这些数据集被广泛应用于开发和验证各种机器学习模型。例如,WLASL数据集常用于训练深度学习模型以识别美国手语中的2000个词汇,而MSASL则提供了25,000个视频用于更广泛的手语识别任务。这些数据集的多样性和规模使得研究人员能够探索不同类型的手语表达,从而提升模型的准确性和鲁棒性。
解决学术问题
这些数据集解决了手语识别与翻译领域中的多个关键学术问题。首先,它们为研究人员提供了丰富的数据资源,有助于解决数据稀缺问题,从而推动了手语识别技术的进步。其次,通过提供多模态数据(如RGB、深度和骨架信息),这些数据集帮助研究者开发能够处理复杂手势和动态变化的模型。此外,这些数据集还促进了跨文化手语识别的研究,为全球范围内的手语用户提供了技术支持。
衍生相关工作
这些数据集不仅自身具有重要价值,还衍生了许多相关研究工作。例如,基于WLASL的研究论文探讨了如何利用深度学习技术提高手语识别的准确性,而MSASL的相关工作则集中在视频数据的处理和特征提取上。此外,BOBSL和AUTSL等数据集的研究成果,推动了多模态数据融合技术的应用,进一步提升了手语识别系统的性能。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。

arXiv 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录