WLASL|手语识别数据集|机器学习数据集
收藏数据集概述
主要数据集信息
id | Dataset name | Co | Class | Subj | Samples | Data | LL | Type | An | Av | T |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | DGS Kinect 40 | Ger | 40 | 15 | 3000 | W | V,[9] | PA | Y | ||
2 | RWTH-PHOENIX-Weather | Ger | 1200 | 9 | 45760 | 52gb | S | V | [18] | PA | Y |
3 | SIGNUM | Ger | 450 | 25 | 33210 | 920gb | S | V | PA,[5] | N | |
4 | GSL 20 | Gre | 20 | 6 | ~840 | W | CA | Y | |||
5 | Boston ASL LVD | USA | 3300+ | 6 | 9800 | W | V,[9] | [19,20] | PA | N | |
6 | PSL Kinect 30 | Pol | 30 | 1 | 30×10=300 | ~1.2gb | W | V,[10] | PA | Y | |
7 | PSL ToF 84 | Pol | 84 | 1 | 84×20=1680 | ~33gb | W | V,[11] | PA | N | |
8 | PSL 101 | Pol | ? | ? | ? | ? | ? | ? | CA | N | |
9 | LSA64 | Arg | 64 | 10 | 3200 | 20gb | W | VR | [21] | PA | Y |
10 | BosphorusSign | Tur | Non | N | |||||||
11 | MSR Gesture 3D | USA | 12 | 10 | 336 | 28mb | W | VD | PA | N | |
12 | DEVISIGN-G | Chi | 36[1] | 8 | 432 | ? | W | VR | CA | N | |
13 | DEVISIGN-D | Chi | 500 | 8 | 6000 | ? | W | VR | CA | N | |
14 | DEVISIGN-L | Chi | 2000 | 8 | 24000 | ? | W | VR | CA | N | |
15 | IIITA -ROBITA | Ind | 23 | ? | 284mb | W | VR,[15] | CA | N | ||
16 | Purdue ASL | USA | ? | 14[3] | ? | ? | W/S | V,[14] | [6] | N | |
17 | CUNY ASL | USA | ? | 8 | ~33000[4] | ? | S | VR,[16] | [7] | U | N |
18 | SignsWorld Atlas | Ara | [2] | 10 | ? | ? | W,S,H | V,[17,14] | ? | U | N |
手势特征数据集信息
id | Name | Co | Clas | Sub | Samples | Data | Type | Availability |
---|---|---|---|---|---|---|---|---|
1 | ASL Fingerspelling A | USA | 24 | 5 | 131000 | 2.1gb | images (depth+rgb) | Free download |
2 | ASL Fingerspelling B | USA | 24 | 9 | 317mb | images (depth) | Free download | |
3 | LSA16 handshapes | Arg | 16 | 10 | 800 | 7mb | images (rgb) | Free download |
4 | PSL Fingerspelling ToF | Pol | 16 | 3 | 960 | ~290mb | 3D point cloud | Free download |
5 | ISL | Iri | [23] | 6 | [24] | 170mb | segmented images | Free download |
6 | RWTH-PHOENIX-Weather Handshapes | Ger | 60 | [25] | + 17gb | Hand Images (rgb) | Free download | |
7 | Japanese Fingerspelling Dataset | Jap | 41 | 10 | 8055 | 4.5mb | [26] | Free download |
8 | NUS hand posture dataset I | Sin | 10 | ? | 240 | 3mb | images(rgb),160x120 | Free download |
9 | NUS hand posture dataset II | Sin | 10 | 40 | 2000 | 73mb | images(rgb)160x120 | Free download |
10 | CIARP | - | 10 | ? | 6000 | 11mb | images(rgb)38x38 | Free download |
11 | RTWH Fingerspelling dataset | Ger | ||||||
12 | Indian Kinect | Ind | 40 | 18 | 5041 | 2gb | [27] | Free download |
13 | [ArASL] | Ara | 32 | ? | 54,049 | 64mb | images(rgb) | Free download |
14 | ChicagoFSWild | USA | [2] | 160 | ? | images(rgb) | Free download | |
15 | ChicagoFSWild+ | USA |
连续手部姿态数据集
- NYU Hand pose dataset
面部特征数据集
-
QLIBRAS
-
WIDER FACE: A Face Detection Benchmark
唇读特征数据集
-
GRID corpus - Lip
-
AVICAR - Lip
-
AVLetter
-
CUAVE
-
OuluVS1
-
OuluVS2

- WLASL数据集首次发表,由Gul Varol等人提出,旨在为手语识别任务提供一个大规模、多样化的数据资源。
- WLASL数据集在多个国际会议和期刊上被广泛引用,成为手语识别领域的重要基准数据集。
- WLASL数据集的应用扩展到手语翻译和手语理解领域,推动了相关技术的研究和发展。
- WLASL数据集的版本更新,增加了更多的手语词汇和多样化的视频数据,进一步提升了数据集的质量和覆盖范围。
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录