five

数据堂—202人多角度唇形多模态视频数据

收藏
魔搭社区2025-11-27 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/202People-Multi-angleLipMultimodalVideoData
下载链接
链接失效反馈
官方服务:
资源简介:
202人多角度唇形多模态视频数据。采集环境包括室内自然光线场景和室内日光灯场景。采集设备为手机。采集多样性涵盖多种场景、不同年龄、13种拍摄角度。语言为中文普通话。录制内容为通用领域,内容不限。数据可用于语音图像领域的多模态学习算法研究

A multi-modal video dataset of lip shapes involving 202 participants captured from multiple angles. The data acquisition environments include indoor natural light scenes and indoor fluorescent light scenes. Smartphones were employed as the acquisition equipment. The dataset covers diverse scenarios, various age groups, and 13 shooting angles. The spoken language used in the recordings is Standard Mandarin Chinese. The recorded content falls under the general domain with no thematic restrictions. This dataset is applicable to research on multi-modal learning algorithms in the fields of speech and image processing.
提供机构:
maas
创建时间:
2024-05-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含202人的多角度唇形多模态视频,用于语音和图像多模态学习算法研究。数据采集于室内自然光和荧光灯场景,使用手机设备,覆盖多个场景、不同年龄和13个拍摄角度,语言为普通话,内容无特定限制。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务