five

虚拟说话人形象标准图片集及其对应的数字人模型数据集

收藏
国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edc7cebb16e07753c34e3f&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
构建的基于多模态智能交互的奥林匹克云展厅系统集成了多模态虚拟形象交互技术,其中个性化虚拟形象生成使用单张照片进行人脸三维重建,用户仅需上传一张正面照片即可完成个性化虚拟形象构建,支持语音驱动的说话唇形动画生成。支持选定云展厅中预设的形象照片或者上传用户自身形象的照片,基于此利用基于卷积神经网络的三维人脸重建模型,通过输入照片预测人脸的参数化BFM(Basel Face Model)系数(包括人脸的身份参数、表情参数等)。此后通过冬奥会云展厅预设的光照、人脸姿势、人脸纹理等配置,结合上述BFM系数即可在云展厅中生成符合用户需求的虚拟形象。

The constructed Olympic cloud exhibition hall system based on multimodal intelligent interaction integrates multimodal virtual avatar interaction technology. For personalized virtual avatar generation, it adopts single-photo-based 3D face reconstruction: users can complete the creation of personalized virtual avatars by only uploading a single frontal photo, and the system supports voice-driven lip-sync animation generation for speech. The system allows users to either select preset avatar photos from the cloud exhibition hall or upload their own portrait photos. Based on the input photos, the Convolutional Neural Network (CNN)-based 3D face reconstruction model predicts the parametric Basel Face Model (BFM) coefficients of the face, including face identity parameters, expression parameters and other relevant parameters. Subsequently, by combining the aforementioned BFM coefficients with the preset configurations such as lighting, face pose and face texture in the Winter Olympics cloud exhibition hall, the system can generate virtual avatars that meet users' requirements in the cloud exhibition hall.
提供机构:
首都体育学院
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是用于虚拟说话人形象生成的标准图片集及对应数字人模型,基于冬奥会奥林匹克云展厅系统开发,支持通过单张照片进行人脸三维重建和语音驱动唇形动画生成。数据集包含15个文件,总数据量4.77MB,涉及计算机科学技术领域,由首都体育学院在2023年发布,作为国家重点研发计划项目'2021YFF0307700'的成果之一,旨在促进多模态虚拟形象交互技术的应用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务