five

Emova-ollm/emova-alignment-7m

收藏
Hugging Face2025-03-14 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/Emova-ollm/emova-alignment-7m
下载链接
链接失效反馈
官方服务:
资源简介:
EMOVA-Alignment-7M是一个用于全模态预训练的全面数据集,包括视觉语言和语音语言的对齐。该数据集使用了开源的图像文本预训练数据集、OCR数据集以及2000小时的自 curated ASR和TTS数据。它适用于多模态预训练,并包含了一般数据、OCR数据、纯文本指令数据和语音数据四个子集。

EMOVA-Alignment-7M is a comprehensive dataset for omni-modal pre-training, including alignment of vision-language and speech-language. The dataset is constructed using open-sourced image-text pre-training datasets, OCR datasets, and 2,000 hours of self-curated ASR and TTS data. It is suitable for multi-modal pre-training and includes four subsets: general data, OCR data, pure textual instruction data, and speech data.
提供机构:
Emova-ollm
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作