X2I|图像生成数据集|多任务处理数据集
收藏OmniGen 数据集概述
1. 基本介绍
- 名称: OmniGen
- 类型: 统一图像生成模型
- 特点: 支持多模态提示生成图像,无需额外插件或预处理步骤
- 目标: 实现简单、灵活的图像生成范式
2. 关键功能
- 文本到图像生成
- 主题驱动生成
- 身份保留生成
- 图像编辑
- 图像条件生成
- 参考表达式生成(自动识别输入图像中的对象)
3. 技术特性
- 方法论: 详见论文 arXiv:2409.11340
- 优势: 自动识别输入图像特征(如物体、人体姿态、深度映射等)
- 灵活性: 可通过微调添加新功能
4. 资源获取
- 模型权重: Shitao/OmniGen-v1
- 演示平台:
- 数据集: X2I Dataset
5. 使用方式
-
安装方法: bash git clone https://github.com/VectorSpaceLab/OmniGen.git cd OmniGen pip install -e .
-
快速开始示例代码: 提供文本到图像和多模态到图像的生成示例
-
Diffusers集成: 支持通过Diffusers库使用
6. 微调支持
- 支持LoRA微调
- 提供完整微调选项
- 训练脚本:
train.py
- 详细指南: docs/fine-tuning.md
7. 许可信息
- 许可证: MIT License
8. 引用方式
bibtex @article{xiao2024omnigen, title={Omnigen: Unified image generation}, author={Xiao, Shitao and Wang, Yueze and Zhou, Junjie and Yuan, Huaying and Xing, Xingrun and Yan, Ruiran and Wang, Shuting and Huang, Tiejun and Liu, Zheng}, journal={arXiv preprint arXiv:2409.11340}, year={2024} }

rag-datasets/rag-mini-bioasq
该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。
hugging_face 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
Med-MAT
Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。
huggingface 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录