five

PD12M 大规模图像-文本数据集

收藏
超神经2024-11-18 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/35511
下载链接
链接失效反馈
官方服务:
资源简介:
Public Domain 12M(简称 PD12M)是由 Spawning 于 2024 年创建的一个大规模图像-文本数据集,它包含了 1240 万张高质量的公共领域及 CC0 许可图片,这些图片搭配了合成字幕,主要用于训练文本到图像的模型。 PD12M 是目前最大的公共领域图像-文本数据集,以其庞大的规模和明确的版权声明,为 AI 模型的训练提供了坚实的基础,同时最小化了版权担忧。相关论文成果为「Public Domain 12M: A Highly Aesthetic Image-Text Dataset with Novel Governance Mechanisms」。

Public Domain 12M (abbreviated as PD12M) is a large-scale image-text dataset developed by Spawning in 2024. It comprises 12.4 million high-quality public domain and CC0-licensed images paired with synthetic captions, and is primarily intended for training text-to-image models. PD12M currently stands as the largest public domain image-text dataset, offering a robust foundation for AI model training through its massive scale and explicit copyright statements, while effectively mitigating copyright-related concerns. The associated research paper is titled "Public Domain 12M: A Highly Aesthetic Image-Text Dataset with Novel Governance Mechanisms"
创建时间:
2024-11-12
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
PD12M是一个于2024年创建的大规模图像-文本数据集,包含1240万张高质量的公共领域及CC0许可图片,并配有合成字幕,主要用于训练文本到图像生成模型。该数据集源自GLAM机构和Wikimedia Commons等,通过严格的筛选和社区治理机制确保数据质量与安全性,旨在推动计算机视觉和自然语言处理领域的发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务