five

Chinese Calligraphy Image Dataset|中国书法数据集|人工智能数据集

收藏
arXiv2020-12-03 更新2024-06-21 收录
中国书法
人工智能
下载链接:
https://github.com/zhuojg/chinese-calligraphy-dataset
下载链接
链接失效反馈
资源简介:
本数据集名为‘Chinese Calligraphy Image Dataset’,由同济大学设计人工智能实验室创建,包含138,499张由19位书法家书写的汉字图像,涵盖7328个不同汉字。数据集通过互联网收集,用于训练名为CalligraphyGAN的条件生成对抗网络,以生成具有美学价值的抽象艺术作品。该数据集主要应用于通过AI技术创造独特的餐饮体验,如在餐厅中通过投影展示定制的艺术作品。
提供机构:
同济大学设计人工智能实验室
创建时间:
2020-12-03
AI搜集汇总
数据集介绍
main_image_url
构建方式
在探索人工智能在创意艺术领域应用的背景下,本研究构建了一个专门的数据集——Chinese Calligraphy Image Dataset。该数据集通过收集19位书法家的138,499幅书法图像,涵盖了7328个不同的汉字字符。为了训练Conditional Generative Adversarial Networks(GAN),选取了1000个字符,每个字符至少有25种不同的书写图像,以此作为控制条件,进而生成全新的字符。
特点
该数据集的特点在于其独特的艺术性和文化内涵,通过汉字书法的视觉艺术形式,将字符本身转化为具有美学价值的抽象画作。此外,数据集在生成抽象艺术作品时,融入了深度学习和自然语言处理技术,使得生成的艺术作品不仅具有审美价值,而且富含内在意义。其创新性地使用了BERT算法将输入文本映射到五个字符上,以此作为生成新字符的依据,确保了艺术作品的多样性和相关性。
使用方法
使用该数据集时,首先需要通过BERT模型生成输入文本和1000个字符的嵌入向量,然后计算文本嵌入向量与字符嵌入向量之间的相似度,选出最相似的五个字符作为生成新字符的依据。接着,利用训练好的CalligraphyGAN模型,以这五个字符为控制条件生成新的字符。最后,通过一系列算法美化处理,如去噪、风格转换等,将生成的字符转化为具有不同风格的艺术作品。
背景与挑战
背景概述
中国书法图像数据集(Chinese Calligraphy Image Dataset)的构建,是在深度学习技术迅猛发展的背景下,由朱俊岗、范凌和王剑南等研究人员于2020年提出并实施的。该数据集的创建,旨在通过条件生成对抗网络(Conditional Generative Adversarial Networks, GAN)和上下文神经网络语言模型,生成具有内在意义和审美价值的抽象艺术品。这一研究不仅汲取了中国书法这一独特视觉艺术形式的美学内涵,还受到了抽象表现主义绘画的启发。数据集包含了19位书法家的138,499幅书法图像,涵盖了7328个不同的字符。该数据集的提出,对于人工智能在创造力领域的探索具有重要的研究价值和实践意义。
当前挑战
在构建中国书法图像数据集的过程中,研究人员面临着多项挑战。首先,如何有效地将书法字符与抽象艺术品的生成联系起来,保持字符的美学特征,是一大难题。其次,数据集的局限导致需要开发一种基于BERT的算法,将任意数量的字符映射到1000个字符中的五个,以保证生成过程的准确性和多样性。此外,为了提高生成图像的质量和多样性,研究人员还需优化算法,如去噪、风格转换等,以满足用户对艺术审美的个性化需求。
常用场景
经典使用场景
在艺术生成领域,Chinese Calligraphy Image Dataset数据集的运用尤为引人注目。该数据集通过结合条件生成对抗网络和上下文神经网络语言模型,不仅实现了从文字到抽象艺术作品的转化,还赋予了艺术作品深层的意义和审美价值。
解决学术问题
该数据集解决了传统艺术创作中难以融入现代技术手段的问题,为艺术生成领域提供了新的研究方向。通过此数据集,研究者能够探索人工智能在创造力方面的潜能,推动AI在视觉艺术领域的应用。
衍生相关工作
基于该数据集,衍生出了一系列相关研究工作。研究者不仅探索了书法艺术与抽象表现主义绘画的结合,还开发了智能布局算法以生成最终的艺术作品,这些都进一步拓宽了人工智能在艺术创作领域的应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

CBIS-DDSM

该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)

本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。

国家青藏高原科学数据中心 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录