RusCode

github2025-02-12 更新2025-02-17 收录

下载链接：

https://github.com/ai-forever/RusCode

下载链接

链接失效反馈

官方服务：

资源简介：

RusCode是一个用于评估包含俄罗斯文化代码元素的文本到图像生成质量的基准数据集。数据集包含了1250个俄语文本提示及其英文翻译，覆盖了从艺术、流行文化、民间传统、名人名称、自然物体到科学成就等广泛主题。

RusCode is a benchmark dataset for evaluating the text-to-image generation quality of texts containing elements of Russian cultural codes. The dataset includes 1250 Russian text prompts and their English translations, covering a wide range of topics including art, popular culture, folk traditions, celebrity names, natural objects, and scientific achievements.

创建时间：

2025-02-08

原始信息汇总

RusCode数据集概述

数据集名称

RusCode: Russian Cultural Code Benchmark for Text-to-Image Generation

数据集简介

RusCode是一个用于评估包含俄罗斯文化元素文本到图像生成质量的基准数据集。该数据集旨在解决文本到图像生成模型中存在的文化偏见问题，特别是在对非英语文化背景的理解和表现上。

数据集构成

文本提示: 包含1250个俄语文本提示及其英文翻译。
类别: 数据集分为19个类别，涵盖艺术、流行文化、民间传统、名人姓名、自然物体、科学成就等广泛主题。

数据集统计

数据集的每个类别中收集的提示数量比例有详细统计。

引用信息

@misc{vasilev2025ruscoderussianculturalcode, title={RusCode: Russian Cultural Code Benchmark for Text-to-Image Generation}, author={Viacheslav Vasilev and Julia Agafonova and Nikolai Gerasimenko and Alexander Kapitanov and Polina Mikhailova and Evelina Mironova and Denis Dimitrov}, year={2025}, eprint={2502.07455}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2502.07455}, }

搜集汇总

数据集介绍

构建方式

针对当前文本到图像生成模型普遍存在的对英语文化偏好及对其他文化表征不足的问题，RusCode数据集应运而生。该数据集通过挑选能代表俄罗斯视觉文化特色的19个类别，搜集了1250个俄语文本提示及其英文翻译，内容涵盖艺术概念、流行文化、民间传统、名人、自然物体、科学成就等多个主题，以此构建起一个用于评估文本到图像生成模型文化意识的基准。

特点

RusCode数据集的特点在于其专注于俄罗斯文化代码的元素，填补了计算机视觉领域中对文化意识研究的空白。数据集中的文本提示不仅反映了俄罗斯文化的多样性，而且通过俄英双语对照，为跨语言文化的模型评估提供了可能。此外，数据集的构建充分考虑了文化敏感性，有助于减少生成模型中的无意冒犯和偏见。

使用方法

使用RusCode数据集时，研究者可以依据其提供的文本提示，对文本到图像生成模型的性能进行评估。数据集的使用不仅包括对模型生成图像的质量进行评价，还需要关注模型是否能够准确地反映俄罗斯文化的特性，这对于提高模型的跨文化适应性具有重要意义。引用数据集时，研究者应遵循提供的BibTeX格式进行正确的学术引用。

背景与挑战

背景概述

在计算机视觉领域，文化意识的缺失导致了许多文本到图像生成模型在处理非英语文化内容时存在偏差。针对这一问题，RusCode数据集应运而生，该数据集由Viacheslav Vasilev等研究人员于2025年提出，旨在评估包含俄罗斯文化元素文本到图像生成的质量。数据集包含了19个类别，1250个俄语文本提示及其英文翻译，覆盖艺术、流行文化、民间传统、知名人物、自然物体、科学成就等多个领域。RusCode的创建填补了文化意识在计算机视觉研究中的空白，为相关领域的研究提供了重要基准。

当前挑战

RusCode数据集面临的挑战主要在于如何准确捕捉和表征俄罗斯文化元素，确保文本到图像生成模型的输出能够真实反映俄罗斯文化。此外，构建过程中需要解决如何平衡各类别的数据代表性，以及如何处理和评估模型在不同文化背景下的生成质量，避免无意识的冒犯和偏见传播。这些挑战对于促进文化意识在计算机视觉领域的深入研究和应用具有重要意义。

常用场景

经典使用场景

在计算机视觉与自然语言处理领域交叉的研究中，RusCode数据集以其独特的文化属性，成为评估文本到图像生成模型文化意识的重要工具。该数据集通过包含俄罗斯文化元素的文本提示，旨在训练并评估模型对于非英语文化的理解和呈现能力，其经典使用场景在于为模型提供具有俄罗斯视觉文化特征的艺术、民间传统、知名人士、自然物体和科技成就等多样化的主题进行图像生成。

实际应用

实际应用中，RusCode数据集不仅有助于提升文化特定的图像生成质量，而且对于开发多文化适应性的AI系统至关重要。它可以被用于创建更加包容和敏感的文化内容生成工具，服务于教育、娱乐和创意产业等多个领域。

衍生相关工作

基于RusCode数据集，研究者可以开展一系列相关的工作，如开发针对其他文化的类似基准，或者利用该数据集进行跨文化交流的图像生成算法研究。此外，该数据集也促进了模型评估指标的完善，以及文化意识在计算机视觉领域的进一步探讨。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集