five

godmode/russian-poetry-7k

收藏
Hugging Face2026-04-18 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/godmode/russian-poetry-7k
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 language: - ru tags: - russian - poetry - music - rap - rock size_categories: - 1K<n<10K --- # Russian Poetry Dataset (7392 examples) Fine-tuning dataset for generating Russian poetic texts (rap, rock, авторская песня). ## Source 11 Russian artists: Noize MC, Земфира, Сплин, Аквариум, Наутилус Помпилиус, Мумий Тролль, Агата Кристи, Альянс, Oxxxymiron, Хаски, Скриптонит — **1978 unique songs** × 4 prompt variants = **7912 examples**, after cleaning **7392**. ## Format `messages` format compatible with Gemma 4 / Qwen / Llama chat templates: ```json { "messages": [ {"role": "user", "content": "грустная, об ошибках прошлого, плотные рифмы"}, {"role": "assistant", "content": "[lyrics]"} ] } ``` ## Prompt variants per song - `short` — casual chat: "напиши грустный текст про разлуку" - `tags` — comma-separated: "меланхоличная, душевная боль, метафоры" - `structured` — key:value: "тема: разлука / тон: меланхоличный" - `detailed` — full description with all stylistic fields ## Analysis Each text was analyzed by qwen-3-235b (Cerebras) for: theme, tone, energy, imagery, key metaphors, rhyme style, structure, social context. ## Usage ```python from datasets import load_dataset ds = load_dataset("godmode/russian-poetry-7k") ```
提供机构:
godmode
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作