alvp/zenobia
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/alvp/zenobia
下载链接
链接失效反馈官方服务:
资源简介:
Zenobia是一个西班牙诗歌数据集,从网站poesi.as收集而来。该数据集包含诗歌以及使用Llama3-70B模型生成的元数据。它是一个有价值的参考资源,适用于与自然语言处理(NLP)和西班牙诗歌相关的项目。数据集中的每一行包含诗歌的完整文本、生成的主题、摘要、提示、作者和标题。
Zenobia是一个西班牙诗歌数据集,从网站poesi.as收集而来。该数据集包含诗歌以及使用Llama3-70B模型生成的元数据。它是一个有价值的参考资源,适用于与自然语言处理(NLP)和西班牙诗歌相关的项目。数据集中的每一行包含诗歌的完整文本、生成的主题、摘要、提示、作者和标题。
提供机构:
alvp
原始信息汇总
Zenobia 数据集概述
数据集信息
特征
- poem: 诗歌的完整文本,数据类型为字符串。
- themes: 诗歌的主要主题,由模型生成,数据类型为字符串。
- summary: 诗歌内容的简要摘要,由模型生成,数据类型为字符串。
- prompt: 受诗歌启发的提示或建议,由模型生成,数据类型为字符串。
- author: 诗歌的作者,数据类型为字符串。
- title: 诗歌的标题,数据类型为字符串。
数据分割
- train: 训练集,包含22545个样本,大小为41304680字节。
- validation: 验证集,包含2501个样本,大小为4527115字节。
数据大小
- 下载大小: 24143439字节
- 数据集总大小: 45831795字节
配置
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- data_files:
语言
- 西班牙语 (es)
标签
- 合成数据 (synthetic)
- 艺术 (art)
数据规模
- 10K < n < 100K
数据示例
json { "poem": "En el alto Aragón, con ventisquero...", "themes": "Nature, Mountains, Winter", "summary": "The poem describes the winter landscape in the mountains of Aragon.", "prompt": "Write about a journey through a snowy landscape.", "author": "Anonymous", "title": "Winter Landscape" }
数据来源
- 诗歌来自网站 poesi.as。
许可证
- 该数据集的许可证为 cc-by-4.0。
用途
- 该数据集适用于自然语言处理(NLP)任务,如情感分析、文本生成和主题分析,特别是在西班牙诗歌的背景下。
数据集创建与管理
- 该数据集由 Llama3-70B 模型生成和管理。



