huggingartists/yung-lean
收藏数据集概述
数据集描述
- 数据集名称: huggingartists/yung-lean
- 数据集大小: 0.441891 MB
数据集总结
- 内容: 从Genius解析的歌词数据集,用于生成歌词。
- 模型: 可用于生成歌词的模型,地址为 https://huggingface.co/huggingartists/yung-lean。
支持的任务和排行榜
- 信息: 待补充
语言
- 语言: 英语 (en)
数据集结构
数据字段
text: 字符串类型,包含歌词文本。
数据分割
-
分割详情:
- 训练集: 269条
- 验证集: 未提供
- 测试集: 未提供
-
分割方法: 可通过以下代码将训练集分割为训练、验证和测试集: python from datasets import load_dataset, Dataset, DatasetDict import numpy as np
datasets = load_dataset("huggingartists/yung-lean")
train_percentage = 0.9 validation_percentage = 0.07 test_percentage = 0.03
train, validation, test = np.split(datasets[train][text], [int(len(datasets[train][text])train_percentage), int(len(datasets[train][text])(train_percentage + validation_percentage))])
datasets = DatasetDict( { train: Dataset.from_dict({text: list(train)}), validation: Dataset.from_dict({text: list(validation)}), test: Dataset.from_dict({text: list(test)}) } )
使用方法
-
加载数据集: python from datasets import load_dataset
dataset = load_dataset("huggingartists/yung-lean")
数据集创建
- 来源数据: 待补充
- 注释过程: 待补充
- 个人和敏感信息: 待补充
使用数据的考虑
- 社会影响: 待补充
- 偏见讨论: 待补充
- 其他已知限制: 待补充
附加信息
-
数据集管理员: 待补充
-
许可信息: 待补充
-
引用信息:
@InProceedings{huggingartists, author={Aleksey Korshuk} year=2021 }



