huggingartists/og-buda
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/huggingartists/og-buda
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从Genius解析的歌词,旨在用于生成歌词。数据集大小为0.641111 MB,语言为英语。数据集的结构包括一个名为text的字段,包含歌词文本。训练集包含236个样本,验证集和测试集未明确划分,但可以通过代码进行划分。
提供机构:
huggingartists
原始信息汇总
数据集概述
数据集名称
- 名称: huggingartists/og-buda
数据集描述
- 描述: 该数据集包含从Genius解析的歌词数据,旨在用于生成歌词。
- 语言: 英语 (en)
数据集结构
- 数据字段:
text: 字符串类型,包含歌词文本。
- 数据分割:
train: 236条数据validation和test目前未定义,但可通过代码分割train数据得到。
使用方法
- 加载数据集: python from datasets import load_dataset dataset = load_dataset("huggingartists/og-buda")
数据集创建
- 来源数据: 数据来自Genius网站,具体的数据收集和标准化过程未详细说明。
- 注释过程: 未详细说明。
- 个人和敏感信息处理: 未详细说明。
注意事项
- 数据集的社会影响、偏见讨论、其他已知限制: 未详细说明。
附加信息
-
数据集维护者: Aleksey Korshuk
-
许可证信息: 未详细说明。
-
引用信息:
@InProceedings{huggingartists, author={Aleksey Korshuk} year=2021 }
关于
- 构建者: Aleksey Korshuk
- 项目仓库: GitHub链接



