brunokreiner/genius-lyrics
收藏Hugging Face2023-03-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/brunokreiner/genius-lyrics
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含大约480k的英文歌词,这些歌词通过nltk语言分类器进行分类,并且包含一些元数据。歌词是通过lyricsgenius Python包爬取的,虽然数据经过清理和验证,但不能保证所有歌词的准确性。此外,49,985行数据包含从Spotify API爬取的流派列表,这些流派是基于歌曲的艺术家而非单个歌曲。
提供机构:
brunokreiner
原始信息汇总
数据集概述
数据集描述
- 数据集概要:该数据集包含约480,000条英语歌词(通过nltk语言分类器分类),以及一些额外的元数据。元数据来源于AICrowd的百万播放列表挑战。歌词通过song和artist名称使用lyricsgenius Python包进行爬取。尽管数据已清理和验证,但不能保证所有歌词的准确性。如果歌词中的歌曲名称与爬取的名称不匹配(使用fuzzywuzzy字符串匹配,分数低于60),则不包括在内。
- 元数据:49,985行包含从官方Spotify API爬取的流派列表,这些流派来自歌曲的艺术家,因为Spotify不为每首歌曲提供流派。
数据集结构
数据字段
[更多信息待补充]
数据分割
[更多信息待补充]
数据集创建
源数据
初始数据收集和规范化
[更多信息待补充]
源语言生产者
[更多信息待补充]



