five

asigalov61/clean-songs-lyrics-dataset

收藏
Hugging Face2026-04-23 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/asigalov61/clean-songs-lyrics-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为cleanlyrics的歌曲歌词数据集,包含了超过1.53M首经过清理的歌曲歌词,每首歌词都附有歌曲标题和艺术家名称。数据集是通过合并、去重、清理和消毒三个大型歌词数据集而创建的。每首歌词都经过去重处理,确保其大小在256字节到8192字节之间,并检查了是否包含不雅内容,同时进行了ASCII消毒以确保一致性。

This is a clean songs lyrics dataset named cleanlyrics, containing over 1.53M cleaned song lyrics, each with song titles and artists names. The dataset is created by combining, deduplicating, cleaning, and sanitizing three large lyrics datasets. Each lyric was deduplicated, checked to be in the range of 256 bytes to 8192 bytes, checked for profanities, and ASCII sanitized for consistency.
提供机构:
asigalov61
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作