five

aznlp/genius-aze

收藏
Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/aznlp/genius-aze
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含阿塞拜疆音乐的全面歌词集合,旨在促进自然语言处理和机器学习研究,特别是针对阿塞拜疆语言的文本。数据包括歌曲标题、艺术家、专辑名称、发行年份和歌词。数据集来源于Genius社区,采用Apache-2.0许可证。

该数据集包含阿塞拜疆音乐的全面歌词集合,旨在促进自然语言处理和机器学习研究,特别是针对阿塞拜疆语言的文本。数据包括歌曲标题、艺术家、专辑名称、发行年份和歌词。数据集来源于Genius社区,采用Apache-2.0许可证。
提供机构:
aznlp
原始信息汇总

Azerbaijani Music Lyrics Dataset

概述

本数据集包含全面的阿塞拜疆音乐歌词,旨在促进阿塞拜疆语言文本的自然语言处理和机器学习研究。数据包括歌曲标题、艺术家、专辑名称、发行年份和歌词。

数据集详情

描述

  • 策划者: 数据来自Genius社区。
  • 语言: 阿塞拜疆语
  • 许可证: Apache-2.0

用途

  • 直接用途: 用于训练语言模型,分析阿塞拜疆音乐的文化和语言趋势,以及计算语言学的教育目的。
  • 超出范围的用途: 不适合用于语言和文化研究之外的用途,如未经版权持有者适当许可或授权的商业用途。

数据结构

  • 策划理由: 为阿塞拜疆语提供丰富的文本数据源,该语言相比其他许多语言资源较少,旨在增强阿塞拜疆语NLP应用的能力。
  • 源数据: 数据从Genius网站收集,确保了现代和经典阿塞拜疆音乐在各种流派中的多样性。

偏见、风险和限制

  • 用户应注意歌词中可能存在的偏见,这可能反映了它们所处的时代和文化、社会、政治背景。

引用

  • APA格式: 请引用此数据集为:“Azerbaijani Music Lyrics Dataset, Hugging Face Dataset Hub, 2024.”

联系信息

  • 联系邮箱: aznlp@outlook.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作