five

tamago

收藏
Hugging Face2024-11-20 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/nyuuzyou/tamago
下载链接
链接失效反馈
官方服务:
资源简介:
Tamago Music Dataset包含来自tamastream.io平台的1,567首音乐的元数据,包括标题、描述、流派和用户互动,提供了对独立艺术家社区及其音乐的洞察。数据集是单语种的,所有元数据均为英文。数据集的结构包括多个字段,如track_id、track信息、用户信息、流派信息、标签、反应和评论等。数据集的所有内容都在一个单一的分组中。该数据集采用CC0许可证,允许任何用途的使用、修改和分发,无需许可或归属。

The Tamago Music Dataset contains metadata for 1,567 music tracks sourced from the tamastream.io platform, including track titles, descriptions, genres, and user interaction data, providing insights into independent artist communities and their musical works. This dataset is monolingual, with all metadata exclusively in English. Its structure includes multiple fields such as track_id, track information, user information, genre details, tags, reactions, and comments, with all content grouped into a single unified collection. This dataset is released under the CC0 license, which allows unrestricted use, modification, and distribution without the need for prior permission or attribution.
创建时间:
2024-11-20
原始信息汇总

Tamago Music Dataset

数据集概述

该数据集包含来自tamastream.io的1,567首音乐曲目的元数据,这是一个基于NEAR区块链的社区音乐流媒体平台。数据集包括详细的曲目元数据,如标题、描述、流派和用户互动,提供了对独立艺术家社区及其音乐的洞察。

语言

数据集是单语的:

  • 英语(en):所有元数据,包括标题、描述和标签。

数据结构

数据字段

每个曲目的元数据包括:

  • track_id:曲目的唯一标识符(整数)
  • data:包含曲目详细信息的对象:
    • track:主要曲目信息对象:
      • id:曲目标识符(整数)
      • title:曲目标题(字符串)
      • description:曲目内容的文本描述(字符串)
      • downloadDescription:下载相关描述(字符串或null)
      • duration:曲目时长(秒)(字符串)
      • downloadPrice:下载价格(null或数字)
      • downloadCount:下载次数(整数)
      • imageUrl:曲目封面图像的URL(字符串)
      • originalImageUrl:原始图像标识符(字符串)
      • playCount:播放次数(整数)
      • userId:创作者的用户ID(整数)
      • genreId:流派标识符(整数)
      • displayOrder:显示顺序(null或整数)
      • downloadFilename:下载文件名(字符串或null)
      • downloadContentType:下载内容类型(字符串或null)
      • trackStatus:曲目状态(字符串)
      • token:曲目标记(字符串或null)
      • tokenUserId:标记用户标识符(整数或null)
      • listing:列表信息(null或对象)
      • createdAt:创建时间戳(字符串)
      • updatedAt:最后更新时间戳(字符串)
      • User:用户对象,包含:
        • id:用户标识符(整数)
        • username:用户名(字符串)
        • nearAccount:NEAR区块链账户(字符串)
        • firstName:名字(字符串)
        • lastName:姓氏(字符串)
        • websiteUrl:网站URL(字符串)
        • avatarUrl:头像图像URL(字符串)
        • userRole:用户角色类型(字符串)
        • accountStatus:账户状态(字符串)
        • lastLoginAt:最后登录时间戳(字符串)
        • verifiedAt:验证时间戳(字符串或null)
        • createdAt:账户创建时间戳(字符串)
      • Genre:流派对象,包含:
        • id:流派标识符(整数)
        • name:流派名称(字符串)
        • parentId:父流派ID(整数或null)
        • iconId:图标标识符(整数)
        • createdAt:创建时间戳(字符串)
        • updatedAt:最后更新时间戳(字符串)
      • TagsForTrack:标签对象数组:
        • id:标签标识符(整数)
        • name:标签名称(字符串)
        • createdAt:标签创建时间戳(字符串)
        • TrackTags:曲目标签关系对象
      • Reactions:反应对象数组:
        • userId:用户标识符(整数)
        • trackId:曲目标识符(整数)
        • commentId:评论标识符(字符串)
        • referenceId:引用标识符(字符串)
        • referenceData:引用数据(null或对象)
        • reactionType:反应类型(字符串)
        • trackAt:曲目时间戳(字符串或null)
        • createdAt:反应创建时间戳(字符串)
        • User:反应者的用户信息对象
      • Comments:评论对象数组

数据分割

数据集按文件类型分为三个分割:

分割 实例数量
metadata 1,567
images 1,567
audios 1,567
  • metadata分割包含曲目信息和元数据的JSONL文件
  • images分割包含每个曲目的封面艺术图像
  • audios分割包含音乐曲目音频文件

每个分割对应相同的1,567首曲目,但按不同文件类型分开,以便于处理。

附加信息

许可证

该数据集根据Creative Commons Zero (CC0) 许可证公开到公共领域。这意味着您可以:

  • 用于任何目的,包括商业项目。
  • 随意修改。
  • 无需请求许可即可分发。 无需署名,但表示感谢! CC0许可证:https://creativecommons.org/publicdomain/zero/1.0/deed.en

数据集策展人

搜集汇总
数据集介绍
main_image_url
构建方式
Tamago音乐数据集源自基于NEAR区块链的社区音乐流媒体平台tamastream.io,涵盖了1,567首音乐曲目的元数据。数据集的构建过程包括从平台中提取详细的曲目信息,如标题、描述、流派和用户互动数据。这些数据经过结构化处理,分为元数据、图像和音频三个独立的分割,以便于后续的分析和应用。
特点
该数据集的特点在于其丰富的元数据信息,涵盖了每首曲目的详细描述、下载信息、播放次数、用户互动等。此外,数据集还包含了每首曲目的封面图像和音频文件,为研究者提供了多维度的分析素材。数据集的语言为英语,且所有数据均以JSONL格式存储,便于程序化处理和分析。
使用方法
使用Tamago音乐数据集时,研究者可以通过加载元数据文件获取每首曲目的详细信息,并结合图像和音频文件进行多模态分析。数据集的分割设计使得用户可以根据需求单独处理元数据、图像或音频数据。由于数据集采用CC0许可证,用户可以自由地将其应用于商业或非商业项目,且无需进行版权声明。
背景与挑战
背景概述
Tamago音乐数据集由社区驱动的音乐流媒体平台tamastream.io于近年创建,基于NEAR区块链技术,旨在为独立艺术家及其音乐作品提供详尽的元数据支持。该数据集包含1,567首音乐曲目的元数据,涵盖标题、描述、流派及用户互动信息,为研究独立音乐社区及其创作生态提供了宝贵资源。数据集的核心研究问题聚焦于如何通过区块链技术增强音乐作品的透明性与可追溯性,同时探索用户互动数据对音乐传播的影响。该数据集的出现,不仅为音乐信息检索、推荐系统等领域提供了新的研究素材,也为区块链技术在文化创意产业的应用开辟了新的研究方向。
当前挑战
Tamago音乐数据集在解决音乐信息检索与推荐系统领域的挑战时,面临多模态数据融合的复杂性。音乐曲目的元数据、封面图像及音频文件需要高效整合,以实现跨模态的检索与分析。此外,数据集的构建过程中,如何确保区块链数据的完整性与隐私保护成为关键难题。由于数据来源于社区平台,用户生成内容的多样性与质量参差不齐,增加了数据清洗与标注的难度。同时,如何在保证数据开放性的前提下,维护艺术家与用户的权益,也是数据集构建过程中不可忽视的挑战。
常用场景
经典使用场景
Tamago音乐数据集在音乐信息检索和推荐系统中具有广泛的应用。研究者可以利用该数据集中的音频文件、封面图像和详细的元数据,构建复杂的音乐分类模型,实现基于内容的音乐推荐。此外,该数据集还可用于研究用户行为分析,通过分析用户的播放次数、下载次数和评论,揭示独立艺术家社区的互动模式。
解决学术问题
Tamago音乐数据集为音乐信息学领域的研究提供了丰富的数据支持。它解决了音乐分类、音频特征提取和用户行为分析等关键问题。通过该数据集,研究者可以深入探索音乐与用户之间的互动关系,推动音乐推荐系统的算法优化。此外,数据集中的区块链相关数据还为研究去中心化音乐平台的经济模型提供了独特视角。
衍生相关工作
基于Tamago音乐数据集,研究者已开展了多项经典工作。例如,有研究利用该数据集开发了基于深度学习的音乐分类模型,显著提升了分类精度。此外,还有研究结合区块链技术,探索了去中心化音乐平台的用户激励机制。这些工作不仅推动了音乐信息学的发展,也为区块链技术在音乐产业的应用提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作