five

hobeter/JJQA

收藏
Hugging Face2023-11-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hobeter/JJQA
下载链接
链接失效反馈
官方服务:
资源简介:
JJQA是一个基于林俊杰歌曲歌词的中文问答数据集,旨在通过提供具有挑战性的问题和答案来测试大型语言模型(LLMs)的文本理解和推理能力。数据集包含648个问答对和181首相关歌曲的歌词。数据集分为三个部分:qa包含问答对及其相关信息,song包含歌曲的详细信息,song_index包含歌曲的索引信息,用于对齐问答对和相应的歌曲。
提供机构:
hobeter
原始信息汇总

数据集概述

数据集配置

  • qa:

    • 特征:
      • q: 问题,类型为字符串
      • a: 答案,类型为字符串
      • rf: 参考行,类型为字符串
      • song_title: 歌曲标题,类型为字符串
      • song_id: 歌曲ID,类型为字符串
      • id: Q&A的ID,类型为字符串
    • 分割:
      • train: 包含648个样本,大小为67824字节
    • 下载大小: 134589字节
    • 数据集大小: 67824字节
  • song:

    • 特征:
      • id: 歌曲ID,类型为字符串
      • title: 歌曲标题,类型为字符串
      • name: 歌曲名称,类型为字符串
      • lyric: 歌词,类型为字符串
    • 分割:
      • train: 包含181个样本,大小为253605字节
    • 下载大小: 276024字节
    • 数据集大小: 253605字节
  • song_index:

    • 特征:
      • dic: 字典,类型为字符串
    • 分割:
      • train: 包含1个样本,大小为2872字节
    • 下载大小: 4168字节
    • 数据集大小: 2872字节

许可证

  • apache-2.0

任务类别

  • question-answering

标签

  • music
  • art

大小类别

  • n<1K
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作