five

argilla/multi-modal

收藏
Hugging Face2023-11-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/multi-modal
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个多模态数据集,包含视频、音频和图像数据。视频数据来自UCF101子集,包含YouTube上的真实动作视频;音频数据来自中国民间音乐数据集,包含1分钟的音频片段;图像数据来自宝可梦图标数据集,包含宝可梦图像。数据集适用于多模态分类和转录任务。数据集结构包括字段、问题、建议、元数据和指南,可以通过Argilla或`datasets`库加载。
提供机构:
argilla
原始信息汇总

数据集概述

数据集描述

特征信息

  • content:

    • 名称: content
    • 数据类型: string
    • ID: field
  • description:

    • 列表:
      • 名称: user_id
        • 数据类型: string
        • ID: question
      • 名称: value
        • 数据类型: string
        • ID: suggestion
      • 名称: status
        • 数据类型: string
        • ID: question
  • description-suggestion:

    • 名称: description-suggestion
    • 数据类型: string
    • ID: suggestion
  • description-suggestion-metadata:

    • 结构:
      • 名称: type
        • 数据类型: string
        • ID: suggestion-metadata
      • 名称: score
        • 数据类型: float32
        • ID: suggestion-metadata
      • 名称: agent
        • 数据类型: string
        • ID: suggestion-metadata
  • quality:

    • 列表:
      • 名称: user_id
        • 数据类型: string
        • ID: question
      • 名称: value
        • 数据类型: int32
        • ID: suggestion
      • 名称: status
        • 数据类型: string
        • ID: question
  • quality-suggestion:

    • 名称: quality-suggestion
    • 数据类型: int32
    • ID: suggestion
  • quality-suggestion-metadata:

    • 结构:
      • 名称: type
        • 数据类型: string
        • ID: suggestion-metadata
      • 名称: score
        • 数据类型: float32
        • ID: suggestion-metadata
      • 名称: agent
        • 数据类型: string
        • ID: suggestion-metadata
  • age_group:

    • 列表:
      • 名称: user_id
        • 数据类型: string
        • ID: question
      • 名称: value
        • 数据类型: string
        • ID: suggestion
      • 名称: status
        • 数据类型: string
        • ID: question
  • age_group-suggestion:

    • 名称: age_group-suggestion
    • 数据类型: string
    • ID: suggestion
  • age_group-suggestion-metadata:

    • 结构:
      • 名称: type
        • 数据类型: string
        • ID: suggestion-metadata
      • 名称: score
        • 数据类型: float32
        • ID: suggestion-metadata
      • 名称: agent
        • 数据类型: string
        • ID: suggestion-metadata
  • external_id:

    • 名称: external_id
    • 数据类型: string
    • ID: external_id
  • metadata:

    • 名称: metadata
    • 数据类型: string
    • ID: metadata

数据分割

  • train:
    • 名称: train
    • 字节数: 76240752
    • 样本数: 60

数据集大小

  • 下载大小: 0
  • 数据集大小: 76240752

配置信息

  • default:
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作