five

matlok/python-audio-copilot-training-using-import-knowledge-graphs

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-import-knowledge-graphs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是matlok python copilot数据集的一个子集,主要用于多模态Python Copilot训练。数据集中每个模块文件的每个唯一类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。数据集包含52,086行,大小为17.3 GB,数据类型为mp3,格式为使用两个声音叙述的alpaca问答。

该数据集是matlok python copilot数据集的一个子集,主要用于多模态Python Copilot训练。数据集中每个模块文件的每个唯一类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。数据集包含52,086行,大小为17.3 GB,数据类型为mp3,格式为使用两个声音叙述的alpaca问答。
提供机构:
matlok
原始信息汇总

Python Copilot Audio Training using Imports with Knowledge Graphs

数据集概述

  • 名称: python copilot audio training using imports with knowledge graphs
  • 许可证: other
  • 标签:
    • python-copilot
    • python-coding
    • python-architecture
    • knowledge-graphs
    • multimodal
    • text-image-audio
    • fine-tuning
    • training
    • question-answering
    • image-knowledge-graph
    • alpaca
    • mp3
    • png
    • text
    • instruct
    • imports
  • 任务类别:
    • text-to-audio
    • audio-to-audio
    • question-answering
  • 任务ID:
    • parsing

数据集详情

  • 配置名称: view_schema
  • 分割: view_schema
  • 数据文件:
    • 分割: view_schema
    • 路径: files/lok-python-copilot-audio.import-v1_00000274.parquet
  • 大小类别: 10K<n<100K

数据集内容

  • 行数: 52086
  • 大小: 17.3 GB
  • 数据类型: mp3
  • 格式: 使用两种声音叙述的alpaca问题和答案

数据集结构

  • 字段:
    • audio_path: string
    • audio_type: string
    • dbytes: binary
    • dbytes_len: int64
    • file_path: string
    • file_path_len: int64
    • lang: string
    • lang_len: int64
    • recsize: int64

使用方法

python from datasets import load_dataset

ds = load_dataset("matlok/python-audio-copilot-training-using-imports-knowledge-graphs", data_dir="files")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作