five

matlok/python-audio-copilot-training-using-function-knowledge-graphs

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-function-knowledge-graphs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Python Copilot Audio Training using Global Functions with Knowledge Graphs,是matlok python copilot数据集的一个子集。数据集包含全球函数的问答音频,每个问题由一个声音朗读,答案由另一个声音朗读,音频以mp3格式存储。数据集的行数为49910,大小为62.8 GB。数据集的模式包括音频路径、音频类型、二进制数据、文件路径、语言等字段。

该数据集名为Python Copilot Audio Training using Global Functions with Knowledge Graphs,是matlok python copilot数据集的一个子集。数据集包含全球函数的问答音频,每个问题由一个声音朗读,答案由另一个声音朗读,音频以mp3格式存储。数据集的行数为49910,大小为62.8 GB。数据集的模式包括音频路径、音频类型、二进制数据、文件路径、语言等字段。
提供机构:
matlok
原始信息汇总

Python Copilot Audio Training using Global Functions with Knowledge Graphs

数据集概述

  • 名称: python copilot audio training using global functions with knowledge graphs
  • 许可证: other
  • 配置名称: view_schema
  • 分割: view_schema
  • 数据文件路径: files/lok-python-copilot-audio.func-v1_00000095.parquet
  • 大小类别: 10K<n<100K
  • 标签:
    • python-copilot
    • python-coding
    • python-architecture
    • knowledge-graphs
    • multimodal
    • text-image-audio
    • fine-tuning
    • training
    • question-answering
    • image-knowledge-graph
    • alpaca
    • mp3
    • png
    • text
    • instruct
    • functions
    • global-functions
  • 支持的任务类别:
    • text-to-audio
    • audio-to-audio
    • question-answering
  • 支持的任务ID:
    • parsing

详细信息

  • 行数: 49910
  • 大小: 62.8 GB
  • 数据类型: mp3
  • 格式: 使用两种声音叙述的alpaca问题和答案

架构

json { "audio_path": "string", "audio_type": "string", "dbytes": "binary", "dbytes_len": "int64", "file_path": "string", "file_path_len": "int64", "lang": "string", "lang_len": "int64", "recsize": "int64" }

使用方法

python from datasets import load_dataset

ds = load_dataset("matlok/python-audio-copilot-training-using-functions-knowledge-graphs", data_dir="files")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作