five

matlok/python-audio-copilot-training-using-inheritance-knowledge-graphs

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-inheritance-knowledge-graphs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是matlok python copilot数据集的一个子集,名为Python Copilot Audio Training using Inheritance and Polymorphism Knowledge Graphs。数据集包含96874行数据,大小为29.9 GB,数据类型为mp3,格式为使用两种声音叙述的alpaca问题和答案。每个模块文件中每个唯一类的基础类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。这些mp3文件存储在parquet文件的dbytes列中,并关联了源代码的file_path标识符。

该数据集是matlok python copilot数据集的一个子集,名为Python Copilot Audio Training using Inheritance and Polymorphism Knowledge Graphs。数据集包含96874行数据,大小为29.9 GB,数据类型为mp3,格式为使用两种声音叙述的alpaca问题和答案。每个模块文件中每个唯一类的基础类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。这些mp3文件存储在parquet文件的dbytes列中,并关联了源代码的file_path标识符。
提供机构:
matlok
原始信息汇总

数据集概述

基本信息

  • 名称: python copilot audio training using inheritance and polymorphism knowledge graphs
  • 许可证: other
  • 标签: python-copilot, python-coding, python-architecture, knowledge-graphs, multimodal, text-image-audio, fine-tuning, training, question-answering, image-knowledge-graph, alpaca, mp3, png, text, instruct, inheritance

数据集配置

  • 配置名称: view_schema
  • 分割: view_schema
  • 数据文件路径: files/lok-python-copilot-audio.base-v1_00000291.parquet

数据集规模

  • 大小类别: 10K<n<100K

支持的任务类别

  • 任务类别: text-to-audio, audio-to-audio, question-answering
  • 任务ID: parsing

数据集详情

  • 行数: 96874
  • 大小: 29.9 GB
  • 数据类型: mp3
  • 格式: 使用两种声音讲述的alpaca问题和答案

数据集架构

json { "audio_path": "string", "audio_type": "string", "dbytes": "binary", "dbytes_len": "int64", "file_path": "string", "file_path_len": "int64", "lang": "string", "lang_len": "int64", "recsize": "int64" }

使用方法

python from datasets import load_dataset

ds = load_dataset("matlok/python-audio-copilot-training-using-inheritance-knowledge-graphs", data_dir="files")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作