matlok/python-audio-copilot-training-using-inheritance-knowledge-graphs
收藏Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-inheritance-knowledge-graphs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是matlok python copilot数据集的一个子集,名为Python Copilot Audio Training using Inheritance and Polymorphism Knowledge Graphs。数据集包含96874行数据,大小为29.9 GB,数据类型为mp3,格式为使用两种声音叙述的alpaca问题和答案。每个模块文件中每个唯一类的基础类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。这些mp3文件存储在parquet文件的dbytes列中,并关联了源代码的file_path标识符。
该数据集是matlok python copilot数据集的一个子集,名为Python Copilot Audio Training using Inheritance and Polymorphism Knowledge Graphs。数据集包含96874行数据,大小为29.9 GB,数据类型为mp3,格式为使用两种声音叙述的alpaca问题和答案。每个模块文件中每个唯一类的基础类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。这些mp3文件存储在parquet文件的dbytes列中,并关联了源代码的file_path标识符。
提供机构:
matlok
原始信息汇总
数据集概述
基本信息
- 名称: python copilot audio training using inheritance and polymorphism knowledge graphs
- 许可证: other
- 标签: python-copilot, python-coding, python-architecture, knowledge-graphs, multimodal, text-image-audio, fine-tuning, training, question-answering, image-knowledge-graph, alpaca, mp3, png, text, instruct, inheritance
数据集配置
- 配置名称: view_schema
- 分割: view_schema
- 数据文件路径: files/lok-python-copilot-audio.base-v1_00000291.parquet
数据集规模
- 大小类别: 10K<n<100K
支持的任务类别
- 任务类别: text-to-audio, audio-to-audio, question-answering
- 任务ID: parsing
数据集详情
- 行数: 96874
- 大小: 29.9 GB
- 数据类型: mp3
- 格式: 使用两种声音讲述的alpaca问题和答案
数据集架构
json { "audio_path": "string", "audio_type": "string", "dbytes": "binary", "dbytes_len": "int64", "file_path": "string", "file_path_len": "int64", "lang": "string", "lang_len": "int64", "recsize": "int64" }
使用方法
python from datasets import load_dataset
ds = load_dataset("matlok/python-audio-copilot-training-using-inheritance-knowledge-graphs", data_dir="files")



