matlok/python-audio-copilot-training-using-import-knowledge-graphs
收藏Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-import-knowledge-graphs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是matlok python copilot数据集的一个子集,主要用于多模态Python Copilot训练。数据集中每个模块文件的每个唯一类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。数据集包含52,086行,大小为17.3 GB,数据类型为mp3,格式为使用两个声音叙述的alpaca问答。
该数据集是matlok python copilot数据集的一个子集,主要用于多模态Python Copilot训练。数据集中每个模块文件的每个唯一类都有一个问题和答案的mp3文件,其中一个声音读取问题,另一个声音读取答案。数据集包含52,086行,大小为17.3 GB,数据类型为mp3,格式为使用两个声音叙述的alpaca问答。
提供机构:
matlok
原始信息汇总
Python Copilot Audio Training using Imports with Knowledge Graphs
数据集概述
- 名称: python copilot audio training using imports with knowledge graphs
- 许可证: other
- 标签:
- python-copilot
- python-coding
- python-architecture
- knowledge-graphs
- multimodal
- text-image-audio
- fine-tuning
- training
- question-answering
- image-knowledge-graph
- alpaca
- mp3
- png
- text
- instruct
- imports
- 任务类别:
- text-to-audio
- audio-to-audio
- question-answering
- 任务ID:
- parsing
数据集详情
- 配置名称: view_schema
- 分割: view_schema
- 数据文件:
- 分割: view_schema
- 路径: files/lok-python-copilot-audio.import-v1_00000274.parquet
- 大小类别: 10K<n<100K
数据集内容
- 行数: 52086
- 大小: 17.3 GB
- 数据类型: mp3
- 格式: 使用两种声音叙述的alpaca问题和答案
数据集结构
- 字段:
- audio_path: string
- audio_type: string
- dbytes: binary
- dbytes_len: int64
- file_path: string
- file_path_len: int64
- lang: string
- lang_len: int64
- recsize: int64
使用方法
python from datasets import load_dataset
ds = load_dataset("matlok/python-audio-copilot-training-using-imports-knowledge-graphs", data_dir="files")



