matlok/python-audio-copilot-training-using-function-knowledge-graphs
收藏Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-function-knowledge-graphs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Python Copilot Audio Training using Global Functions with Knowledge Graphs,是matlok python copilot数据集的一个子集。数据集包含全球函数的问答音频,每个问题由一个声音朗读,答案由另一个声音朗读,音频以mp3格式存储。数据集的行数为49910,大小为62.8 GB。数据集的模式包括音频路径、音频类型、二进制数据、文件路径、语言等字段。
该数据集名为Python Copilot Audio Training using Global Functions with Knowledge Graphs,是matlok python copilot数据集的一个子集。数据集包含全球函数的问答音频,每个问题由一个声音朗读,答案由另一个声音朗读,音频以mp3格式存储。数据集的行数为49910,大小为62.8 GB。数据集的模式包括音频路径、音频类型、二进制数据、文件路径、语言等字段。
提供机构:
matlok
原始信息汇总
Python Copilot Audio Training using Global Functions with Knowledge Graphs
数据集概述
- 名称: python copilot audio training using global functions with knowledge graphs
- 许可证: other
- 配置名称: view_schema
- 分割: view_schema
- 数据文件路径: files/lok-python-copilot-audio.func-v1_00000095.parquet
- 大小类别: 10K<n<100K
- 标签:
- python-copilot
- python-coding
- python-architecture
- knowledge-graphs
- multimodal
- text-image-audio
- fine-tuning
- training
- question-answering
- image-knowledge-graph
- alpaca
- mp3
- png
- text
- instruct
- functions
- global-functions
- 支持的任务类别:
- text-to-audio
- audio-to-audio
- question-answering
- 支持的任务ID:
- parsing
详细信息
- 行数: 49910
- 大小: 62.8 GB
- 数据类型: mp3
- 格式: 使用两种声音叙述的alpaca问题和答案
架构
json { "audio_path": "string", "audio_type": "string", "dbytes": "binary", "dbytes_len": "int64", "file_path": "string", "file_path_len": "int64", "lang": "string", "lang_len": "int64", "recsize": "int64" }
使用方法
python from datasets import load_dataset
ds = load_dataset("matlok/python-audio-copilot-training-using-functions-knowledge-graphs", data_dir="files")



