five

matlok/python-audio-copilot-training-using-class-knowledge-graphs-2024-01-27

收藏
Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/matlok/python-audio-copilot-training-using-class-knowledge-graphs-2024-01-27
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是matlok python copilot数据集的一个子集,专门用于使用知识图谱的类方法进行音频训练。数据集包含由两个不同声音叙述的问题和答案对,存储为mp3格式。每个类方法都有一个问题和答案的mp3文件,其中一个声音读出问题,另一个声音读出答案。数据集大小为284.6 GB,包含135496行,数据类型为mp3,格式为叙述的alpaca问题和答案对。

该数据集是matlok python copilot数据集的一个子集,专门用于使用知识图谱的类方法进行音频训练。数据集包含由两个不同声音叙述的问题和答案对,存储为mp3格式。每个类方法都有一个问题和答案的mp3文件,其中一个声音读出问题,另一个声音读出答案。数据集大小为284.6 GB,包含135496行,数据类型为mp3,格式为叙述的alpaca问题和答案对。
提供机构:
matlok
原始信息汇总

数据集概述

数据集名称

python copilot audio training using class with knowledge graphs collected on 2024-01-27

数据集配置

  • v1_train_transformers_src_and_pytorch
    • 分割: v1_train_transformers_src_and_pytorch
    • 文件路径: train/train_0001_transformers_src_and_pytorch.parquet
  • v2_train_text_generation_inference
    • 分割: v2_train_text_generation_inference
    • 文件路径: train/train_0002_text_generation_inference.parquet
  • v3_pytorch_distributed_fsdp
    • 分割: v3_pytorch_distributed_fsdp
    • 文件路径: train/train_0003_pytorch_fsdp.parquet
  • view_schema
    • 分割: view_schema
    • 文件路径: files/lok-python-copilot-audio.class-v1_00000717.parquet

数据集大小

  • 100K<n<1M

标签

  • python-copilot
  • python-coding
  • python-architecture
  • knowledge-graphs
  • multimodal
  • text-image-audio
  • fine-tuning
  • training
  • question-answering
  • image-knowledge-graph
  • alpaca
  • mp3
  • png
  • text
  • instruct
  • class
  • classes

支持的任务类别

  • text-to-audio
  • audio-to-audio
  • question-answering

支持的任务ID

  • parsing

数据集详情

  • 行数: 135496
  • 大小: 284.6 GB
  • 数据类型: mp3
  • 格式: 使用两种声音叙述的alpaca问题和答案对

数据集模式

json { "audio_path": "string", "audio_type": "string", "dbytes": "string", "dbytes_len": "int64", "file_path": "string", "file_path_len": "int64", "lang": "string", "lang_len": "int64", "recsize": "int64" }

如何使用数据集

python from datasets import load_dataset

ds = load_dataset("matlok/python-audio-copilot-training-using-class-knowledge-graphs-2024-01-27", data_dir="files")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作