jan-hq/instruction-speech-no-audio

Name: jan-hq/instruction-speech-no-audio
Creator: jan-hq
Published: 2024-06-25 09:16:29
License: 暂无描述

Hugging Face2024-06-25 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/jan-hq/instruction-speech-no-audio

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含四个主要字段：prompt（提示）、answer（回答）、tokens（标记序列）和sound_tokens（声音标记序列）。数据集仅包含一个训练集，该训练集包含444,678个示例，总大小为16,303,733,932字节。数据集的下载大小为1,586,874,603字节。默认配置下的数据文件路径为data/train-*。

The dataset contains four main fields: prompt, answer, tokens, and sound_tokens. The dataset includes only a training set, which contains 444,678 examples with a total size of 16,303,733,932 bytes. The download size of the dataset is 1,586,874,603 bytes. The data file path under the default configuration is data/train-*.

提供机构：

jan-hq

原始信息汇总

数据集概述

数据集信息

特征:
- prompt: 数据类型为字符串。
- answer: 数据类型为字符串。
- tokens: 数据类型为整数序列。
- sound_tokens: 数据类型为字符串序列。

数据分割

训练集:
- 名称: train
- 字节数: 16303733932
- 样本数: 444678

数据集大小

下载大小: 1586874603
数据集大小: 16303733932

配置

配置名称: default
- 数据文件:
  - 分割: train
  - 路径: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集