damerajee/short_text_audio
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/damerajee/short_text_audio
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征字段:doc_id、text、type和short_text,其中short_text是一个字符串序列。数据集分为训练集,包含129个样本,总大小为38864233字节。数据集的下载大小为6711889字节,总数据集大小为38864233字节。配置信息指定了数据文件的路径为data/train-*。
The dataset includes four main feature fields: doc_id, text, type, and short_text, where short_text is a sequence of strings. The dataset is divided into a training set containing 129 samples, with a total size of 38864233 bytes. The download size of the dataset is 6711889 bytes, and the total dataset size is 38864233 bytes. The configuration information specifies the path to the data files as data/train-*.
提供机构:
damerajee
原始信息汇总
数据集概述
数据集信息
- 特征:
doc_id: 类型为large_stringtext: 类型为large_stringtype: 类型为large_stringshort_text: 类型为string,且为序列类型
数据分割
- 训练集:
- 名称:
train - 字节数: 38864233
- 样本数: 129
- 名称:
数据集大小
- 下载大小: 6711889 字节
- 数据集大小: 38864233 字节
配置
- 默认配置:
- 配置名称:
default - 数据文件:
- 分割:
train - 路径:
data/train-*
- 分割:
- 配置名称:



