five

damerajee/short_text_audio

收藏
Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/damerajee/short_text_audio
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个主要特征字段:doc_id、text、type和short_text,其中short_text是一个字符串序列。数据集分为训练集,包含129个样本,总大小为38864233字节。数据集的下载大小为6711889字节,总数据集大小为38864233字节。配置信息指定了数据文件的路径为data/train-*。

The dataset includes four main feature fields: doc_id, text, type, and short_text, where short_text is a sequence of strings. The dataset is divided into a training set containing 129 samples, with a total size of 38864233 bytes. The download size of the dataset is 6711889 bytes, and the total dataset size is 38864233 bytes. The configuration information specifies the path to the data files as data/train-*.
提供机构:
damerajee
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • doc_id: 类型为 large_string
    • text: 类型为 large_string
    • type: 类型为 large_string
    • short_text: 类型为 string,且为序列类型

数据分割

  • 训练集:
    • 名称: train
    • 字节数: 38864233
    • 样本数: 129

数据集大小

  • 下载大小: 6711889 字节
  • 数据集大小: 38864233 字节

配置

  • 默认配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作