polinaeterna/test_index
收藏Hugging Face2024-05-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/polinaeterna/test_index
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: audio
dtype:
audio:
decode: false
- name: duration_ms
dtype: int32
- name: transcription
dtype: string
- name: transcription_null
dtype: string
- name: audio_null
dtype:
audio:
decode: false
- name: image
dtype: image
- name: image_null
dtype:
image:
decode: false
- name: text
dtype: string
- name: dump
dtype: string
- name: url
dtype: string
- name: date
dtype: string
- name: file_path
dtype: string
- name: language
dtype:
class_label:
names:
'0': en
'1': other
- name: language_score
dtype: float64
- name: token_count
dtype: int64
- name: language_null
dtype:
class_label:
names:
'0': en
'1': other
- name: language_score_null
dtype: float64
- name: token_count_null
dtype: int64
splits:
- name: train
num_bytes: 3857610358.9
num_examples: 12300
download_size: 3765439616
dataset_size: 3857610358.9
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
polinaeterna
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- audio: 音频类型,解码:否
- duration_ms: 整数类型(int32)
- transcription: 字符串类型
- transcription_null: 字符串类型
- audio_null: 音频类型,解码:否
- image: 图像类型
- image_null: 图像类型,解码:否
- text: 字符串类型
- dump: 字符串类型
- url: 字符串类型
- date: 字符串类型
- file_path: 字符串类型
- language: 分类标签类型,标签名:0: en, 1: other
- language_score: 浮点数类型(float64)
- token_count: 整数类型(int64)
- language_null: 分类标签类型,标签名:0: en, 1: other
- language_score_null: 浮点数类型(float64)
- token_count_null: 整数类型(int64)
数据集分割
- train:
- 数据量: 3857610358.9 字节
- 示例数: 12300
数据集大小
- 下载大小: 3765439616 字节
- 数据集大小: 3857610358.9 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



