gigant/tib_01
收藏Hugging Face2023-03-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gigant/tib_01
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: doi
dtype: string
- name: title
dtype: string
- name: url
dtype: string
- name: video_url
dtype: string
- name: license
dtype: string
- name: subject
dtype: string
- name: genre
dtype: string
- name: release_year
dtype: string
- name: author
dtype: string
- name: contributors
dtype: string
- name: abstract
dtype: string
- name: transcript
dtype: string
- name: transcript_segments
sequence:
- name: id
dtype: int32
- name: seek
dtype: int32
- name: start
dtype: float32
- name: end
dtype: float32
- name: text
dtype: string
- name: tokens
sequence: int32
- name: temperature
dtype: float32
- name: avg_logprob
dtype: float32
- name: compression_ratio
dtype: float32
- name: no_speech_prob
dtype: float32
- name: keyframes
sequence:
- name: slide
dtype: string
- name: frames
sequence: int32
- name: timestamp
sequence: float32
splits:
- name: train
num_bytes: 1074314815.9313533
num_examples: 9381
download_size: 513790688
dataset_size: 1074314815.9313533
---
# Dataset Card for "tib_01"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
gigant
原始信息汇总
数据集概述
特征信息
- doi: 字符串类型
- title: 字符串类型
- url: 字符串类型
- video_url: 字符串类型
- license: 字符串类型
- subject: 字符串类型
- genre: 字符串类型
- release_year: 字符串类型
- author: 字符串类型
- contributors: 字符串类型
- abstract: 字符串类型
- transcript: 字符串类型
- transcript_segments: 序列类型,包含以下子特征:
- id: 32位整数类型
- seek: 32位整数类型
- start: 32位浮点数类型
- end: 32位浮点数类型
- text: 字符串类型
- tokens: 32位整数序列类型
- temperature: 32位浮点数类型
- avg_logprob: 32位浮点数类型
- compression_ratio: 32位浮点数类型
- no_speech_prob: 32位浮点数类型
- keyframes: 序列类型,包含以下子特征:
- slide: 字符串类型
- frames: 32位整数序列类型
- timestamp: 32位浮点数序列类型
数据分割
- train: 包含9381个样本,占用1074314815.9313533字节
数据集大小
- 下载大小: 513790688字节
- 数据集大小: 1074314815.9313533字节



