xbilek25/train_de_en_de_similar_injected_3st_1000

Name: xbilek25/train_de_en_de_similar_injected_3st_1000
Creator: xbilek25
Published: 2024-05-05 14:06:19
License: 暂无描述

Hugging Face2024-05-05 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/xbilek25/train_de_en_de_similar_injected_3st_1000

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: client_id dtype: string - name: path dtype: string - name: audio dtype: audio: sampling_rate: 48000 - name: sentence dtype: string - name: up_votes dtype: int64 - name: down_votes dtype: int64 - name: age dtype: string - name: gender dtype: string - name: accent dtype: string - name: locale dtype: string - name: segment dtype: string splits: - name: train num_bytes: 628197601.0 num_examples: 1000 download_size: 543803076 dataset_size: 628197601.0 --- # Dataset Card for "train_de_en_de_similar_injected_3st_1000" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

dataset_info: 数据集信息： features: - name: 客户端ID（client_id） dtype: 字符串（string） - name: 文件路径（path） dtype: 字符串（string） - name: 音频（audio） dtype: audio: 采样率（sampling_rate）: 48000 - name: 语音转录句子（sentence） dtype: 字符串（string） - name: 赞成票数（up_votes） dtype: 64位整数（int64） - name: 反对票数（down_votes） dtype: 64位整数（int64） - name: 年龄（age） dtype: 字符串（string） - name: 性别（gender） dtype: 字符串（string） - name: 口音（accent） dtype: 字符串（string） - name: 语言区域（locale） dtype: 字符串（string） - name: 语音片段（segment） dtype: 字符串（string） splits: - name: 训练集（train） num_bytes: 628197601.0 num_examples: 1000 download_size: 543803076 dataset_size: 628197601.0 --- # "train_de_en_de_similar_injected_3st_1000"数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

xbilek25

原始信息汇总

数据集概述

数据集名称

名称: train_de_en_de_similar_injected_3st_1000

数据集特征

client_id: 数据类型为字符串。
path: 数据类型为字符串。
audio: 数据类型为音频，采样率为48000。
sentence: 数据类型为字符串。
up_votes: 数据类型为int64。
down_votes: 数据类型为int64。
age: 数据类型为字符串。
gender: 数据类型为字符串。
accent: 数据类型为字符串。
locale: 数据类型为字符串。
segment: 数据类型为字符串。

数据集拆分

train: 包含1000个样本，数据集大小为628197601.0字节。

数据集大小

下载大小: 543803076字节
数据集大小: 628197601.0字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集