indiehackers/telugu_dataset

Name: indiehackers/telugu_dataset
Creator: indiehackers
Published: 2024-02-16 03:40:32
License: 暂无描述

Hugging Face2024-02-16 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/indiehackers/telugu_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个配置：telugu_asr、telugu_nlp和wikipedia。每个配置都有特定的特征和训练集分割，并提供了文件大小和示例数量的详细信息。数据集的来源包括Kaggle的Telugu NLP数据集、HuggingFace的Telugu ASR语料库和Wikimedia的Wikipedia Telugu数据集。这些数据集被整合成一个综合资源，用于泰卢固语自然语言处理任务。

提供机构：

indiehackers

原始信息汇总