DigiGreen/Agri_STT_Benchmarking_Dataset

Name: DigiGreen/Agri_STT_Benchmarking_Dataset
Creator: DigiGreen
Published: 2026-04-15 10:00:22
License: 暂无描述

Hugging Face2026-04-15 更新2026-02-07 收录

下载链接：

https://hf-mirror.com/datasets/DigiGreen/Agri_STT_Benchmarking_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个特定领域的多语言农业语音数据集，主要关注印地语、泰卢固语和奥里亚语，专为语音转文本和自动语音识别任务设计。数据集包含人工标注的转录文本，旨在为现实农业场景中的ASR模型性能提供基准测试。

This is a domain-specific, multilingual agricultural speech dataset with a primary focus on Hindi, Telugu, Oriya designed for speech-to-text and automatic speech recognition tasks, featuring human-annotated transcriptions and intended for benchmarking ASR model performance in real-world agricultural scenarios.

提供机构：

DigiGreen

5,000+

优质数据集

54 个

任务类型

进入经典数据集