eswardivi/Tamil_MSA_Audio_Text

Name: eswardivi/Tamil_MSA_Audio_Text
Creator: eswardivi
Published: 2023-12-17 10:51:33
License: 暂无描述

Hugging Face2023-12-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/eswardivi/Tamil_MSA_Audio_Text

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Dravidianmultimodality，主要用于泰米尔语和马拉雅拉姆语的多模态情感分析。数据集包含音频、标签、文件路径和文本四个特征，其中标签分为Negative、Neutral和Positive三类。数据集分为一个训练集，包含64个样本，总大小为436903500字节。数据集的任务类别包括文本分类和音频分类，语言为泰米尔语，规模类别为小于1K。

Dravidianmultimodality is a dataset for multi-modal sentiment analysis in Tamil and Malayalam. It includes features such as Audio, label, FilePath, and Text, with the label feature containing three sentiment categories: Negative, Neutral, and Positive. The dataset is primarily used for text classification and audio classification tasks, with the language being Tamil.

提供机构：

eswardivi

原始信息汇总

数据集概述

数据集信息

特征

Audio: 音频数据
label: 标签数据，包含三个类别：
- 0: Negative
- 1: Neutral
- 2: Positive
FilePath: 文件路径，字符串类型
Text: 文本数据，字符串类型

数据分割

train: 训练集，包含64个样本，总字节数为436903500

数据大小

下载大小: 435262950字节
数据集大小: 436903500字节

配置

default: 默认配置，包含训练集文件路径为data/train-*

任务类别

文本分类
音频分类

语言

泰米尔语 (ta)

数据集规模

样本数小于1K

5,000+

优质数据集

54 个

任务类型

进入经典数据集