eswardivi/Tamil_MSA_Audio_Text
收藏Hugging Face2023-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eswardivi/Tamil_MSA_Audio_Text
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Dravidianmultimodality,主要用于泰米尔语和马拉雅拉姆语的多模态情感分析。数据集包含音频、标签、文件路径和文本四个特征,其中标签分为Negative、Neutral和Positive三类。数据集分为一个训练集,包含64个样本,总大小为436903500字节。数据集的任务类别包括文本分类和音频分类,语言为泰米尔语,规模类别为小于1K。
Dravidianmultimodality is a dataset for multi-modal sentiment analysis in Tamil and Malayalam. It includes features such as Audio, label, FilePath, and Text, with the label feature containing three sentiment categories: Negative, Neutral, and Positive. The dataset is primarily used for text classification and audio classification tasks, with the language being Tamil.
提供机构:
eswardivi
原始信息汇总
数据集概述
数据集信息
特征
- Audio: 音频数据
- label: 标签数据,包含三个类别:
0: Negative1: Neutral2: Positive
- FilePath: 文件路径,字符串类型
- Text: 文本数据,字符串类型
数据分割
- train: 训练集,包含64个样本,总字节数为436903500
数据大小
- 下载大小: 435262950字节
- 数据集大小: 436903500字节
配置
- default: 默认配置,包含训练集文件路径为
data/train-*
任务类别
- 文本分类
- 音频分类
语言
- 泰米尔语 (ta)
数据集规模
- 样本数小于1K



