Sakshamrzt/IndicNLP-Marathi
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Sakshamrzt/IndicNLP-Marathi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本分类任务的马拉地语新闻数据集。数据集包含训练集和测试集,分别有2383和2384个样本。每个样本包含两个特征:news表示新闻文本,class表示类别标签。数据集的任务类别是文本分类,语言是马拉地语(mr)。
该数据集是一个用于文本分类任务的马拉地语新闻数据集。数据集包含训练集和测试集,分别有2383和2384个样本。每个样本包含两个特征:news表示新闻文本,class表示类别标签。数据集的任务类别是文本分类,语言是马拉地语(mr)。
提供机构:
Sakshamrzt
原始信息汇总
数据集概述
数据集信息
- 许可证: CC-BY-NC-4.0
配置信息
- 配置名称: train
- 特征:
- news: 类型为字符串
- class: 类型为int64
分割信息
- 训练集: 包含2383个样本
- 测试集: 包含2384个样本
文件路径
- 训练数据:
marathi-train.jsonl - 测试数据:
marathi-test.jsonl
任务类别
- 文本分类
语言
- 马拉地语 (mr)



