Sakshamrzt/IndicNLP-Gujarati
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Sakshamrzt/IndicNLP-Gujarati
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本分类任务的古吉拉特语数据集,包含训练集和测试集。训练集有1018个样本,测试集有1019个样本。每个样本包含两个特征:news(新闻文本)和class(类别)。数据集的文件格式为JSON Lines,分别存储在gujaratitrain.jsonl和gujaratitest.jsonl文件中。
该数据集是一个用于文本分类任务的古吉拉特语数据集,包含训练集和测试集。训练集有1018个样本,测试集有1019个样本。每个样本包含两个特征:news(新闻文本)和class(类别)。数据集的文件格式为JSON Lines,分别存储在gujaratitrain.jsonl和gujaratitest.jsonl文件中。
提供机构:
Sakshamrzt
原始信息汇总
数据集概述
数据集元数据
- 许可证: cc-by-nc-4.0
数据集配置
- 配置名称: train
数据集特征
- 特征名称: news
- 数据类型: string
- 特征名称: class
- 数据类型: int64
数据集分割
- 训练集:
- 样本数量: 1018
- 文件路径: gujaratitrain.jsonl
- 测试集:
- 样本数量: 1019
- 文件路径: gujaratitest.jsonl
任务类别
- 任务类型: text-classification
语言
- 语言: gu



