Akash190104/kannada_news_classification
收藏Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Akash190104/kannada_news_classification
下载链接
链接失效反馈官方服务:
资源简介:
卡纳达语新闻数据集仅包含新闻文章的标题,分为三个类别:娱乐、科技和体育。该数据集包含约6300条从卡纳达语新闻网站收集的新闻标题,并已进行清理。数据集包含训练集和测试集,可用于卡纳达语主题分类模型的基准测试。
卡纳达语新闻数据集仅包含新闻文章的标题,分为三个类别:娱乐、科技和体育。该数据集包含约6300条从卡纳达语新闻网站收集的新闻标题,并已进行清理。数据集包含训练集和测试集,可用于卡纳达语主题分类模型的基准测试。
提供机构:
Akash190104
原始信息汇总
数据集概述
数据集名称
kannada_news
数据集摘要
该数据集包含约6300条来自Kannada新闻网站的新闻标题,分为娱乐、科技和体育三个类别。数据集已清洗,并包含训练和测试集,可用于基准测试Kannada语的话题分类模型。
语言
Kannada (kn)
数据集结构
数据实例
数据集中的每个实例包含以下两个字段:
- headline: Kannada语的新闻标题(字符串类型)
- label: 对应的类别标签,用英语表示(字符串类型)
数据字段
- headline: 字符串类型
- label: 字符串类型
数据分割
- 训练集: 包含6460个样本,数据大小为1241016字节
数据集大小
- 下载大小: 531064字节
- 数据集大小: 1241016字节
任务类别
- 文本分类
大小类别
- 1K<n<10K



