crrodrvi/noticias_facil
收藏Hugging Face2024-06-26 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/crrodrvi/noticias_facil
下载链接
链接失效反馈官方服务:
资源简介:
该数据集设计用于将新闻文章段落分类为易读和难读两类。它包含4,128条记录,这些记录分别来自Planeta Fácil新闻文章(易读)和多种西班牙报纸(难读)。数据集被分为训练集、验证集和测试集。数据集包含两列:一列是新闻文章的文本,另一列是对应的标签,其中0表示难读新闻文章,1表示易读新闻文章。
该数据集设计用于将新闻文章段落分类为易读和难读两类。它包含4,128条记录,这些记录分别来自Planeta Fácil新闻文章(易读)和多种西班牙报纸(难读)。数据集被分为训练集、验证集和测试集。数据集包含两列:一列是新闻文章的文本,另一列是对应的标签,其中0表示难读新闻文章,1表示易读新闻文章。
提供机构:
crrodrvi
原始信息汇总
数据集概述
任务类别
- 文本分类
语言
- 西班牙语
数据规模
- 1K<n<10K
数据集描述
- 该数据集用于将新闻文章中的段落分类为易读和难读两类。
- 包含4,128条记录,提取自“Planeta Fácil”新闻文章(易读)和各种西班牙报纸(难读)。
- 数据集分为训练集、验证集和测试集。
数据结构
- 包含两列:
- 第一列:新闻文章的文本
- 第二列:对应的标签
- 标签分类:
- 0:难读的新闻文章
- 1:易读的新闻文章



