five

crrodrvi/noticias_facil

收藏
Hugging Face2024-06-26 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/crrodrvi/noticias_facil
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集设计用于将新闻文章段落分类为易读和难读两类。它包含4,128条记录,这些记录分别来自Planeta Fácil新闻文章(易读)和多种西班牙报纸(难读)。数据集被分为训练集、验证集和测试集。数据集包含两列:一列是新闻文章的文本,另一列是对应的标签,其中0表示难读新闻文章,1表示易读新闻文章。

该数据集设计用于将新闻文章段落分类为易读和难读两类。它包含4,128条记录,这些记录分别来自Planeta Fácil新闻文章(易读)和多种西班牙报纸(难读)。数据集被分为训练集、验证集和测试集。数据集包含两列:一列是新闻文章的文本,另一列是对应的标签,其中0表示难读新闻文章,1表示易读新闻文章。
提供机构:
crrodrvi
原始信息汇总

数据集概述

任务类别

  • 文本分类

语言

  • 西班牙语

数据规模

  • 1K<n<10K

数据集描述

  • 该数据集用于将新闻文章中的段落分类为易读和难读两类。
  • 包含4,128条记录,提取自“Planeta Fácil”新闻文章(易读)和各种西班牙报纸(难读)。
  • 数据集分为训练集、验证集和测试集。

数据结构

  • 包含两列:
    • 第一列:新闻文章的文本
    • 第二列:对应的标签
  • 标签分类:
    • 0:难读的新闻文章
    • 1:易读的新闻文章
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作