Flaglab/spanish-corpus-xix

Name: Flaglab/spanish-corpus-xix
Creator: Flaglab
Published: 2024-09-23 04:02:30
License: 暂无描述

Hugging Face2024-09-23 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Flaglab/spanish-corpus-xix

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于19世纪西班牙语文本的语料库，包含报纸、书籍等多种类型的文本。数据集适用于多种自然语言处理任务，如填空、文本检索、文本分类等。数据集的大小在10万到1000万之间，来源包括扩展的BL书籍、拉丁美洲19世纪文本和古腾堡计划。

提供机构：

Flaglab

原始信息汇总

数据集概述

任务类别: 填充掩码、文本检索、文本分类
任务ID: 槽填充、掩码语言建模、文档检索、对话生成、多标签分类、实体链接分类、情感分类、语义相似度评分、语义相似度分类、情感评分、情感分析、主题分类、多输入文本分类、多类分类、仇恨言论检测

5,000+

优质数据集

54 个

任务类型

进入经典数据集