pierreguillou/lener_br_finetuning_language_model

Name: pierreguillou/lener_br_finetuning_language_model
Creator: pierreguillou
Published: 2022-10-25 09:54:32
License: 暂无描述

Hugging Face2022-10-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/pierreguillou/lener_br_finetuning_language_model

下载链接

链接失效反馈

官方服务：

资源简介：

LeNER-Br语言建模数据集是一个包含葡萄牙语法律文本的集合，源自LeNER-Br数据集。这些法律文本经过处理，创建了一个包含训练集和验证集（20%）的`DatasetDict`。该数据集允许微调BERTimbau等语言模型。数据集的语言为巴西葡萄牙语。

提供机构：

pierreguillou

原始信息汇总

数据集概述

LeNER-Br语言建模

LeNER-Br语言建模数据集是一个包含葡萄牙语法律文本的集合，源自LeNER-Br数据集。该数据集用于微调语言模型，如BERTimbau的base和large版本。

葡萄牙语（巴西）

python !pip install datasets from datasets import load_dataset

dataset = load_dataset("pierreguillou/lener_br_finetuning_language_model")

5,000+

优质数据集

54 个

任务类型

进入经典数据集