huggingartists/mnogoznaal

Name: huggingartists/mnogoznaal
Creator: huggingartists
Published: 2022-10-25 09:39:19
License: 暂无描述

Hugging Face2022-10-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/huggingartists/mnogoznaal

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含从Genius解析的歌词数据，旨在用于生成歌词。数据集大小为0.210071 MB，包含88个训练样本，数据字段为text，表示歌词文本。数据集的使用方法、结构、创建过程、使用考虑因素、附加信息等部分在README中有所描述，但部分信息如任务支持、语言生产者、注释过程等未提供详细信息。

提供机构：

huggingartists

原始信息汇总

加载数据集: python from datasets import load_dataset dataset = load_dataset("huggingartists/mnogoznaal")

数据来源: 从Genius解析的歌词数据。
数据集分割: 可通过以下代码进行分割： python from datasets import load_dataset, Dataset, DatasetDict import numpy as np

datasets = load_dataset("huggingartists/mnogoznaal")

train_percentage = 0.9 validation_percentage = 0.07 test_percentage = 0.03

train, validation, test = np.split(datasets[train][text], [int(len(datasets[train][text])train_percentage), int(len(datasets[train][text])(train_percentage + validation_percentage))])

datasets = DatasetDict( { train: Dataset.from_dict({text: list(train)}), validation: Dataset.from_dict({text: list(validation)}), test: Dataset.from_dict({text: list(test)}) } )

5,000+

优质数据集

54 个

任务类型

进入经典数据集