davanstrien/Haiku_Dataset

Name: davanstrien/Haiku_Dataset
Creator: davanstrien
Published: 2024-03-22 13:39:57
License: 暂无描述

Hugging Face2024-03-22 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/davanstrien/Haiku_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Haiku Dataset，主要用于文本生成任务。数据集包含两个特征：haiku和source，分别存储俳句文本和来源信息。数据集分为一个训练集，包含144,123个样本，总大小为11,725,740字节。数据集的语言为英语，许可证为CC-BY-4.0。

提供机构：

davanstrien

原始信息汇总

数据集概述

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是一个英文俳句集合，包含约14.4万条文本数据，适用于文本生成任务。数据以parquet格式存储，遵循CC BY 4.0开放许可证，来源主要为tempslibres等平台，特点是专注于短诗形式的自然语言处理应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集