BEE-spoke-data/falcon-refinedweb-100k_en_med-sample

Name: BEE-spoke-data/falcon-refinedweb-100k_en_med-sample
Creator: BEE-spoke-data
Published: 2024-02-05 00:20:53
License: 暂无描述

Hugging Face2024-02-05 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/BEE-spoke-data/falcon-refinedweb-100k_en_med-sample

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是从tiiuae/falcon-refinedweb中抽取的样本，包含10万条英文文本，每条文本的token数量在512到8192之间。数据集主要用于文本生成任务，并提供了两种配置：默认配置和包含文本嵌入的配置。

提供机构：

BEE-spoke-data

原始信息汇总

数据集概述

5,000+

优质数据集

54 个

任务类型

进入经典数据集