CCB/abstracts_and_tweets

Hugging Face2024-06-22 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/CCB/abstracts_and_tweets

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个主要特征：abstracts（摘要）、prompts（提示）和tweets（推文）。数据集分为训练集和验证集，训练集包含90个样本，验证集包含10个样本。总下载大小为218650字节，数据集总大小为346083字节。该数据集是通过DataDreamer工具生成的合成数据集。

This dataset includes three main features: abstracts, prompts, and tweets. It is divided into a training set with 90 examples and a validation set with 10 examples. The total download size is 218650 bytes, and the total dataset size is 346083 bytes. This dataset is a synthetic dataset generated using the DataDreamer tool.

提供机构：

CCB

原始信息汇总

数据集概述

数据集信息

特征:
- abstracts: 类型为 string
- prompts: 类型为 string
- tweets: 类型为 string
数据分割:
- train:
  - 字节数: 312660
  - 样本数: 90
- validation:
  - 字节数: 33423
  - 样本数: 10
下载大小: 218650 字节
数据集大小: 346083 字节

配置

配置名称: default
- 数据文件:
  - train: data/train-*
  - validation: data/validation-*

其他信息

库名称: datadreamer
大小类别: n<1K
标签:
- datadreamer
- datadreamer-0.28.0
- synthetic
- gpt-4

5,000+

优质数据集

54 个

任务类型

进入经典数据集