jjz5463/full_set_features_3.0
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/jjz5463/full_set_features_3.0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成数据集,包含3500个示例,主要用于训练目的。每个示例包含多个属性,如长度、观点、句子类型、时态和主题,以及正面和负面文本。数据集是通过DataDreamer工具使用GPT-4生成的,总大小为1259555字节,下载大小为667281字节。
样本规模类别(size_categories):1000 < 样本量 < 10000
dataset_info: 数据集信息(dataset_info):
features: 特征项(features):
- 字段名(name):属性(attributes),结构体(struct)包含:
- 字段名(name):长度(length),数据类型(dtype):字符串(string)
- 字段名(name):视角(point_of_view),数据类型(dtype):字符串(string)
- 字段名(name):句子类型(sentence_type),数据类型(dtype):字符串(string)
- 字段名(name):时态(tense),数据类型(dtype):字符串(string)
- 字段名(name):主题(topic),数据类型(dtype):字符串(string)
- 字段名(name):正向文本(positive),数据类型(dtype):字符串(string)
- 字段名(name):负向文本(negative),数据类型(dtype):字符串(string)
- 字段名(name):特征(feature),数据类型(dtype):字符串(string)
splits: 数据划分(splits):
- 字段名(name):训练集(train),字节数(num_bytes):1259555,样本量(num_examples):3500
download_size: 下载大小(download_size):667281
dataset_size: 数据集总大小(dataset_size):1259555
configs: 配置项(configs):
- 配置名称(config_name):默认(default),数据文件(data_files):
- 划分(split):训练集(train),路径(path):data/train-*
library_name: 依赖库名称(library_name):DataDreamer(datadreamer)
tags: 标签(tags):
- DataDreamer(datadreamer)
- DataDreamer-0.25.0(datadreamer-0.25.0)
- 合成数据集(synthetic)
- GPT-4(gpt-4)
# 数据集卡片(Dataset Card)
[可在此处补充更多信息](https://huggingface.co/datasets/templates/dataset-card-example)
---
本数据集由[DataDreamer 🤖💤](https://datadreamer.dev)生成。该合成数据集(synthetic)的数据集卡片可于[此处](datadreamer.json)查阅。
提供机构:
jjz5463
原始信息汇总
数据集概述
数据集大小
- 数据集大小:1259555 字节
- 下载大小:667281 字节
- 样本数量:3500
数据集特征
- attributes:
- length: 字符串类型
- point_of_view: 字符串类型
- sentence_type: 字符串类型
- tense: 字符串类型
- topic: 字符串类型
- positive: 字符串类型
- negative: 字符串类型
- feature: 字符串类型
数据集配置
- 配置名称: default
- 数据文件:
- split: train
- 路径: data/train-*
标签
- datadreamer
- datadreamer-0.25.0
- synthetic
- gpt-4



