SynthSTEL/styledistance_training_triplets
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/SynthSTEL/styledistance_training_triplets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个合成数据集,通过DataDreamer工具生成。数据集包含320,400个训练样本,总大小为119,257,864字节。数据集的特征包括anchor、positive、negative、feature和feature_clean,均为字符串类型。
This dataset is produced by DataDreamer and is a synthetic dataset. The dataset size ranges between 100K and 1M. It includes five features: anchor, positive, negative, feature, and feature_clean, all of which are string types. The dataset is divided into a training set with 320400 samples, totaling 119257864 bytes.
提供机构:
SynthSTEL
原始信息汇总
数据集概述
数据集大小
- 数据集大小:119,257,864 字节
- 下载大小:24,834,800 字节
数据集特征
- 特征名称:anchor
- 数据类型:string
- 特征名称:positive
- 数据类型:string
- 特征名称:negative
- 数据类型:string
- 特征名称:feature
- 数据类型:string
- 特征名称:feature_clean
- 数据类型:string
数据集分割
- 分割名称:train
- 字节数:119,257,864
- 样本数:320,400
配置信息
- 配置名称:default
- 数据文件路径:data/train-*
标签
- datadreamer
- datadreamer-0.20.0
- synthetic



