iamroot/stsb-contrastive-axes
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/iamroot/stsb-contrastive-axes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是基于Glue-STSB数据集的扩展版本,包含了对比轴(Contrastive Axes)的信息。每一条记录包含一对句子(text_a和text_b),以及一个提示(prompt),用于指示这对句子在某个维度上的相似性或差异性。数据集还包含了由`sentence-transformers`生成的嵌入向量(embeddings)。标签(label)是机器生成的。数据集分为训练集和测试集,分别包含23388和5847个样本。
提供机构:
iamroot
原始信息汇总
Glue-STSB with Contrastive Axes 数据集概述
数据集配置
- 默认配置:
- 训练数据:
- 路径:
data/train-*
- 路径:
- 测试数据:
- 路径:
data/test-*
- 路径:
- 训练数据:
数据集信息
-
特征:
text_a_embedding:序列类型,数据类型为float32text_b_embedding:序列类型,数据类型为float32prompt_embedding:序列类型,数据类型为float32text_a:字符串类型text_b:字符串类型prompt:字符串类型label:整数类型,数据类型为int64
-
数据分割:
- 训练集:
- 字节数:219575612.0
- 样本数:23388
- 测试集:
- 字节数:54893903.0
- 样本数:5847
- 训练集:
-
数据集大小:
- 下载大小:311913820
- 数据集大小:274469515.0
数据集格式
- 数据集包含一对句子以及一个提示,用于表示句子之间的相似性或差异性。
- 包含由
sentence-transformers生成的嵌入向量。 text_a和text_b来自Glue-STSB数据集,prompt和label由机器生成。



