Santp98/sentences_triplets_secop2_splits
收藏Hugging Face2023-11-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Santp98/sentences_triplets_secop2_splits
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: segment_code_pos
dtype: string
- name: segment_code_neg
dtype: string
- name: anchor_sent
dtype: string
- name: positive_sent
dtype: string
- name: negative_sent
dtype: string
splits:
- name: train
num_bytes: 389514845.59367234
num_examples: 552087
- name: test
num_bytes: 83467920.46898298
num_examples: 118305
- name: validation
num_bytes: 83467214.93734469
num_examples: 118304
download_size: 313920558
dataset_size: 556449981.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
提供机构:
Santp98
原始信息汇总
数据集信息
特征
- segment_code_pos: 数据类型为字符串
- segment_code_neg: 数据类型为字符串
- anchor_sent: 数据类型为字符串
- positive_sent: 数据类型为字符串
- negative_sent: 数据类型为字符串
数据分割
- 训练集
- 字节数: 389514845.59367234
- 样本数: 552087
- 测试集
- 字节数: 83467920.46898298
- 样本数: 118305
- 验证集
- 字节数: 83467214.93734469
- 样本数: 118304
数据大小
- 下载大小: 313920558 字节
- 数据集大小: 556449981.0 字节
配置
- 默认配置
- 训练集: data/train-*
- 测试集: data/test-*
- 验证集: data/validation-*



