BEE-spoke-data/angle-UAE-pairs
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BEE-spoke-data/angle-UAE-pairs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于句子相似性和特征提取任务的文本对,每个文本对包含两个文本(text1和text2)和一个标签(label)。数据集分为训练集、验证集和测试集,分别包含1310368、50838和402690个示例。数据集大小为251468813字节,下载大小为168093774字节。数据集加载了四个包含Universal AnglE Embeddings对的数据集(multi_nli、snli、qqp、mrpc),但不包含qrecc数据集。数据集的语言为英语,许可证为odc-by。
该数据集包含用于句子相似性和特征提取任务的文本对,每个文本对包含两个文本(text1和text2)和一个标签(label)。数据集分为训练集、验证集和测试集,分别包含1310368、50838和402690个示例。数据集大小为251468813字节,下载大小为168093774字节。数据集加载了四个包含Universal AnglE Embeddings对的数据集(multi_nli、snli、qqp、mrpc),但不包含qrecc数据集。数据集的语言为英语,许可证为odc-by。
提供机构:
BEE-spoke-data
原始信息汇总
数据集概述
数据集信息
- 特征:
text1: 字符串类型text2: 字符串类型label: 64位整数类型
- 分割:
train: 189,307,831 字节, 1,310,368 样本validation: 6,859,317 字节, 50,838 样本test: 55,301,665 字节, 402,690 样本
- 下载大小: 168,093,774 字节
- 数据集大小: 251,468,813 字节
配置
- 默认配置:
train:data/train-*validation:data/validation-*test:data/test-*
许可
- 许可证: odc-by
任务类别
- 句子相似度
- 特征提取
语言
- 英语



