imvladikon/qqp_he
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/imvladikon/qqp_he
下载链接
链接失效反馈官方服务:
资源简介:
数据集qqp_he是机器翻译(Google)的QQP语料库到希伯来语的版本。它包含成对的英语和希伯来语问题,以及它们的相似性标签和LABSE评分。数据集分为训练、验证和测试三个部分,分别包含359985、39998和329982个样本。
数据集qqp_he是机器翻译(Google)的QQP语料库到希伯来语的版本。它包含成对的英语和希伯来语问题,以及它们的相似性标签和LABSE评分。数据集分为训练、验证和测试三个部分,分别包含359985、39998和329982个样本。
提供机构:
imvladikon
原始信息汇总
数据集概述
数据集名称
"qqp_he"
数据集特征
- question1: 字符串类型
- question2: 字符串类型
- label: 整数类型(int64)
- idx: 整数类型(int64)
- question1_he: 字符串类型
- question2_he: 字符串类型
- labse_score: 浮点数类型(float64)
数据集分割
- 训练集: 359985个样本,118297851字节
- 验证集: 39998个样本,13144351字节
- 测试集: 329982个样本,109317000字节
数据集大小
- 下载大小: 147357764字节
- 数据集总大小: 240759202字节
任务类别
- 句子相似度
语言
- 希伯来语(he)
- 英语(en)



