five

imvladikon/qqp_he

收藏
Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/imvladikon/qqp_he
下载链接
链接失效反馈
官方服务:
资源简介:
数据集qqp_he是机器翻译(Google)的QQP语料库到希伯来语的版本。它包含成对的英语和希伯来语问题,以及它们的相似性标签和LABSE评分。数据集分为训练、验证和测试三个部分,分别包含359985、39998和329982个样本。

数据集qqp_he是机器翻译(Google)的QQP语料库到希伯来语的版本。它包含成对的英语和希伯来语问题,以及它们的相似性标签和LABSE评分。数据集分为训练、验证和测试三个部分,分别包含359985、39998和329982个样本。
提供机构:
imvladikon
原始信息汇总

数据集概述

数据集名称

"qqp_he"

数据集特征

  • question1: 字符串类型
  • question2: 字符串类型
  • label: 整数类型(int64)
  • idx: 整数类型(int64)
  • question1_he: 字符串类型
  • question2_he: 字符串类型
  • labse_score: 浮点数类型(float64)

数据集分割

  • 训练集: 359985个样本,118297851字节
  • 验证集: 39998个样本,13144351字节
  • 测试集: 329982个样本,109317000字节

数据集大小

  • 下载大小: 147357764字节
  • 数据集总大小: 240759202字节

任务类别

  • 句子相似度

语言

  • 希伯来语(he)
  • 英语(en)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作