five

imvladikon/wikianswers_hebrew

收藏
Hugging Face2023-12-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/imvladikon/wikianswers_hebrew
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置项:lists和queries。lists配置项包含1214714个训练样本,每个样本包含记录ID、集合ID和文本信息。queries配置项包含49998个训练样本,每个样本包含查询ID和文本信息。数据集的任务类别是句子相似性,语言为希伯来语。
提供机构:
imvladikon
原始信息汇总

数据集概述

数据集配置

lists 配置

  • 特征:
    • record_id: 字符串类型
    • set_id: 字符串类型
    • text: 字符串类型
  • 分割:
    • train:
      • 字节数: 106926029
      • 样本数: 1214714
  • 下载大小: 39333908 字节
  • 数据集大小: 106926029 字节
  • 数据文件:
    • train: lists/train-*

queries 配置

  • 特征:
    • query_id: 字符串类型
    • text: 字符串类型
  • 分割:
    • train:
      • 字节数: 3759087
      • 样本数: 49998
  • 下载大小: 2172788 字节
  • 数据集大小: 3759087 字节
  • 数据文件:
    • train: queries/train-*

任务类别

  • 句子相似度

语言

  • 希伯来语
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作