five

cjaniake/squad_v2_pt

收藏
Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cjaniake/squad_v2_pt
下载链接
链接失效反馈
官方服务:
资源简介:
SQuAD2.0_PT数据集是SQuAD2.0的葡萄牙语版本,主要用于问答任务。数据集包含id、title、context、question、is_impossible、answers和plausible_answers等特征。数据集的大小在100K到1M之间,包含训练集和验证集。数据集的创建是通过众包完成的,语言为英语,许可证为Apache-2.0。

SQuAD2.0_PT数据集是SQuAD2.0的葡萄牙语版本,主要用于问答任务。数据集包含id、title、context、question、is_impossible、answers和plausible_answers等特征。数据集的大小在100K到1M之间,包含训练集和验证集。数据集的创建是通过众包完成的,语言为英语,许可证为Apache-2.0。
提供机构:
cjaniake
原始信息汇总

数据集概述

基本信息

  • 数据集名称: SQuAD2.0_PT
  • 语言: 英语
  • 许可证: Apache 2.0
  • 多语言性: 单语种
  • 数据集大小: 100K<n<1M
  • 源数据集: squad_v2

任务类型

  • 任务类别: 问答
  • 任务ID:
    • 开放域问答
    • 抽取式问答

数据集配置

  • 配置名称: squad_v2
  • 训练评估索引:
    • 任务: 问答
    • 任务ID: 抽取式问答
    • 分割:
      • 训练分割: train
      • 评估分割: validation
    • 列映射:
      • 问题: question
      • 上下文: context
      • 答案:
        • 文本: text
        • 答案开始: answer_start
    • 评估指标:
      • 类型: squad_v2
      • 名称: SQuAD v2

数据集信息

  • 特征:
    • id: 字符串
    • 标题: 字符串
    • 上下文: 字符串
    • 问题: 字符串
    • 是否不可能: 布尔值
    • 答案:
      • 文本: 字符串
      • 答案开始: 整数32位
    • 合理答案:
      • 文本: 字符串
      • 答案开始: 整数32位
  • 分割:
    • 训练:
      • 字节数: 46442822
      • 示例数: 130319
    • 验证:
      • 字节数: 3869431
      • 示例数: 11873
  • 下载大小: 46494161
  • 数据集大小: 128360252
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作