five

nunorc/squad_v1_pt

收藏
Hugging Face2024-07-17 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/nunorc/squad_v1_pt
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是SQuAD数据集的葡萄牙语翻译版本,使用Google Cloud API自动翻译。数据集主要用于问答任务,包括抽取式问答和开放域问答。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers。

该数据集是SQuAD数据集的葡萄牙语翻译版本,使用Google Cloud API自动翻译。数据集主要用于问答任务,包括抽取式问答和开放域问答。数据集包含训练集和验证集,分别有87599和10570个样本。数据字段包括id、title、context、question和answers。
提供机构:
nunorc
原始信息汇总

数据集概述

基本信息

  • 名称: SquadV1Pt
  • 语言: 葡萄牙语(pt)
  • 许可证: MIT
  • 多语言性: 单语种
  • 数据集大小: 10K<n<100K
  • 源数据: 原始数据
  • 任务类别: 问答
  • 任务ID:
    • extractive-qa
    • open-domain-qa

数据集结构

  • 数据实例:
    • 字段:
      • id: 字符串
      • title: 字符串
      • context: 字符串
      • question: 字符串
      • answers: 字典,包含
        • text: 字符串
        • answer_start: 整数
    • 数据分割:
      • train: 87599个实例
      • validation: 10570个实例

数据集创建

  • 注释创建者: 众包
  • 语言创建者: 众包
  • 翻译过程: 使用Google Cloud API自动翻译

数据集使用考虑

  • 许可证: MIT,允许广泛使用和分发。

附加信息

  • 贡献者:
    • @thomwolf
    • @albertvillanova
    • @lewtun
    • @patrickvonplaten
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作