five

ismaeltorres00/Entrega109

收藏
Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ismaeltorres00/Entrega109
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个示例数据集,来自人工智能与大数据课程的第109次交付。数据集从GitHub下载并经过转换后上传到HuggingFace。数据集包含段落,每个段落包含上下文和问答对。问答对中包括答案、问题ID、是否不可能回答、可能答案和问题。此外,数据集还包含标题。数据集分为训练集,包含395个示例,文件大小为29592954.256926954字节。数据集的语言为西班牙语,标签包括法律和化学,规模类别为10K<n<100K。

这是一个示例数据集,来自人工智能与大数据课程的第109次交付。数据集从GitHub下载并经过转换后上传到HuggingFace。数据集包含段落,每个段落包含上下文和问答对。问答对中包括答案、问题ID、是否不可能回答、可能答案和问题。此外,数据集还包含标题。数据集分为训练集,包含395个示例,文件大小为29592954.256926954字节。数据集的语言为西班牙语,标签包括法律和化学,规模类别为10K<n<100K。
提供机构:
ismaeltorres00
原始信息汇总

数据集概述

数据集基本信息

  • 许可证: cc-by-nc-4.0
  • 语言: 西班牙语(es)
  • 标签: 法律(legal), 化学(chemistry)
  • 大小类别: 10K<n<100K

数据集特征

  • 标题: 字符串类型
  • 段落:
    • 上下文: 字符串类型
    • 问题与答案:
      • 答案:
        • 起始位置: 整数类型(int64)
        • 文本: 字符串类型
      • ID: 字符串类型
      • 是否无法回答: 布尔类型
      • 可能的答案:
        • 起始位置: 整数类型(int64)
        • 文本: 字符串类型
      • 问题: 字符串类型

数据集分割

  • 训练集:
    • 示例数量: 395
    • 数据大小: 29592954.256926954 字节
    • 下载大小: 14743347 字节

配置

  • 默认配置:
    • 数据文件:
      • 分割: 训练
      • 路径: data/train-*

任务类别

  • 令牌分类(token-classification)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作