five

swap-uniba/drop_ita

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/swap-uniba/drop_ita
下载链接
链接失效反馈
官方服务:
资源简介:
DROP数据集的意大利语版本,主要用于问答和文本生成任务。该数据集由众包创建,包含意大利语文本,大小为10K到100K之间。数据集的结构包括训练集和验证集,分别包含77400和9535个样本。数据集的字段包括段落、问题和答案跨度。

DROP数据集的意大利语版本,主要用于问答和文本生成任务。该数据集由众包创建,包含意大利语文本,大小为10K到100K之间。数据集的结构包括训练集和验证集,分别包含77400和9535个样本。数据集的字段包括段落、问题和答案跨度。
提供机构:
swap-uniba
原始信息汇总

数据集概述

基本信息

  • 数据集名称: DROP ITA
  • 语言: 意大利语
  • 许可证: CC BY-SA 4.0
  • 数据集大小: 10K<n<100K
  • 多语言性: 单语种
  • 来源数据集: 原始数据

任务类别

  • 问题回答
  • 文本生成

任务ID

  • 抽取式问答
  • 抽象式问答

数据集特征

  • section_id: 字符串类型
  • query_id: 字符串类型
  • passage: 字符串类型
  • question: 字符串类型
  • answers_spans: 包含以下字段
    • spans: 字符串类型
    • types: 字符串类型

数据集分割

  • 训练集: 77400个样本,105572506字节
  • 验证集: 9535个样本,11737755字节

下载和数据集大小

  • 下载大小: 11538387字节
  • 数据集大小: 117310261字节

配置

  • 默认配置:
    • 训练集: data/train-*
    • 验证集: data/validation-*

标签

  • llm
  • 意大利语
  • llamantino
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作