swap-uniba/drop_ita
收藏Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/swap-uniba/drop_ita
下载链接
链接失效反馈官方服务:
资源简介:
DROP数据集的意大利语版本,主要用于问答和文本生成任务。该数据集由众包创建,包含意大利语文本,大小为10K到100K之间。数据集的结构包括训练集和验证集,分别包含77400和9535个样本。数据集的字段包括段落、问题和答案跨度。
DROP数据集的意大利语版本,主要用于问答和文本生成任务。该数据集由众包创建,包含意大利语文本,大小为10K到100K之间。数据集的结构包括训练集和验证集,分别包含77400和9535个样本。数据集的字段包括段落、问题和答案跨度。
提供机构:
swap-uniba
原始信息汇总
数据集概述
基本信息
- 数据集名称: DROP ITA
- 语言: 意大利语
- 许可证: CC BY-SA 4.0
- 数据集大小: 10K<n<100K
- 多语言性: 单语种
- 来源数据集: 原始数据
任务类别
- 问题回答
- 文本生成
任务ID
- 抽取式问答
- 抽象式问答
数据集特征
- section_id: 字符串类型
- query_id: 字符串类型
- passage: 字符串类型
- question: 字符串类型
- answers_spans: 包含以下字段
- spans: 字符串类型
- types: 字符串类型
数据集分割
- 训练集: 77400个样本,105572506字节
- 验证集: 9535个样本,11737755字节
下载和数据集大小
- 下载大小: 11538387字节
- 数据集大小: 117310261字节
配置
- 默认配置:
- 训练集: data/train-*
- 验证集: data/validation-*
标签
- llm
- 意大利语
- llamantino



