KennethTM/gooaq_pairs_danish
收藏Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KennethTM/gooaq_pairs_danish
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从英语机器翻译到丹麦语的GooAQ问答对数据集,包含约300万对问答对。每对问答包括一个问题(query)和一个包含答案的段落(passage)。该数据集可用于训练嵌入和问答模型。
该数据集是从英语机器翻译到丹麦语的GooAQ问答对数据集,包含约300万对问答对。每对问答包括一个问题(query)和一个包含答案的段落(passage)。该数据集可用于训练嵌入和问答模型。
提供机构:
KennethTM
原始信息汇总
GooAQ (Google Answers to Google Questions) question-answer pairs in Danish
数据集概述
特征
- query: 数据类型为字符串。
- passage: 数据类型为字符串。
数据分割
- train: 包含3,012,496个样本,总大小为934,643,435字节。
下载与数据大小
- 下载大小: 627,593,528字节。
- 数据集大小: 934,643,435字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。
语言
- 丹麦语 (da)
任务类别
- 特征提取
- 问答
大小类别
- 1M < n < 10M
许可证
- Apache-2.0



