KennethTM/eli5_question_answer_danish
收藏Hugging Face2024-02-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KennethTM/eli5_question_answer_danish
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是ELI5问答对数据集的丹麦语版本,通过机器翻译从英语转换为丹麦语。使用了Helsinki NLP的英语到丹麦语OPUS-MT模型进行翻译。数据集包含约209k个问答对,每个对包括一个问题(query)和一个包含答案的段落(passage)。该数据集可用于训练嵌入和问答模型。
该数据集是ELI5问答对数据集的丹麦语版本,通过机器翻译从英语转换为丹麦语。使用了Helsinki NLP的英语到丹麦语OPUS-MT模型进行翻译。数据集包含约209k个问答对,每个对包括一个问题(query)和一个包含答案的段落(passage)。该数据集可用于训练嵌入和问答模型。
提供机构:
KennethTM
原始信息汇总
ELI5 question-answer pairs in Danish 数据集概述
数据集信息
特征
- query: 数据类型为字符串(string)
- passage: 数据类型为字符串(string)
分割
- train:
- 字节数: 109698512
- 样本数: 209408
大小
- 下载大小: 70746762
- 数据集大小: 109698512
配置
- default:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:
许可
- 未知(unknown)
语言
- 丹麦语(da)
任务类别
- 特征提取(feature-extraction)
- 问答(question-answering)
数据集描述
该数据集是 ELI5 question-answer pairs 数据集 的机器翻译版本,从英语翻译为丹麦语。机器翻译使用的是 Helsinki NLP 的 English-to-Danish OPUS-MT 模型。
数据集包含约 209k 个问答对,可用于训练嵌入和问答模型。每个对包含一个问题(query)和一个包含答案的段落(passage)。



