UMCU/PubMedCausal_Dutch_translated_with_MariaNMT
收藏Hugging Face2023-12-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/UMCU/PubMedCausal_Dutch_translated_with_MariaNMT
下载链接
链接失效反馈官方服务:
资源简介:
PubMedCausal_Dutch_translated_with_MariaNMT数据集是PubMedCausal数据集的荷兰语翻译版本,使用了Maria NMT模型进行翻译。数据集包含训练集,共有2368个样本,总大小为847311字节。数据集的特征包括instruction、input和output,均为字符串类型。数据集的任务类别包括文本分类、问答和句子相似性,语言为荷兰语,标签为医疗健康。数据集的许可证为afl-3.0。
The PubMedCausal_Dutch_translated_with_MariaNMT dataset is a Dutch translation of the English version of the PubMedCausal dataset, using the Maria NMT model. It includes three main features: instruction, input, and output, all of which are string types. The dataset is primarily used for text classification, question-answering, and sentence similarity tasks, and falls under the healthcare domain with the main language being Dutch. The training set contains 2368 samples with a total size of 847311 bytes.
提供机构:
UMCU
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集信息
- 特征:
- 名称: instruction
- 数据类型: string
- 名称: input
- 数据类型: string
- 名称: output
- 数据类型: string
- 名称: instruction
- 分割:
- 名称: train
- 字节数: 847311
- 样本数: 2368
- 名称: train
- 下载大小: 224775
- 数据集大小: 847311
许可
- 许可类型: afl-3.0
任务类别
- 文本分类
- 问答
- 句子相似度
语言
- 荷兰语
标签
- 医疗健康
数据集名称
- 名称: PubMedCausal_Dutch
数据集大小类别
- 范围: 1K<n<10K



