ernlavr/IDMGSP-danish
收藏Hugging Face2023-11-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ernlavr/IDMGSP-danish
下载链接
链接失效反馈官方服务:
资源简介:
这是原始IDMGSP数据集的丹麦语翻译版本。该丹麦语版本包含了`classifier_input`子集中的所有`abstracts`。翻译使用了Nllb-200-Distilled-600M模型,并且是作为DM-AI 2023竞赛的一部分创建的。
提供机构:
ernlavr
原始信息汇总
数据集概述
许可证
- Apache-2.0
配置
- 默认配置
- 数据文件
- 训练集:
data/train-* - 测试集:
data/test-*
- 训练集:
- 数据文件
数据集信息
- 特征
- 标签:
int64 - 摘要:
string - 翻译:
string
- 标签:
- 分割
- 训练集
- 字节数:24634068
- 样本数:16000
- 测试集
- 字节数:12269388
- 样本数:8000
- 训练集
- 下载大小:19382041
- 数据集大小:36903456



