five

ernlavr/IDMGSP-danish

收藏
Hugging Face2023-11-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ernlavr/IDMGSP-danish
下载链接
链接失效反馈
官方服务:
资源简介:
这是原始IDMGSP数据集的丹麦语翻译版本。该丹麦语版本包含了`classifier_input`子集中的所有`abstracts`。翻译使用了Nllb-200-Distilled-600M模型,并且是作为DM-AI 2023竞赛的一部分创建的。
提供机构:
ernlavr
原始信息汇总

数据集概述

许可证

  • Apache-2.0

配置

  • 默认配置
    • 数据文件
      • 训练集:data/train-*
      • 测试集:data/test-*

数据集信息

  • 特征
    • 标签:int64
    • 摘要:string
    • 翻译:string
  • 分割
    • 训练集
      • 字节数:24634068
      • 样本数:16000
    • 测试集
      • 字节数:12269388
      • 样本数:8000
  • 下载大小:19382041
  • 数据集大小:36903456
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作