five

vladman-25/flickr-30k-romanian-captions

收藏
Hugging Face2023-10-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vladman-25/flickr-30k-romanian-captions
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Flickr 30k captions数据集的罗马尼亚语翻译版本。该翻译是通过使用nllb-200-distilled-1.3B模型生成的,并使用了Hugging Face进行分词和翻译。观察发现,翻译在保持上下文方面表现良好,但也存在一些语法错误和荒谬的翻译。数据集的语言为罗马尼亚语。

This dataset is the Romanian translation of the Flickr 30k Captions dataset. The translation was generated using the nllb-200-distilled-1.3B model, with tokenization and translation processes implemented via Hugging Face. Observations show that the translations perform well in retaining contextual information, but also contain some grammatical errors and nonsensical renderings. The language of this dataset is Romanian.
提供机构:
vladman-25
原始信息汇总

数据集卡片 for Flickr 30k Romanian Captions

数据集概述

该数据集是Flickr 30k描述数据集的罗马尼亚语翻译版本。使用nllb-200-distilled-1.3B模型,结合Hugging Face进行分词和翻译生成。

观察结果

  • 翻译保持了较好的上下文一致性。
  • 存在一些语法错误,例如:"Doi tineri sare peste un balustradă"。
  • 部分翻译显得有些滑稽,例如:"Un bărbat ţine o jucărie mare de leu împăiat.","Un bărbat cu barbă care poartă un dulap."。

语言

罗马尼亚语

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作