five

zantag/en-bg-os-full-50m

收藏
Hugging Face2025-08-23 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/zantag/en-bg-os-full-50m
下载链接
链接失效反馈
官方服务:
资源简介:
Bulgarian-English OpenSubtitles Full Dataset (50M, ChessInstruct Format)是一个包含48,749,944对英语到保加利亚语字幕翻译的数据集,采用ChessInstruct格式,用于对Gemma3-270m模型进行微调。该数据集是OpenSubtitles平行语料库中BG-EN语言对的全集,是可用于翻译的最大数据集之一。

The Bulgarian-English OpenSubtitles Full Dataset (50M, ChessInstruct Format) is a dataset containing 48,749,944 English to Bulgarian subtitle translation pairs in ChessInstruct format, designed for fine-tuning the Gemma3-270m model. This dataset represents the complete OpenSubtitles parallel corpus for the BG-EN language pair, making it one of the largest translation datasets available.
提供机构:
zantag
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作