five

jangel97/en-es-tatoeba

收藏
Hugging Face2025-11-25 更新2025-11-30 收录
下载链接:
https://hf-mirror.com/datasets/jangel97/en-es-tatoeba
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含276,265对西班牙语和英语的平行句子,用于机器翻译和序列到序列微调的实验。句子来源于简短的对话环境,代表日常的非正式语言。此版本的数据集经过了短句长度过滤(3-15个单词)、去重和TSV格式化处理。

This dataset contains 276,265 parallel sentence pairs in Spanish ↔ English, intended for experiments in machine translation and sequence-to-sequence fine-tuning. Sentences come from short conversational contexts and represent everyday informal language. This version includes filtering for short sentence length (3–15 words), deduplication, and TSV formatting.
提供机构:
jangel97
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作