five

NumanKaanKaratas/turkish-english-words

收藏
Hugging Face2026-05-27 更新2026-05-31 收录
下载链接:
https://hf-mirror.com/datasets/NumanKaanKaratas/turkish-english-words
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个全面的土耳其语-英语单词和短语翻译数据集,包含3,365,067个平行条目,覆盖广泛的土耳其语词汇,从简单词根到复杂的黏着形式、变位和习语表达。语言对为土耳其语(tr)到英语(en),格式为JSONL,许可证为MIT,由ChatGPT(OpenAI)生成,无人审核。数据集特别适用于机器翻译训练与评估、土耳其语形态分析研究、土耳其语-英语任务的语言模型微调、词汇构建工具以及跨语言NLP研究。

A comprehensive Turkish-English word and phrase translation dataset containing 3,365,067 parallel entries covering a wide range of Turkish vocabulary — from simple root words to complex agglutinated forms, conjugations, and idiomatic expressions. Language: Turkish (tr) → English (en), format: JSONL, license: MIT, generated by ChatGPT (OpenAI), human review: none. This makes it particularly valuable for machine translation training and evaluation, morphological analysis research on Turkish, language model fine-tuning for Turkish-English tasks, vocabulary building tools and applications, and cross-lingual NLP research.
提供机构:
NumanKaanKaratas
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作