five

vadim-pashaev/lezgi-books-russian-parallel

收藏
Hugging Face2026-04-09 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/vadim-pashaev/lezgi-books-russian-parallel
下载链接
链接失效反馈
官方服务:
资源简介:
# Lezgi Books Lezgi-Russian Parallel Corpus ## Dataset Summary This corpus was made by translating Lezgi books texts into Russian and aggregating the resulting parallel TSV files. The published dataset is packaged as a strict 2-column TSV for Hugging Face compatibility. - Source language: Lezgi - Target language: Russian - Format: TSV - Columns: `lezgi`, `russian` ## Dataset Structure Files: - `lezgi-books-russian-parallel.tsv` Columns: 1. `lezgi` 2. `russian` ## Size - Total rows in published TSV: 68,158 - Header rows: 1 - Parallel text pairs: 68,157 ## Source Books and Texts - Human Rights Center of Azerbaijan - Кьадардал гьалтайла тӏимил халкьар хуьнин гьакъиндай сергьятра авай Конвенциядикай - Абдуселим Исмаилов - Айгъурдин иви - Абдуселим Исмаилов - Зиярат - Абдуселим Исмаилов - Са ам хьанвач гьеле юргъун - Азиз Мирзабеков - Вири шехьайтIани... - Азиз Мирзабеков - Гьеле фад я! - Азиз Мирзабеков - Французрин гьикаятчидин эсерда лезгийрин образар - Арбен Кардаш - Жив - Арбен Кардаш - Мирзе-Алидин геж муьгьуьббат - Арбен Къардаш - Зи чӏал - Арбен Къардаш - Хкягъаяр 2-жуз - Арбен Къардаш - Хкягъаяр 3-жуз - Арбен Къардаш - Хкягъаяр 4-жуз - Гьажи Расим - Яргъал йисарин мани - Джалилов Мердали - Керекулдин сечкияр - Имам Абу Гьамид аль-Гъазали - Пак гьадисайрал къачунвай насигьатрин кIватIал - Къияс Межидов - Хайи чилин таватар - Лезгинская народная мудрость - Майрудин Бабаханов - Шапка - Мариф Кадимов - Жабраил буба - Мариф Кадимов - Зи математикадин муаллим - Мариф Кадимов - Са рамаг балкӏанрик квай экъуьгъун - Мегьамед Ведих - Гьарасатдин майдандал - Мегьамед Ведих - Кьуьд - Мердали Джалилов - Керекулдин сечкияр - Мердали Джалилов - Регьятвилер - Мердали Джалилов - Са пер, шумуд кавча? - Назир Мирзоев - Ватандиз хъша - Р.И. Гьайдаров - Гафарикай къейдер - Ризван Ризванов - Шарвили - Фейзудин Нагиев - Ви экв - Фейзудин Нагиев - Зи иви чапхунчиди гьар чпин жуьре дегишарна - Фейзудин Нагиев - Кьве устӏар - Фейзудин Нагиев - Мутили кровь на чуждый лад - Фейзудин Нагиев - Яраб жеда мад вун хьтин масанди - Ханбиче Хаметова - Хазран булах ## Intended Use This dataset may be useful for: - Lezgi-Russian machine translation - corpus linguistics - bilingual terminology and lexicon work - language documentation ## Limitations - The dataset inherits noise from the source TSV files. - Some malformed rows were excluded during packaging to keep the final file in strict 2-column format. - Source texts may vary in genre, style, and translation consistency. ## License Please verify redistribution and copyright status for the original texts before public reuse.
提供机构:
vadim-pashaev
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作