vadim-pashaev/lezgi-books-russian-parallel
收藏Hugging Face2026-04-09 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/vadim-pashaev/lezgi-books-russian-parallel
下载链接
链接失效反馈官方服务:
资源简介:
# Lezgi Books Lezgi-Russian Parallel Corpus
## Dataset Summary
This corpus was made by translating Lezgi books texts into Russian and aggregating the resulting parallel TSV files.
The published dataset is packaged as a strict 2-column TSV for Hugging Face compatibility.
- Source language: Lezgi
- Target language: Russian
- Format: TSV
- Columns: `lezgi`, `russian`
## Dataset Structure
Files:
- `lezgi-books-russian-parallel.tsv`
Columns:
1. `lezgi`
2. `russian`
## Size
- Total rows in published TSV: 68,158
- Header rows: 1
- Parallel text pairs: 68,157
## Source Books and Texts
- Human Rights Center of Azerbaijan - Кьадардал гьалтайла тӏимил халкьар хуьнин гьакъиндай сергьятра авай Конвенциядикай
- Абдуселим Исмаилов - Айгъурдин иви
- Абдуселим Исмаилов - Зиярат
- Абдуселим Исмаилов - Са ам хьанвач гьеле юргъун
- Азиз Мирзабеков - Вири шехьайтIани...
- Азиз Мирзабеков - Гьеле фад я!
- Азиз Мирзабеков - Французрин гьикаятчидин эсерда лезгийрин образар
- Арбен Кардаш - Жив
- Арбен Кардаш - Мирзе-Алидин геж муьгьуьббат
- Арбен Къардаш - Зи чӏал
- Арбен Къардаш - Хкягъаяр 2-жуз
- Арбен Къардаш - Хкягъаяр 3-жуз
- Арбен Къардаш - Хкягъаяр 4-жуз
- Гьажи Расим - Яргъал йисарин мани
- Джалилов Мердали - Керекулдин сечкияр
- Имам Абу Гьамид аль-Гъазали - Пак гьадисайрал къачунвай насигьатрин кIватIал
- Къияс Межидов - Хайи чилин таватар
- Лезгинская народная мудрость
- Майрудин Бабаханов - Шапка
- Мариф Кадимов - Жабраил буба
- Мариф Кадимов - Зи математикадин муаллим
- Мариф Кадимов - Са рамаг балкӏанрик квай экъуьгъун
- Мегьамед Ведих - Гьарасатдин майдандал
- Мегьамед Ведих - Кьуьд
- Мердали Джалилов - Керекулдин сечкияр
- Мердали Джалилов - Регьятвилер
- Мердали Джалилов - Са пер, шумуд кавча?
- Назир Мирзоев - Ватандиз хъша
- Р.И. Гьайдаров - Гафарикай къейдер
- Ризван Ризванов - Шарвили
- Фейзудин Нагиев - Ви экв
- Фейзудин Нагиев - Зи иви чапхунчиди гьар чпин жуьре дегишарна
- Фейзудин Нагиев - Кьве устӏар
- Фейзудин Нагиев - Мутили кровь на чуждый лад
- Фейзудин Нагиев - Яраб жеда мад вун хьтин масанди
- Ханбиче Хаметова - Хазран булах
## Intended Use
This dataset may be useful for:
- Lezgi-Russian machine translation
- corpus linguistics
- bilingual terminology and lexicon work
- language documentation
## Limitations
- The dataset inherits noise from the source TSV files.
- Some malformed rows were excluded during packaging to keep the final file in strict 2-column format.
- Source texts may vary in genre, style, and translation consistency.
## License
Please verify redistribution and copyright status for the original texts before public reuse.
提供机构:
vadim-pashaev



