infinite-dataset-hub/SlavicTransLearn
收藏Hugging Face2024-09-19 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/infinite-dataset-hub/SlavicTransLearn
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
tags:
- infinite-dataset-hub
- synthetic
---
# SlavicTransLearn
tags: ModelLearning, Russian, MachineTranslation
_Note: This is an AI-generated dataset so its content may be inaccurate or false_
**Dataset Description:**
The 'SlavicTransLearn' dataset is a collection of Russian text segments curated for the purpose of training machine translation models, specifically focusing on Russian to English translations. Each text segment is accompanied by a label that signifies its contextual use, which can include categories like 'literature', 'legal', 'medical', 'news', and 'general conversation'. This dataset aims to provide a balanced mix of various contexts to improve the robustness of translation models.
**CSV Content Preview:**
```
id,text,labels
1,"Общее понятие транслитерации в контексте русского языка","general conversation"
2,"Транслитерация текста используется для предоставления информации в виде буквенной аббревиатуры.","literature"
3,"Примеры транслитерации: R->Р, T->Т, L->Л и так далее.","general conversation"
4,"В юридическом контексте транслитерация может иметь важную роль в различных документах.","legal"
5,"В медицинском обществе транслитерация помогает в обеспечении чистоты текстовых данных.","medical"
```
**Source of the data:**
The dataset was generated using the [Infinite Dataset Hub](https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub) and microsoft/Phi-3-mini-4k-instruct using the query 'russian translete':
- **Dataset Generation Page**: https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub?q=russian+translete&dataset=SlavicTransLearn&tags=ModelLearning,+Russian,+MachineTranslation
- **Model**: https://huggingface.co/microsoft/Phi-3-mini-4k-instruct
- **More Datasets**: https://huggingface.co/datasets?other=infinite-dataset-hub
---
license: MIT
tags: infinite-dataset-hub, synthetic
---
# SlavicTransLearn
tags: 模型学习、俄语、机器翻译
_注:本数据集由AI生成,内容可能存在不准确或虚假情况_
**数据集描述:**
SlavicTransLearn数据集是一组精心整理的俄语文本片段,旨在用于训练机器翻译模型(Machine Translation),尤其专注于俄语到英语的翻译任务。每个文本片段均附有标识其上下文用途的标签,涵盖“文学”“法律”“医疗”“新闻”及“日常对话”等类别。该数据集致力于提供各类场景的均衡组合,以提升翻译模型的鲁棒性(Robustness)。
**CSV内容预览:**
id,text,labels
1,"Общее понятие транслитерации в контексте русского языка","general conversation"
2,"Транслитерация текста используется для предоставления информации в виде буквенной аббревиатуры.","literature"
3,"Примеры транслитерации: R->Р, T->Т, L->Л и так далее.","general conversation"
4,"В юридическом контексте транслитерация может иметь важную роль в различных документах.","legal"
5,"В медицинском обществе транслитерация помогает в обеспечении чистоты текстовых данных.","medical"
**数据来源:**
本数据集通过[Infinite Dataset Hub](https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub)及microsoft/Phi-3-mini-4k-instruct模型生成,使用的查询词为“russian translete”:
- **数据集生成页面**:https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub?q=russian+translete&dataset=SlavicTransLearn&tags=ModelLearning,+Russian,+MachineTranslation
- **模型**:https://huggingface.co/microsoft/Phi-3-mini-4k-instruct
- **更多数据集**:https://huggingface.co/datasets?other=infinite-dataset-hub
提供机构:
infinite-dataset-hub



