five

infinite-dataset-hub/SlavicTransLearn

收藏
Hugging Face2024-09-19 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/infinite-dataset-hub/SlavicTransLearn
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit tags: - infinite-dataset-hub - synthetic --- # SlavicTransLearn tags: ModelLearning, Russian, MachineTranslation _Note: This is an AI-generated dataset so its content may be inaccurate or false_ **Dataset Description:** The 'SlavicTransLearn' dataset is a collection of Russian text segments curated for the purpose of training machine translation models, specifically focusing on Russian to English translations. Each text segment is accompanied by a label that signifies its contextual use, which can include categories like 'literature', 'legal', 'medical', 'news', and 'general conversation'. This dataset aims to provide a balanced mix of various contexts to improve the robustness of translation models. **CSV Content Preview:** ``` id,text,labels 1,"Общее понятие транслитерации в контексте русского языка","general conversation" 2,"Транслитерация текста используется для предоставления информации в виде буквенной аббревиатуры.","literature" 3,"Примеры транслитерации: R->Р, T->Т, L->Л и так далее.","general conversation" 4,"В юридическом контексте транслитерация может иметь важную роль в различных документах.","legal" 5,"В медицинском обществе транслитерация помогает в обеспечении чистоты текстовых данных.","medical" ``` **Source of the data:** The dataset was generated using the [Infinite Dataset Hub](https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub) and microsoft/Phi-3-mini-4k-instruct using the query 'russian translete': - **Dataset Generation Page**: https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub?q=russian+translete&dataset=SlavicTransLearn&tags=ModelLearning,+Russian,+MachineTranslation - **Model**: https://huggingface.co/microsoft/Phi-3-mini-4k-instruct - **More Datasets**: https://huggingface.co/datasets?other=infinite-dataset-hub

--- license: MIT tags: infinite-dataset-hub, synthetic --- # SlavicTransLearn tags: 模型学习、俄语、机器翻译 _注:本数据集由AI生成,内容可能存在不准确或虚假情况_ **数据集描述:** SlavicTransLearn数据集是一组精心整理的俄语文本片段,旨在用于训练机器翻译模型(Machine Translation),尤其专注于俄语到英语的翻译任务。每个文本片段均附有标识其上下文用途的标签,涵盖“文学”“法律”“医疗”“新闻”及“日常对话”等类别。该数据集致力于提供各类场景的均衡组合,以提升翻译模型的鲁棒性(Robustness)。 **CSV内容预览:** id,text,labels 1,"Общее понятие транслитерации в контексте русского языка","general conversation" 2,"Транслитерация текста используется для предоставления информации в виде буквенной аббревиатуры.","literature" 3,"Примеры транслитерации: R->Р, T->Т, L->Л и так далее.","general conversation" 4,"В юридическом контексте транслитерация может иметь важную роль в различных документах.","legal" 5,"В медицинском обществе транслитерация помогает в обеспечении чистоты текстовых данных.","medical" **数据来源:** 本数据集通过[Infinite Dataset Hub](https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub)及microsoft/Phi-3-mini-4k-instruct模型生成,使用的查询词为“russian translete”: - **数据集生成页面**:https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub?q=russian+translete&dataset=SlavicTransLearn&tags=ModelLearning,+Russian,+MachineTranslation - **模型**:https://huggingface.co/microsoft/Phi-3-mini-4k-instruct - **更多数据集**:https://huggingface.co/datasets?other=infinite-dataset-hub
提供机构:
infinite-dataset-hub
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作