ZharfaTech/ZharfaTech-Open-Platypus-Persian-Farsi

Name: ZharfaTech/ZharfaTech-Open-Platypus-Persian-Farsi
Creator: ZharfaTech
Published: 2024-03-09 11:27:08
License: 暂无描述

Hugging Face2024-03-09 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/ZharfaTech/ZharfaTech-Open-Platypus-Persian-Farsi

下载链接

链接失效反馈

官方服务：

资源简介：

Persian Open-Platypus数据集是Open-Platypus数据集的波斯语翻译版本，旨在增强波斯语语言模型（LLM）的逻辑推理能力。该数据集通过高性能的本地翻译模型进行翻译，并在3个Nvidia GPU上耗时20小时完成。数据集包含多个子集，如PRM800K、MATH、ScienceQA等，均经过筛选以确保独特性和相关性。ZharfaTech公司致力于通过微调开源模型、创建专门的数据集和开发高级闭源模型来提升波斯语LLM技术能力，并推动波斯语社区的协作与创新。

提供机构：

ZharfaTech

原始信息汇总

Persian Open-Platypus 数据集概述

数据集概览

Persian Open-Platypus 数据集是 "Open-Platypus" 数据集的全面波斯语翻译版本，旨在增强语言学习模型（LLM）的逻辑推理技能。该翻译是我们的倡议的一部分，旨在为波斯语 LLM 开发创建高质量资源，使用高性能本地翻译模型。翻译过程在 3 块 Nvidia GPU 上完成，耗时 20 小时。

关键特性：

语言： 波斯语
来源： 从 "Open-Platypus" 翻译而来
翻译方法： 本地翻译模型
处理时间： 20 小时，使用 3 块 Nvidia GPU

包含的数据集：

原始的 Open-Platypus 数据集包含多个数据集，均旨在增强逻辑推理能力。它们包括 PRM800K、MATH、ScienceQA、SciBench、ReClor、TheoremQA 等，经过筛选以保持独特性和相关性。我们的波斯语翻译遵循这些选择。

目标和范围

在 ZharfaTech，我们的目标是通过以下方式增强波斯语 LLM 技术能力：

对开源模型进行微调，以提高波斯语理解能力。
创建专门的数据集，支持全面的模型训练。
开发针对特定行业需求的先进闭源模型。

我们的工作致力于为波斯语使用者普及 LLM 技术，促进社区合作和创新。

贡献

我们欢迎社区对改进和扩展此数据集的贡献。

致谢

我们衷心感谢原始 "Open-Platypus" 数据集的创建者以及所有贡献者。特别感谢我们的团队成员，他们熟练地管理了翻译工作，确保了数据集的质量和对波斯语的相关性。

许可证

该数据集在 cc-by-4.0 许可下发布，与原始数据集的许可条款一致。

5,000+

优质数据集

54 个

任务类型

进入经典数据集