ZharfaTech/ZharfaTech-Open-Platypus-Persian-Farsi
收藏Hugging Face2024-03-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/ZharfaTech/ZharfaTech-Open-Platypus-Persian-Farsi
下载链接
链接失效反馈官方服务:
资源简介:
Persian Open-Platypus数据集是Open-Platypus数据集的波斯语翻译版本,旨在增强波斯语语言模型(LLM)的逻辑推理能力。该数据集通过高性能的本地翻译模型进行翻译,并在3个Nvidia GPU上耗时20小时完成。数据集包含多个子集,如PRM800K、MATH、ScienceQA等,均经过筛选以确保独特性和相关性。ZharfaTech公司致力于通过微调开源模型、创建专门的数据集和开发高级闭源模型来提升波斯语LLM技术能力,并推动波斯语社区的协作与创新。
Persian Open-Platypus数据集是Open-Platypus数据集的波斯语翻译版本,旨在增强波斯语语言模型(LLM)的逻辑推理能力。该数据集通过高性能的本地翻译模型进行翻译,并在3个Nvidia GPU上耗时20小时完成。数据集包含多个子集,如PRM800K、MATH、ScienceQA等,均经过筛选以确保独特性和相关性。ZharfaTech公司致力于通过微调开源模型、创建专门的数据集和开发高级闭源模型来提升波斯语LLM技术能力,并推动波斯语社区的协作与创新。
提供机构:
ZharfaTech
原始信息汇总
Persian Open-Platypus 数据集概述
数据集概览
Persian Open-Platypus 数据集是 "Open-Platypus" 数据集 的全面波斯语翻译版本,旨在增强语言学习模型(LLM)的逻辑推理技能。该翻译是我们的倡议的一部分,旨在为波斯语 LLM 开发创建高质量资源,使用高性能本地翻译模型。翻译过程在 3 块 Nvidia GPU 上完成,耗时 20 小时。
关键特性:
- 语言: 波斯语
- 来源: 从 "Open-Platypus" 翻译而来
- 翻译方法: 本地翻译模型
- 处理时间: 20 小时,使用 3 块 Nvidia GPU
包含的数据集:
原始的 Open-Platypus 数据集包含多个数据集,均旨在增强逻辑推理能力。它们包括 PRM800K、MATH、ScienceQA、SciBench、ReClor、TheoremQA 等,经过筛选以保持独特性和相关性。我们的波斯语翻译遵循这些选择。
目标和范围
在 ZharfaTech,我们的目标是通过以下方式增强波斯语 LLM 技术能力:
- 对开源模型进行微调,以提高波斯语理解能力。
- 创建专门的数据集,支持全面的模型训练。
- 开发针对特定行业需求的先进闭源模型。
我们的工作致力于为波斯语使用者普及 LLM 技术,促进社区合作和创新。
贡献
我们欢迎社区对改进和扩展此数据集的贡献。
致谢
我们衷心感谢原始 "Open-Platypus" 数据集的创建者以及所有贡献者。特别感谢我们的团队成员,他们熟练地管理了翻译工作,确保了数据集的质量和对波斯语的相关性。
许可证
该数据集在 cc-by-4.0 许可下发布,与原始数据集的许可条款一致。



