five

draganjovanovich/airoboros-3.0-serbian

收藏
Hugging Face2024-07-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/draganjovanovich/airoboros-3.0-serbian
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是对airoboros-3.0数据集的塞尔维亚拉丁语翻译,旨在使数据集更广泛地适用于主要使用塞尔维亚拉丁语的用户。数据集包含两个主要新增内容:MathJSON和Anon-contributed RP数据集。MathJSON提供了一种使用JSON格式解决数学问题的方法,有助于减少LLM训练中对大量示例的需求。Anon-contributed RP数据集增强了数据集的多轮对话连贯性,使对话更加自然和引人入胜。数据集采用ShareGPT格式,确保与现有OS生态系统中的微调工具兼容。

该数据集是对airoboros-3.0数据集的塞尔维亚拉丁语翻译,旨在使数据集更广泛地适用于主要使用塞尔维亚拉丁语的用户。数据集包含两个主要新增内容:MathJSON和Anon-contributed RP数据集。MathJSON提供了一种使用JSON格式解决数学问题的方法,有助于减少LLM训练中对大量示例的需求。Anon-contributed RP数据集增强了数据集的多轮对话连贯性,使对话更加自然和引人入胜。数据集采用ShareGPT格式,确保与现有OS生态系统中的微调工具兼容。
提供机构:
draganjovanovich
原始信息汇总

airoboros-3.0-serbian

概述

该数据集是airoboros-3.0数据集的塞尔维亚拉丁语翻译版本。该数据集在现有airoboros数据集的基础上增加了两个重要内容:

  • MathJSON:使用JSON格式提供数学问题的解决方案,这些解决方案可以由专门的库进行评估,有助于减少对大量示例的需求。
  • 匿名贡献的角色扮演数据集:增强了数据集的多轮连贯性,使得对话更加自然和吸引人。

此外,该翻译版本使得数据集对于主要使用塞尔维亚拉丁语的更广泛受众变得可用。

格式

该数据集采用ShareGPT格式,确保与OS生态系统中的现有微调工具兼容。

MathJSON

大型语言模型在处理涉及浮点运算、三角函数、阶乘和大数等复杂数学概念时常常遇到困难。

MathJSON类别通过以易于解释的JSON格式呈现解决方案来应对这一挑战。这允许传统的计算库评估解决方案,提高训练效率并减少对大量训练数据的依赖。

该数据集目前包含约4,000个MathJSON样本,为未来的发展和扩展提供了坚实的基础。随着微调模型对这种格式的理解加深,数据集可以轻松扩展,使它们能够表示和解决各种数学问题。

例如: 创建一个MathJSON解决方案:计算半径为17.2456厘米的圆的面积。包括你的推理。

MathJSON解决方案: json [ "Multiply", "Pi", [ "Power", 17.2456, 2 ] ]

这种JSON字符串可以在mathjson标签内提取,并使用库如https://cortexjs.io/compute-engine/或自定义实现如https://github.com/jondurbin/airoboros/blob/mathjson/airoboros/mathjson.py进行评估。

这种方法有助于高效训练,并使LLM模型能够有效地理解和解决数学问题。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作