five

datatab/orca_math_world_problem_200k_serbian

收藏
Hugging Face2024-05-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/datatab/orca_math_world_problem_200k_serbian
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约20万个小学数学文本问题,所有答案均由Azure GPT4-Turbo生成。数据集旨在提高语言模型在解决数学问题方面的能力,为语言模型提供坚实的基础,使其在解决数学问题上表现出色。

该数据集包含约20万个小学数学文本问题,所有答案均由Azure GPT4-Turbo生成。数据集旨在提高语言模型在解决数学问题方面的能力,为语言模型提供坚实的基础,使其在解决数学问题上表现出色。
提供机构:
datatab
原始信息汇总

数据集概述

  • 名称: Orca-Math-Word-Problems-200k
  • 创建者: Microsoft
  • 语言: 塞尔维亚语 (sr), 英语 (en)
  • 许可证: MIT
  • 任务类别: 文本分类, 文本生成
  • 数据集大小: 447001533 字节
  • 下载大小: 176484426 字节
  • 训练集大小: 200034 个示例, 447001533 字节
  • 特征:
    • question_eng: 字符串
    • answer_eng: 字符串
    • question_translated_srb: 字符串
    • answer_translated_srb: 字符串
  • 配置:
    • default: 包含训练数据 (data/train-*)
  • 标签: matematika
  • 大小类别: 100K<n<1M

数据集内容

  • 描述: 包含约20万个小学数学文本问题,所有答案均使用Azure GPT4-Turbo生成。
  • 示例结构: python {pitanje: 问题文本, odgovor: 答案文本}

常见词汇和短语

  • 常见词汇:
    • broj: 269,444 次
    • Dakle: 227,006 次
    • Sada: 223,335 次
  • 常见短语:
    • (Sada, hajde): 58,778 次
    • (ukupan, broj): 55,887 次
    • (obe, strane): 47,436 次

引用信息

@misc{mitra2024orcamath, title={Orca-Math: Unlocking the potential of SLMs in Grade School Math}, author={Arindam Mitra and Hamed Khanpour and Corby Rosset and Ahmed Awadallah}, year={2024}, eprint={2402.14830}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作