datatab/orca_math_world_problem_200k_serbian
收藏Hugging Face2024-05-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/datatab/orca_math_world_problem_200k_serbian
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约20万个小学数学文本问题,所有答案均由Azure GPT4-Turbo生成。数据集旨在提高语言模型在解决数学问题方面的能力,为语言模型提供坚实的基础,使其在解决数学问题上表现出色。
该数据集包含约20万个小学数学文本问题,所有答案均由Azure GPT4-Turbo生成。数据集旨在提高语言模型在解决数学问题方面的能力,为语言模型提供坚实的基础,使其在解决数学问题上表现出色。
提供机构:
datatab
原始信息汇总
数据集概述
- 名称: Orca-Math-Word-Problems-200k
- 创建者: Microsoft
- 语言: 塞尔维亚语 (sr), 英语 (en)
- 许可证: MIT
- 任务类别: 文本分类, 文本生成
- 数据集大小: 447001533 字节
- 下载大小: 176484426 字节
- 训练集大小: 200034 个示例, 447001533 字节
- 特征:
question_eng: 字符串answer_eng: 字符串question_translated_srb: 字符串answer_translated_srb: 字符串
- 配置:
default: 包含训练数据 (data/train-*)
- 标签: matematika
- 大小类别: 100K<n<1M
数据集内容
- 描述: 包含约20万个小学数学文本问题,所有答案均使用Azure GPT4-Turbo生成。
- 示例结构: python {pitanje: 问题文本, odgovor: 答案文本}
常见词汇和短语
- 常见词汇:
broj: 269,444 次Dakle: 227,006 次Sada: 223,335 次
- 常见短语:
(Sada, hajde): 58,778 次(ukupan, broj): 55,887 次(obe, strane): 47,436 次
引用信息
@misc{mitra2024orcamath, title={Orca-Math: Unlocking the potential of SLMs in Grade School Math}, author={Arindam Mitra and Hamed Khanpour and Corby Rosset and Ahmed Awadallah}, year={2024}, eprint={2402.14830}, archivePrefix={arXiv}, primaryClass={cs.CL} }



