five

Azure99/blossom-math-v2

收藏
Hugging Face2023-12-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Azure99/blossom-math-v2
下载链接
链接失效反馈
官方服务:
资源简介:
Blossom Math V2是一个中英双语数学对话数据集,适用于数学问题微调。该数据集基于Math23K和GSM8K,新增了2500条GSM8K数据和翻译为中文的2500条GSM8K-CN数据。数据集包含10K记录,每条数据包含id、input、output、answer、dataset五个字段。数据集采用gpt-3.5-turbo-0613生成结果,并使用原始数据集中的答案进行验证,以保证问题和答案的准确性。

Blossom Math V2是一个中英双语数学对话数据集,适用于数学问题微调。该数据集基于Math23K和GSM8K,新增了2500条GSM8K数据和翻译为中文的2500条GSM8K-CN数据。数据集包含10K记录,每条数据包含id、input、output、answer、dataset五个字段。数据集采用gpt-3.5-turbo-0613生成结果,并使用原始数据集中的答案进行验证,以保证问题和答案的准确性。
提供机构:
Azure99
原始信息汇总

BLOSSOM MATH V2 数据集概述

数据集介绍

Blossom Math V2 是一个基于 Math23K 和 GSM8K 衍生而来的中英双语数学对话数据集,适用于数学问题微调。相比于 blossom-math-v1,该版本新增了 2500 条 GSM8K 数据和翻译为中文的 2500 条 GSM8K-CN 数据。此外,优化了答案的检查逻辑,并移除了简单的计算步骤,以统一推理步骤的风格。

数据集语言

数据集包含中文和英文。

数据集结构

每条数据包含以下字段:

  • id:字符串,代表原始数据集中的题目id。
  • input:字符串,代表问题。
  • output:字符串,代表 gpt-3.5-turbo-0613 生成的答案。
  • answer:字符串,代表正确答案。
  • dataset:字符串,代表原始数据集。

数据集限制

所有响应均由 gpt-3.5-turbo-0613 生成,并经过初步校验,但仍可能包含不准确的回答。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作