five

thanhdath/vietnamese-mathcoder

收藏
Hugging Face2023-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thanhdath/vietnamese-mathcoder
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含英文和越南语样本。每个样本有三种解决方案:编码解决方案、解释解决方案和直接解决方案,分别用<sol>、<exp>和<dir>标记。对于编码解决方案,执行Python代码以获取输出结果。使用该数据集和QLoRA在Tora-Code-13b上,可以在越南小学数学 - Zalo AI Challenge 2023的公开测试中达到73%的准确率。

该数据集包含英文和越南语样本。每个样本有三种解决方案:编码解决方案、解释解决方案和直接解决方案,分别用<sol>、<exp>和<dir>标记。对于编码解决方案,执行Python代码以获取输出结果。使用该数据集和QLoRA在Tora-Code-13b上,可以在越南小学数学 - Zalo AI Challenge 2023的公开测试中达到73%的准确率。
提供机构:
thanhdath
原始信息汇总

数据集概述

数据特征

  • 输入:字符串类型
  • 输出:字符串类型

数据划分

  • 训练集
    • 字节数:21151768
    • 样本数:22825

数据大小

  • 下载大小:7937515
  • 数据集大小:21151768

配置信息

  • 默认配置
    • 数据文件路径:data/train-*

数据集描述

  • 包含英语和越南语样本。
  • 每个样本包含三种解决方案:
    • 代码解决方案(标记为<sol>
    • 解释解决方案(标记为<exp>
    • 直接解决方案(标记为<dir>
  • 对于代码解决方案,执行包裹在中的Python代码以获得输出结果。不要信任模型生成的选择,只需执行代码并映射到选择。
  • 使用此数据集和QLoRA在Tora-Code-13b上,可以在越南小学数学-Zalo AI挑战赛2023的公开测试中达到73%的准确率。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作