thanhdath/vietnamese-mathcoder
收藏Hugging Face2023-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thanhdath/vietnamese-mathcoder
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含英文和越南语样本。每个样本有三种解决方案:编码解决方案、解释解决方案和直接解决方案,分别用<sol>、<exp>和<dir>标记。对于编码解决方案,执行Python代码以获取输出结果。使用该数据集和QLoRA在Tora-Code-13b上,可以在越南小学数学 - Zalo AI Challenge 2023的公开测试中达到73%的准确率。
该数据集包含英文和越南语样本。每个样本有三种解决方案:编码解决方案、解释解决方案和直接解决方案,分别用<sol>、<exp>和<dir>标记。对于编码解决方案,执行Python代码以获取输出结果。使用该数据集和QLoRA在Tora-Code-13b上,可以在越南小学数学 - Zalo AI Challenge 2023的公开测试中达到73%的准确率。
提供机构:
thanhdath
原始信息汇总
数据集概述
数据特征
- 输入:字符串类型
- 输出:字符串类型
数据划分
- 训练集:
- 字节数:21151768
- 样本数:22825
数据大小
- 下载大小:7937515
- 数据集大小:21151768
配置信息
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集描述
- 包含英语和越南语样本。
- 每个样本包含三种解决方案:
- 代码解决方案(标记为
<sol>) - 解释解决方案(标记为
<exp>) - 直接解决方案(标记为
<dir>)
- 代码解决方案(标记为
- 对于代码解决方案,执行包裹在中的Python代码以获得输出结果。不要信任模型生成的选择,只需执行代码并映射到选择。
- 使用此数据集和QLoRA在Tora-Code-13b上,可以在越南小学数学-Zalo AI挑战赛2023的公开测试中达到73%的准确率。



