ddrg/math_formula_retrieval
收藏Hugging Face2025-07-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ddrg/math_formula_retrieval
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于71个著名数学恒等式,每个条目包含两个恒等式(公式或文本形式)和一个标签,指示这两个版本是否描述相同的数学恒等式。数据集中假版本的数目是真版本的十倍,以便于在训练中每轮更换假例子。
该数据集基于71个著名数学恒等式,每个条目包含两个恒等式(公式或文本形式)和一个标签,指示这两个版本是否描述相同的数学恒等式。数据集中假版本的数目是真版本的十倍,以便于在训练中每轮更换假例子。
提供机构:
ddrg
原始信息汇总
数据集概述
数据集信息
-
特征列表:
formula1:字符串类型formula2:字符串类型label:布尔类型formula1_name_id:字符串类型
-
数据分割:
train:- 字节数:7285320882
- 样本数:21348512
test:- 字节数:809630657
- 样本数:2372048
-
下载大小:3656462517 字节
-
数据集大小:8094951539 字节
数据集描述
- 基于71个著名数学恒等式的数学数据集。
- 每个条目包含两个恒等式(公式或文本形式)和一个标签,表示这两个版本是否描述相同的数学恒等式。
- 错误对并非随机选择,而是有意选择难以区分的等价表示。
- 每个恒等式最多生成400000个版本。
- 错误版本的数量是正确版本的十倍,以便在每个训练周期中更改错误示例。



