AI-MO/aimo-validation-amc|数学竞赛数据集|数据验证数据集
收藏数据集概述
数据集信息
- 特征:
id
: 整数类型problem
: 字符串类型answer
: 浮点数类型url
: 字符串类型
- 分割:
train
: 包含83个样本,占用32699字节
- 下载大小: 19141字节
- 数据集大小: 32699字节
配置
- 配置名称:
default
- 数据文件:
train
: 路径为data/train-*
- 数据文件:
数据集来源
- 数据集包含83个样本,来源于AMC12 2022和AMC12 2023,提取自AOPS wiki页面。
数据集用途
- 作为AIMO进步奖竞赛中的内部验证集。
- 使用2021年之后的数据以避免与MATH训练集的潜在重叠。
数据集字段说明
problem
: 修改后的问题陈述answer
: 适应的整数答案url
: 问题页面的URL
数据集创建过程
- 原始AMC12问题为多项选择题,包含4个选项。
- 为了更接近AIMO进步奖的条件,问题陈述被修改为要求整数输出。
- 无法修改陈述的问题被拒绝。
示例
原始问题
Flora the frog starts at 0 on the number line and makes a sequence of jumps to the right. In any one jump, independent of previous jumps, Flora leaps a positive integer distance $m$ with probability $frac{1}{2^m}$. What is the probability that Flora will eventually land at 10? $ extbf{(A)}~frac{5}{512}qquad extbf{(B)}~frac{45}{1024}qquad extbf{(C)}~frac{127}{1024}qquad extbf{(D)}~frac{511}{1024}qquad extbf{(E)}~frac{1}{2}$
修改后的问题
Flora the frog starts at 0 on the number line and makes a sequence of jumps to the right. In any one jump, independent of previous jumps, Flora leaps a positive integer distance $m$ with probability $frac{1}{2^m}$. What is the probability that Flora will eventually land at 10? Write the answer as a simplified fraction $frac{m}{n}$, find $m+n$

Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
UCSD26/medical_dialog
MedDialog数据集包含中英文两种语言的医患对话数据。中文数据集包含110万条对话和400万条话语,数据来源于haodf.com。英文数据集包含26万条对话,数据来源于healthcaremagic.com和icliniq.com。数据集的结构包括原始数据和经过处理的数据,原始数据包含对话ID、URL、患者病情描述和对话内容,处理后的数据则包括描述和对话话语。数据集的主要任务是封闭领域的问答(Closed domain QA)。
hugging_face 收录
weibo-comments-v1
该数据集包含多个特征,如id、文本内容、标记的id、用户昵称、评论和标签。数据集被分为训练集和测试集,分别有2325和582个样本。数据集的下载大小为810622字节,数据集大小为1266259.0字节。
huggingface 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录