p1atdev/OnlineMathContest-1.4k
收藏Hugging Face2024-03-23 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/p1atdev/OnlineMathContest-1.4k
下载链接
链接失效反馈资源简介:
---
language:
- ja
license: cc-by-sa-4.0
size_categories:
- 1K<n<10K
dataset_info:
features:
- name: contest
dtype: string
- name: contest_url
dtype: string
- name: url
dtype: string
- name: alphabet
dtype: string
- name: name
dtype: string
- name: score
dtype: string
- name: correct
dtype: int64
- name: total
dtype: int64
- name: editorials
list:
- name: content
dtype: string
- name: text
dtype: string
- name: url
dtype: string
- name: task_content
dtype: string
splits:
- name: train
num_bytes: 2980019
num_examples: 1478
download_size: 1380260
dataset_size: 2980019
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
tags:
- math
---
# OnlineMathContest 1.4k
1.4k pairs dataset of math problems and their solutions in Japanese scraped from [OnlineMathContest](https://onlinemathcontest.com/).
**Notice: All problems and solutions have source urls (the `url` field), and their authors and OnlineMathContest own the copyrights.**
## Dataset fields
- `contest`: Name of the contest that contains each problem.
- `contest_url`: The url of a contest that contains each problem.
- `url`: The url of each problem.
- `alphabet`: The alphabet of each problem. (e.g. `A`, `B`, ...)
- `name`: The name of each problem.
- `score`: The number of points earned for solving each problem.
- `correct`: The number of people who could solve each problem during their contest.
- `total`: The total number of people who tried to solve each problem during their contest.
- `editorials`: The solution and explanation of each problem by the author or volunteers.
- `url`: The url of each solution.
- `name`: The name of each solution. (e.g. `公式解説`)
- `content`: The content text of each solution. This might be null sometimes.
- `task_content`: The content text of each problem.
`editorials.content` and `task_content` uses Markdown and [KaTeX](https://katex.org/) markup.
## Example
```json
{
"contest": "OMC215 (お茶ゼミ√+杯)",
"contest_url": "https://onlinemathcontest.com/contests/omc215",
"url": "https://onlinemathcontest.com/contests/omc215/tasks/9284",
"alphabet": "A",
"name": "OMC215(A)",
"score": "100",
"correct": 387,
"total": 412,
"editorials": [
{
"content": "$$\\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}\\leq\\frac{\\max\\lbrace a^2-1001a+1001^2\\rbrace}{\\min\\lbrace b^2-1001b+1001^2\\rbrace}$$\r\nであり,等号が成立するのは $a=1,1000$ かつ $b=500,501$ のときであるので解答すべき値は\r\n$$(1+500)+(1+501)+(1000+500)+(1000+501)=\\mathbf{4004}.$$",
"text": "公式解説",
"url": "https://onlinemathcontest.com/contests/omc215/editorial/9284"
}
],
"task_content": " $1\\leq a\\leq 1000, ~ 1\\leq b\\leq 1000$ なる整数 $a,b$ について,\r\n$$\\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}$$\r\nがありうる最大の値をとるとき,$a+b$ としてありうる値の総和を求めてください."
}
```
语言:
- 日语
许可协议:知识共享署名-相同方式共享4.0(CC BY-SA 4.0)
规模类别:
- 1000 < 样本数 < 10000
数据集信息:
特征字段:
- 名称:contest,数据类型:字符串
- 名称:contest_url,数据类型:字符串
- 名称:url,数据类型:字符串
- 名称:alphabet,数据类型:字符串
- 名称:name,数据类型:字符串
- 名称:score,数据类型:字符串
- 名称:correct,数据类型:整数
- 名称:total,数据类型:整数
- 名称:editorials,数据类型:列表,列表元素包含子字段:
- 名称:content,数据类型:字符串
- 名称:text,数据类型:字符串
- 名称:url,数据类型:字符串
- 名称:task_content,数据类型:字符串
数据拆分:
- 名称:train,字节数:2980019,样本数:1478
下载大小:1380260
数据集总大小:2980019
配置项:
- 配置名称:default,数据文件:
- 拆分:train,路径:data/train-*
标签:
- 数学
# OnlineMathContest 1.4k 数据集
本数据集包含1400余条日语数学题目与对应题解的配对数据,所有数据均爬取自[OnlineMathContest](https://onlinemathcontest.com/)平台。
**注意:所有题目与题解均附带来源URL(即`url`字段),其著作权归原作者及OnlineMathContest平台所有。**
## 数据集字段说明
- `contest`:该题目所属竞赛的名称。
- `contest_url`:该题目所属竞赛的页面URL。
- `url`:单道题目的页面URL。
- `alphabet`:单道题目的字母标识(例如`A`、`B`等)。
- `name`:单道题目的名称。
- `score`:解答该题可获得的分值。
- `correct`:竞赛期间成功解答该题的参赛人数。
- `total`:竞赛期间尝试解答该题的总参赛人数。
- `editorials`:由原题作者或志愿者撰写的题目解析与题解,包含子字段:
- `url`:题解页面的URL。
- `text`:题解的名称(例如`公式解説`,即官方解析)。
- `content`:题解的内容文本,部分情况下可能为空值。
- `task_content`:单道题目的正文文本。
`editorials.content` 与 `task_content` 字段采用Markdown格式与[KaTeX](https://katex.org/)数学标记语法。
## 示例
json
{
"contest": "OMC215 (お茶ゼミ√+杯)",
"contest_url": "https://onlinemathcontest.com/contests/omc215",
"url": "https://onlinemathcontest.com/contests/omc215/tasks/9284",
"alphabet": "A",
"name": "OMC215(A)",
"score": "100",
"correct": 387,
"total": 412,
"editorials": [
{
"content": "$$\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}\leq\frac{\max\lbrace a^2-1001a+1001^2\rbrace}{\min\lbrace b^2-1001b+1001^2\rbrace}$$
であり,等号が成立するのは $a=1,1000$ かつ $b=500,501$ のときであるので解答すべき値は
$$(1+500)+(1+501)+(1000+500)+(1000+501)=\mathbf{4004}.$$",
"text": "公式解説",
"url": "https://onlinemathcontest.com/contests/omc215/editorial/9284"
}
],
"task_content": " $1\leq a\leq 1000, ~ 1\leq b\leq 1000$ なる整数 $a,b$ について,
$$\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}$$
がありうる最大の値をとるとき,$a+b$ としてありうる値の総和を求めてください."
}
提供机构:
p1atdev
原始信息汇总
数据集概述
基本信息
- 语言: 日语
- 许可证: CC-BY-SA-4.0
- 数据集大小: 1K<n<10K
数据集特征
- contest: 字符串类型,包含问题的比赛名称。
- contest_url: 字符串类型,包含问题的比赛的URL。
- url: 字符串类型,问题的URL。
- alphabet: 字符串类型,问题的字母标识(例如:
A,B, ...)。 - name: 字符串类型,问题的名称。
- score: 字符串类型,解决问题获得的分数。
- correct: 整数类型,比赛中能解决该问题的人数。
- total: 整数类型,比赛中尝试解决该问题的人数。
- editorials: 列表类型,包含问题的解答和解释。
- content: 字符串类型,解答的内容文本,有时可能为空。
- text: 字符串类型,解答的名称(例如:
公式解説)。 - url: 字符串类型,解答的URL。
- task_content: 字符串类型,问题的内容文本。
数据集划分
- train: 训练集,包含1478个示例,总字节数为2980019。
下载与数据集大小
- 下载大小: 1380260字节
- 数据集大小: 2980019字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
标签
- math
AI搜集汇总
数据集介绍

以上内容由AI搜集并总结生成



