five

p1atdev/OnlineMathContest-1.4k

收藏
Hugging Face2024-03-23 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/p1atdev/OnlineMathContest-1.4k
下载链接
链接失效反馈
资源简介:
--- language: - ja license: cc-by-sa-4.0 size_categories: - 1K<n<10K dataset_info: features: - name: contest dtype: string - name: contest_url dtype: string - name: url dtype: string - name: alphabet dtype: string - name: name dtype: string - name: score dtype: string - name: correct dtype: int64 - name: total dtype: int64 - name: editorials list: - name: content dtype: string - name: text dtype: string - name: url dtype: string - name: task_content dtype: string splits: - name: train num_bytes: 2980019 num_examples: 1478 download_size: 1380260 dataset_size: 2980019 configs: - config_name: default data_files: - split: train path: data/train-* tags: - math --- # OnlineMathContest 1.4k 1.4k pairs dataset of math problems and their solutions in Japanese scraped from [OnlineMathContest](https://onlinemathcontest.com/). **Notice: All problems and solutions have source urls (the `url` field), and their authors and OnlineMathContest own the copyrights.** ## Dataset fields - `contest`: Name of the contest that contains each problem. - `contest_url`: The url of a contest that contains each problem. - `url`: The url of each problem. - `alphabet`: The alphabet of each problem. (e.g. `A`, `B`, ...) - `name`: The name of each problem. - `score`: The number of points earned for solving each problem. - `correct`: The number of people who could solve each problem during their contest. - `total`: The total number of people who tried to solve each problem during their contest. - `editorials`: The solution and explanation of each problem by the author or volunteers. - `url`: The url of each solution. - `name`: The name of each solution. (e.g. `公式解説`) - `content`: The content text of each solution. This might be null sometimes. - `task_content`: The content text of each problem. `editorials.content` and `task_content` uses Markdown and [KaTeX](https://katex.org/) markup. ## Example ```json { "contest": "OMC215 (お茶ゼミ√+杯)", "contest_url": "https://onlinemathcontest.com/contests/omc215", "url": "https://onlinemathcontest.com/contests/omc215/tasks/9284", "alphabet": "A", "name": "OMC215(A)", "score": "100", "correct": 387, "total": 412, "editorials": [ { "content": "$$\\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}\\leq\\frac{\\max\\lbrace a^2-1001a+1001^2\\rbrace}{\\min\\lbrace b^2-1001b+1001^2\\rbrace}$$\r\nであり,等号が成立するのは $a=1,1000$ かつ $b=500,501$ のときであるので解答すべき値は\r\n$$(1+500)+(1+501)+(1000+500)+(1000+501)=\\mathbf{4004}.$$", "text": "公式解説", "url": "https://onlinemathcontest.com/contests/omc215/editorial/9284" } ], "task_content": "  $1\\leq a\\leq 1000, ~ 1\\leq b\\leq 1000$ なる整数 $a,b$ について,\r\n$$\\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}$$\r\nがありうる最大の値をとるとき,$a+b$ としてありうる値の総和を求めてください." } ```

语言: - 日语 许可协议:知识共享署名-相同方式共享4.0(CC BY-SA 4.0) 规模类别: - 1000 < 样本数 < 10000 数据集信息: 特征字段: - 名称:contest,数据类型:字符串 - 名称:contest_url,数据类型:字符串 - 名称:url,数据类型:字符串 - 名称:alphabet,数据类型:字符串 - 名称:name,数据类型:字符串 - 名称:score,数据类型:字符串 - 名称:correct,数据类型:整数 - 名称:total,数据类型:整数 - 名称:editorials,数据类型:列表,列表元素包含子字段: - 名称:content,数据类型:字符串 - 名称:text,数据类型:字符串 - 名称:url,数据类型:字符串 - 名称:task_content,数据类型:字符串 数据拆分: - 名称:train,字节数:2980019,样本数:1478 下载大小:1380260 数据集总大小:2980019 配置项: - 配置名称:default,数据文件: - 拆分:train,路径:data/train-* 标签: - 数学 # OnlineMathContest 1.4k 数据集 本数据集包含1400余条日语数学题目与对应题解的配对数据,所有数据均爬取自[OnlineMathContest](https://onlinemathcontest.com/)平台。 **注意:所有题目与题解均附带来源URL(即`url`字段),其著作权归原作者及OnlineMathContest平台所有。** ## 数据集字段说明 - `contest`:该题目所属竞赛的名称。 - `contest_url`:该题目所属竞赛的页面URL。 - `url`:单道题目的页面URL。 - `alphabet`:单道题目的字母标识(例如`A`、`B`等)。 - `name`:单道题目的名称。 - `score`:解答该题可获得的分值。 - `correct`:竞赛期间成功解答该题的参赛人数。 - `total`:竞赛期间尝试解答该题的总参赛人数。 - `editorials`:由原题作者或志愿者撰写的题目解析与题解,包含子字段: - `url`:题解页面的URL。 - `text`:题解的名称(例如`公式解説`,即官方解析)。 - `content`:题解的内容文本,部分情况下可能为空值。 - `task_content`:单道题目的正文文本。 `editorials.content` 与 `task_content` 字段采用Markdown格式与[KaTeX](https://katex.org/)数学标记语法。 ## 示例 json { "contest": "OMC215 (お茶ゼミ√+杯)", "contest_url": "https://onlinemathcontest.com/contests/omc215", "url": "https://onlinemathcontest.com/contests/omc215/tasks/9284", "alphabet": "A", "name": "OMC215(A)", "score": "100", "correct": 387, "total": 412, "editorials": [ { "content": "$$\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}\leq\frac{\max\lbrace a^2-1001a+1001^2\rbrace}{\min\lbrace b^2-1001b+1001^2\rbrace}$$ であり,等号が成立するのは $a=1,1000$ かつ $b=500,501$ のときであるので解答すべき値は $$(1+500)+(1+501)+(1000+500)+(1000+501)=\mathbf{4004}.$$", "text": "公式解説", "url": "https://onlinemathcontest.com/contests/omc215/editorial/9284" } ], "task_content": "  $1\leq a\leq 1000, ~ 1\leq b\leq 1000$ なる整数 $a,b$ について, $$\frac{a^2-1001a+1001^2}{b^2-1001b+1001^2}$$ がありうる最大の値をとるとき,$a+b$ としてありうる値の総和を求めてください." }
提供机构:
p1atdev
原始信息汇总

数据集概述

基本信息

  • 语言: 日语
  • 许可证: CC-BY-SA-4.0
  • 数据集大小: 1K<n<10K

数据集特征

  • contest: 字符串类型,包含问题的比赛名称。
  • contest_url: 字符串类型,包含问题的比赛的URL。
  • url: 字符串类型,问题的URL。
  • alphabet: 字符串类型,问题的字母标识(例如:A, B, ...)。
  • name: 字符串类型,问题的名称。
  • score: 字符串类型,解决问题获得的分数。
  • correct: 整数类型,比赛中能解决该问题的人数。
  • total: 整数类型,比赛中尝试解决该问题的人数。
  • editorials: 列表类型,包含问题的解答和解释。
    • content: 字符串类型,解答的内容文本,有时可能为空。
    • text: 字符串类型,解答的名称(例如:公式解説)。
    • url: 字符串类型,解答的URL。
  • task_content: 字符串类型,问题的内容文本。

数据集划分

  • train: 训练集,包含1478个示例,总字节数为2980019。

下载与数据集大小

  • 下载大小: 1380260字节
  • 数据集大小: 2980019字节

配置

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*

标签

  • math
AI搜集汇总
数据集介绍
main_image_url
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作