five

bigdata-pw/aops

收藏
Hugging Face2024-08-05 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/bigdata-pw/aops
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了来自Art of Problem Solving社区的帖子和主题存档。数据集分为几个类别,包括中学数学、高中数学、高中奥林匹克数学和大学数学。数据集包含580,485个主题和3,074,411个帖子。数据格式为jsonlines和MongoDB dump,并且都是经过gzip压缩的。所有字段都包含在内,没有删除任何内容,但附件和头像文件不包括在此版本中。

This dataset contains an archive of topics and posts from the Art of Problem Solving community. The dataset is categorized into several areas including Middle School Math, High School Math, High School Olympiads, and College Math. It includes 580,485 topics and 3,074,411 posts. The data is available in jsonlines and MongoDB dump formats, both of which are gzip compressed. All fields are included with nothing removed, but files of attachments and avatars are not included in this release.
提供机构:
bigdata-pw
原始信息汇总

Art of Problem Solving 数据集概述

数据集信息

  • 名称: Art of Problem Solving
  • 许可证: Apache 2.0
  • 数据量: 1M < n < 10M

数据内容

  • 类别:
    • 初中数学
    • 高中数学
    • 高中奥林匹克
    • 大学数学
  • 统计:
    • 主题数: 580,485
    • 帖子数: 3,074,411

数据格式

  • 格式:
    • jsonlines
    • MongoDB dump
  • 压缩: gzip

备注

  • 所有字段均包含,无删除。
  • 帖子包括每个主题的初始帖子,文档包括相同的初始帖子及主题标题等。
  • 附件和头像文件未包含在此版本中,但URL可用于下载。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作