five

RealTimeData/math_alltime

收藏
Hugging Face2025-06-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RealTimeData/math_alltime
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置对应一个时间段(如2017-01到2020-03),每个配置包含问题、问题ID、得分、链接、正文、答案列表(包含答案ID、得分和文本)以及一个名为verbolised的字段。数据分割仅包含训练集,且每个配置的训练集都有对应的字节大小和示例数量。

This dataset contains multiple configurations, each corresponding to a time period (e.g., 2017-01 to 2020-03). Each configuration includes features such as question, question ID, score, link, body, a list of answers (containing answer ID, score, and text), and a field named verbolised. The data split only includes the training set, and each configurations training set has corresponding byte size and number of examples.
提供机构:
RealTimeData
原始信息汇总

数据集概述

该数据集包含多个配置,每个配置对应不同的时间段,从2017年1月至2020年3月。每个配置包含以下特征和分割信息:

特征

  • question: 问题文本,数据类型为字符串。
  • question_id: 问题ID,数据类型为64位整数。
  • score: 问题得分,数据类型为64位整数。
  • link: 问题链接,数据类型为字符串。
  • body: 问题正文,数据类型为字符串。
  • answers: 答案列表,包含以下子特征:
    • answer_id: 答案ID,数据类型为64位整数。
    • score: 答案得分,数据类型为64位整数。
    • text: 答案文本,数据类型为字符串。
  • verbolised: 数据类型为字符串。

分割信息

  • train: 训练集分割,包含以下统计信息:
    • num_bytes: 数据字节数。
    • num_examples: 样本数量。

下载和数据集大小

  • download_size: 下载大小,以字节为单位。
  • dataset_size: 数据集大小,以字节为单位。

具体配置信息

以下是各配置的具体信息:

  • 2017-01

    • 训练集字节数: 80660853
    • 样本数量: 941
    • 下载大小: 9158732
    • 数据集大小: 80660853
  • 2017-02

    • 训练集字节数: 84851628
    • 样本数量: 910
    • 下载大小: 10270205
    • 数据集大小: 84851628
  • 2017-03

    • 训练集字节数: 65654141
    • 样本数量: 873
    • 下载大小: 8389188
    • 数据集大小: 65654141
  • 2017-04

    • 训练集字节数: 69962303
    • 样本数量: 900
    • 下载大小: 8649741
    • 数据集大小: 69962303
  • 2017-05

    • 训练集字节数: 61331035
    • 样本数量: 850
    • 下载大小: 7502347
    • 数据集大小: 61331035
  • 2017-06

    • 训练集字节数: 69089197
    • 样本数量: 857
    • 下载大小: 8504218
    • 数据集大小: 69089197
  • 2017-07

    • 训练集字节数: 65942734
    • 样本数量: 833
    • 下载大小: 7792388
    • 数据集大小: 65942734
  • 2017-08

    • 训练集字节数: 68340459
    • 样本数量: 842
    • 下载大小: 8487447
    • 数据集大小: 68340459
  • 2017-09

    • 训练集字节数: 61008346
    • 样本数量: 896
    • 下载大小: 7278417
    • 数据集大小: 61008346
  • 2017-10

    • 训练集字节数: 53163267
    • 样本数量: 818
    • 下载大小: 6483992
    • 数据集大小: 53163267
  • 2017-11

    • 训练集字节数: 59760183
    • 样本数量: 808
    • 下载大小: 7924709
    • 数据集大小: 59760183
  • 2017-12

    • 训练集字节数: 55924348
    • 样本数量: 836
    • 下载大小: 6647153
    • 数据集大小: 55924348
  • 2018-01

    • 训练集字节数: 53423968
    • 样本数量: 804
    • 下载大小: 6435279
    • 数据集大小: 53423968
  • 2018-02

    • 训练集字节数: 56097587
    • 样本数量: 836
    • 下载大小: 6786404
    • 数据集大小: 56097587
  • 2018-03

    • 训练集字节数: 52716955
    • 样本数量: 811
    • 下载大小: 6716783
    • 数据集大小: 52716955
  • 2018-04

    • 训练集字节数: 61021658
    • 样本数量: 834
    • 下载大小: 7312214
    • 数据集大小: 61021658
  • 2018-05

    • 训练集字节数: 55772617
    • 样本数量: 786
    • 下载大小: 7085239
    • 数据集大小: 55772617
  • 2018-06

    • 训练集字节数: 51150298
    • 样本数量: 749
    • 下载大小: 6364046
    • 数据集大小: 51150298
  • 2018-07

    • 训练集字节数: 54584695
    • 样本数量: 758
    • 下载大小: 6726781
    • 数据集大小: 54584695
  • 2018-08

    • 训练集字节数: 55593417
    • 样本数量: 781
    • 下载大小: 6974572
    • 数据集大小: 55593417
  • 2018-09

    • 训练集字节数: 54969100
    • 样本数量: 823
    • 下载大小: 6338898
    • 数据集大小: 54969100
  • 2018-10

    • 训练集字节数: 61315262
    • 样本数量: 760
    • 下载大小: 6851372
    • 数据集大小: 61315262
  • 2018-11

    • 训练集字节数: 60746966
    • 样本数量: 716
    • 下载大小: 6647704
    • 数据集大小: 60746966
  • 2018-12

    • 训练集字节数: 66850978
    • 样本数量: 743
    • 下载大小: 8017159
    • 数据集大小: 66850978
  • 2019-01

    • 训练集字节数: 66498129
    • 样本数量: 757
    • 下载大小: 7133679
    • 数据集大小: 66498129
  • 2019-02

    • 训练集字节数: 62762617
    • 样本数量: 727
    • 下载大小: 7362944
    • 数据集大小: 62762617
  • 2019-03

    • 训练集字节数: 53635552
    • 样本数量: 722
    • 下载大小: 6159124
    • 数据集大小: 53635552
  • 2019-04

    • 训练集字节数: 55324827
    • 样本数量: 711
    • 下载大小: 6655057
    • 数据集大小: 55324827
  • 2019-05

    • 训练集字节数: 56829578
    • 样本数量: 723
    • 下载大小: 6558721
    • 数据集大小: 56829578
  • 2019-06

    • 训练集字节数: 61139555
    • 样本数量: 688
    • 下载大小: 7221420
    • 数据集大小: 61139555
  • 2019-07

    • 训练集字节数: 53673145
    • 样本数量: 683
    • 下载大小: 6416744
    • 数据集大小: 53673145
  • 2019-08

    • 训练集字节数: 77910351
    • 样本数量: 747
    • 下载大小: 9404169
    • 数据集大小: 77910351
  • 2019-09

    • 训练集字节数: 63119202
    • 样本数量: 745
    • 下载大小: 7318462
    • 数据集大小: 63119202
  • 2019-10

    • 训练集字节数: 49155709
    • 样本数量: 683
    • 下载大小: 5592949
    • 数据集大小: 49155709
  • 2019-11

    • 训练集字节数: 48224122
    • 样本数量: 709
    • 下载大小: 5549457
    • 数据集大小: 48224122
  • 2019-12

    • 训练集字节数: 55688069
    • 样本数量: 710
    • 下载大小: 6563642
    • 数据集大小: 55688069
  • 2020-01

    • 训练集字节数: 53792398
    • 样本数量: 683
    • 下载大小: 6403117
    • 数据集大小: 53792398
  • 2020-02

    • 训练集字节数: 46752243
    • 样本数量: 683
    • 下载大小: 5617224
    • 数据集大小: 46752243
  • 2020-03

    • 训练集字节数: 44255484
    • 样本数量: 683
    • 下载大小: 5617224
    • 数据集大小: 44255484
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作