five

stallone/MetaMathQA

收藏
Hugging Face2024-07-01 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/stallone/MetaMathQA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是meta-math/MetaMathQA的重新格式化版本,包含了多轮对话配置(conversation)和完成配置(completion)。每个配置中的相同文档共享一个v4 UUID `doc_id`。数据集分为三个配置:completion、conversation和source,每个配置包含不同的特征,如输入、输出、文档ID、消息内容、角色、类型、查询、原始问题和响应等。数据集的总大小为300157804字节(completion)、310032804字节(conversation)和385274919字节(source),分别包含395000个示例。

This dataset is a reformatted version of meta-math/MetaMathQA, including both a multiturn conversation config and a completion config. Each configuration shares a v4 UUID `doc_id` across the same document. The dataset is divided into three configurations: completion, conversation, and source, each containing different features such as input, output, doc_id, messages, roles, type, query, original question, and response. The total dataset sizes are 300157804 bytes (completion), 310032804 bytes (conversation), and 385274919 bytes (source), each containing 395000 examples.
提供机构:
stallone
原始信息汇总

数据集概述

数据集配置

配置名称:completion

  • 特征
    • input:类型为字符串
    • output:类型为字符串
    • doc_id:类型为字符串
  • 分割
    • train:包含395,000个样本,占用300,157,804字节
  • 下载大小:156,700,784字节
  • 数据集大小:300,157,804字节
  • 数据文件路径completion/train-*

配置名称:conversation

  • 特征
    • doc_id:类型为字符串
    • messages:列表类型,包含以下字段:
      • content:类型为字符串
      • role:类型为字符串
  • 分割
    • train:包含395,000个样本,占用310,032,804字节
  • 下载大小:144,428,577字节
  • 数据集大小:310,032,804字节
  • 数据文件路径conversation/train-*

配置名称:source

  • 特征
    • type:类型为字符串
    • query:类型为字符串
    • original_question:类型为字符串
    • response:类型为字符串
    • doc_id:类型为字符串
  • 分割
    • train:包含395,000个样本,占用385,274,919字节
  • 下载大小:202,640,014字节
  • 数据集大小:385,274,919字节
  • 数据文件路径source/train-*

其他信息

  • 该数据集是meta-math/MetaMathQA的重新格式化版本,包含多轮对话配置conversation和完成配置completion
  • 每个配置中的相同文档共享一个v4 UUID doc_id
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作