stallone/MetaMathQA
收藏Hugging Face2024-07-01 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/stallone/MetaMathQA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是meta-math/MetaMathQA的重新格式化版本,包含了多轮对话配置(conversation)和完成配置(completion)。每个配置中的相同文档共享一个v4 UUID `doc_id`。数据集分为三个配置:completion、conversation和source,每个配置包含不同的特征,如输入、输出、文档ID、消息内容、角色、类型、查询、原始问题和响应等。数据集的总大小为300157804字节(completion)、310032804字节(conversation)和385274919字节(source),分别包含395000个示例。
This dataset is a reformatted version of meta-math/MetaMathQA, including both a multiturn conversation config and a completion config. Each configuration shares a v4 UUID `doc_id` across the same document. The dataset is divided into three configurations: completion, conversation, and source, each containing different features such as input, output, doc_id, messages, roles, type, query, original question, and response. The total dataset sizes are 300157804 bytes (completion), 310032804 bytes (conversation), and 385274919 bytes (source), each containing 395000 examples.
提供机构:
stallone
原始信息汇总
数据集概述
数据集配置
配置名称:completion
- 特征:
input:类型为字符串output:类型为字符串doc_id:类型为字符串
- 分割:
train:包含395,000个样本,占用300,157,804字节
- 下载大小:156,700,784字节
- 数据集大小:300,157,804字节
- 数据文件路径:
completion/train-*
配置名称:conversation
- 特征:
doc_id:类型为字符串messages:列表类型,包含以下字段:content:类型为字符串role:类型为字符串
- 分割:
train:包含395,000个样本,占用310,032,804字节
- 下载大小:144,428,577字节
- 数据集大小:310,032,804字节
- 数据文件路径:
conversation/train-*
配置名称:source
- 特征:
type:类型为字符串query:类型为字符串original_question:类型为字符串response:类型为字符串doc_id:类型为字符串
- 分割:
train:包含395,000个样本,占用385,274,919字节
- 下载大小:202,640,014字节
- 数据集大小:385,274,919字节
- 数据文件路径:
source/train-*
其他信息
- 该数据集是meta-math/MetaMathQA的重新格式化版本,包含多轮对话配置
conversation和完成配置completion。 - 每个配置中的相同文档共享一个v4 UUID
doc_id。



