five

vinhnq29/ViMathQA

收藏
Hugging Face2024-07-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/vinhnq29/ViMathQA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:test_v1和train_v1。test_v1配置包含五个特征:instruction(指令)、question(问题)、choices(选项)、answer(答案)和right_choice(正确选项),并且有四个分割:train(训练集)、test(测试集)、base_models(基础模型)和base_models_test(基础模型测试集)。train_v1配置包含一个特征segments(片段),其中segments是一个包含label(标签)和text(文本)的列表,并且有七个分割,每个分割对应不同的模型输出,如vinallama、zephyr、vistral等。数据集的大小和下载大小也被详细列出。

The dataset contains two configurations: test_v1 and train_v1. The test_v1 configuration includes five features: instruction, question, choices, answer, and right_choice, and has four splits: train, test, base_models, and base_models_test. The train_v1 configuration includes one feature, segments, which is a list containing label and text, and has seven splits, each corresponding to different model outputs such as vinallama, zephyr, vistral, etc. The size of the dataset and the download size are also detailed.
提供机构:
vinhnq29
原始信息汇总

数据集概述

配置 test_v1

  • 特征:
    • instruction: 字符串类型
    • question: 字符串类型
    • choices: 字符串序列
    • answer: 字符串类型
    • right_choice: 字符串类型
  • 分割:
    • train: 511629 字节, 1104 个样本
    • test: 511629 字节, 1104 个样本
    • base_models: 442114.1902173913 字节, 954 个样本
    • base_models_test: 442114.1902173913 字节, 954 个样本
  • 下载大小: 818786 字节
  • 数据集大小: 1907486.3804347827 字节

配置 train_v1

  • 特征:
    • segments: 列表类型
      • label: 布尔类型
      • text: 字符串类型
  • 分割:
    • input_output_vinallama: 3806969 字节, 7107 个样本
    • input_output_zephyr: 3509173 字节, 7107 个样本
    • input_output_vistral: 3464945 字节, 7107 个样本
    • input_output_wizardmath: 4181916 字节, 7107 个样本
    • input_output_qwen: 3808346 字节, 7107 个样本
    • input_output_metamath: 4184665 字节, 7107 个样本
    • input_output_meta_llama_3_8b_instruct: 4566175 字节, 7107 个样本
  • 下载大小: 10944995 字节
  • 数据集大小: 27522189 字节

数据文件路径

  • 配置 test_v1:
    • train: test_v1/train-*
    • test: test_v1/test-*
    • base_models: test_v1/base_models-*
    • base_models_test: test_v1/base_models_test-*
  • 配置 train_v1:
    • input_output_vinallama: train_v1/input_output_vinallama-*
    • input_output_zephyr: train_v1/input_output_zephyr-*
    • input_output_vistral: train_v1/input_output_vistral-*
    • input_output_wizardmath: train_v1/input_output_wizardmath-*
    • input_output_qwen: train_v1/input_output_qwen-*
    • input_output_metamath: train_v1/input_output_metamath-*
    • input_output_meta_llama_3_8b_instruct: train_v1/input_output_meta_llama_3_8b_instruct-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作