five

WildEval/WildBench-Results-V2

收藏
Hugging Face2024-05-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/WildEval/WildBench-Results-V2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置对应一个特定的模型版本(如Mistral-7B-Instruct-v0.2、Mixtral-8x7B-Instruct-v0.1等)。每个配置的特征包括会话ID、聊天历史、模型输入、输出、生成器、配置参数(如引擎、最大token数、重复惩罚、温度、top_p等)、数据集名称和主要标签。数据集主要用于训练这些模型,每个配置的训练分片包含1024个示例,字节数因配置不同而异。

该数据集包含多个配置,每个配置对应一个特定的模型版本(如Mistral-7B-Instruct-v0.2、Mixtral-8x7B-Instruct-v0.1等)。每个配置的特征包括会话ID、聊天历史、模型输入、输出、生成器、配置参数(如引擎、最大token数、重复惩罚、温度、top_p等)、数据集名称和主要标签。数据集主要用于训练这些模型,每个配置的训练分片包含1024个示例,字节数因配置不同而异。
提供机构:
WildEval
原始信息汇总

数据集概述

数据集配置信息

Mistral-7B-Instruct-v0.2

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 7241218
      • 样本数: 1024
  • 下载大小: 3922297 字节
  • 数据集大小: 7241218 字节

Mixtral-8x7B-Instruct-v0.1

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 7015688
      • 样本数: 1024
  • 下载大小: 3759961 字节
  • 数据集大小: 7015688 字节

Qwen1.5-72B-Chat

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 6948555
      • 样本数: 1024
  • 下载大小: 3864960 字节
  • 数据集大小: 6948555 字节

Yi-34B-Chat

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 14947430
      • 样本数: 1024
  • 下载大小: 5408033 字节
  • 数据集大小: 14947430 字节

claude-3-haiku-20240307

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 4906715
      • 样本数: 1024
  • 下载大小: 2607267 字节
  • 数据集大小: 4906715 字节

claude-3-opus-20240229

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 4925361
      • 样本数: 1024
  • 下载大小: 2668480 字节
  • 数据集大小: 4925361 字节

claude-3-sonnet-20240229

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 4886567
      • 样本数: 1024
  • 下载大小: 2642597 字节
  • 数据集大小: 4886567 字节

gpt-3.5-turbo-0125

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 4083310
      • 样本数: 1024
  • 下载大小: 2218649 字节
  • 数据集大小: 4083310 字节

gpt-4-turbo-2024-04-09

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 5520239
      • 样本数: 1024
  • 下载大小: 3053149 字节
  • 数据集大小: 5520239 字节

gpt-4o-2024-05-13

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体
      • engine: 字符串
      • max_tokens: 64位整数
      • repetition_penalty: 64位整数
      • temperature: 64位浮点数
      • top_p: 64位浮点数
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train:
      • 字节数: 6022655
      • 样本数: 1024
  • 下载大小: 3152767 字节
  • 数据集大小: 6022655 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作