five

allenai/WildBench-V2-Model-Outputs

收藏
Hugging Face2024-07-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/allenai/WildBench-V2-Model-Outputs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置与不同的模型相关联。数据集共享一些共同的特征,如session_id、chat_history、model_input、output、generator、configs(包括engine、max_tokens、repetition_penalty、temperature、top_p)、dataset和primary_tag。每个配置都有一个train分割,指定了num_bytes和num_examples,以及download_size和dataset_size。这些数据集设计用于训练目的,可能涉及自然语言处理任务,特别是与聊天和模型输入/输出相关的任务。

This dataset contains multiple configurations, each associated with different models. The datasets share common features such as session_id, chat_history, model_input, output, generator, configs (including engine, max_tokens, repetition_penalty, temperature, top_p), dataset, and primary_tag. Each configuration has a train split with specified num_bytes and num_examples, along with download_size and dataset_size. The datasets are designed for training purposes, likely involving natural language processing tasks, particularly those related to chat and model inputs/outputs.
提供机构:
allenai
原始信息汇总

数据集概述

本数据集包含多个配置,每个配置对应不同的模型和数据集特征。以下是各配置的主要信息概览:

配置1: Hermes-2-Theta-Llama-3-8B

  • 特征:
    • session_id: 字符串
    • chat_history: 字符串序列
    • model_input: 字符串
    • output: 字符串序列
    • generator: 字符串
    • configs: 结构体,包含engine(字符串)、max_tokens(int64)、repetition_penalty(int64)、temperature(float64)、top_p(float64)
    • dataset: 字符串
    • primary_tag: 字符串
  • 分割:
    • train: 1024个例子,7614340字节
    • 下载大小: 3946689字节
    • 数据集大小: 7614340字节

配置2: Llama-2-70b-chat-hf

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7918821字节
    • 下载大小: 4102606字节
    • 数据集大小: 7918821字节

配置3: Llama-2-7b-chat-hf

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7761455字节
    • 下载大小: 3957407字节
    • 数据集大小: 7761455字节

配置4: Llama-3-Instruct-8B-SimPO

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7466588字节
    • 下载大小: 4120425字节
    • 数据集大小: 7466588字节

配置5: Llama-3-Instruct-8B-SimPO-ExPO

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7405168字节
    • 下载大小: 4102313字节
    • 数据集大小: 7405168字节

配置6: Meta-Llama-3-70B-Instruct

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7996057字节
    • 下载大小: 4196555字节
    • 数据集大小: 7996057字节

配置7: Meta-Llama-3-8B-Instruct

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7920638字节
    • 下载大小: 4036539字节
    • 数据集大小: 7920638字节

配置8: Mistral-7B-Instruct-v0.2

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7642321字节
    • 下载大小: 3981044字节
    • 数据集大小: 7642321字节

配置9: Mixtral-8x7B-Instruct-v0.1

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7433096字节
    • 下载大小: 3931698字节
    • 数据集大小: 7433096字节

配置10: Nous-Hermes-2-Mixtral-8x7B-DPO

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7741196字节
    • 下载大小: 3942628字节
    • 数据集大小: 7741196字节

配置11: Phi-3-medium-128k-instruct

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7661229字节
    • 下载大小: 3814774字节
    • 数据集大小: 7661229字节

配置12: Phi-3-mini-128k-instruct

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7256384字节
    • 下载大小: 3771393字节
    • 数据集大小: 7256384字节

配置13: Qwen1.5-72B-Chat

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7274905字节
    • 下载大小: 4005718字节
    • 数据集大小: 7274905字节

配置14: Qwen1.5-72B-Chat-greedy

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7265870字节
    • 下载大小: 3984547字节
    • 数据集大小: 7265870字节

配置15: Qwen1.5-7B-Chat@together

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5023481字节
    • 下载大小: 2754953字节
    • 数据集大小: 5023481字节

配置16: Qwen2-72B-Instruct

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7741539字节
    • 下载大小: 4067592字节
    • 数据集大小: 7741539字节

配置17: SELM-Zephyr-7B-iter-3

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7623027字节
    • 下载大小: 4113150字节
    • 数据集大小: 7623027字节

配置18: Starling-LM-7B-beta

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7644001字节
    • 下载大小: 4039359字节
    • 数据集大小: 7644001字节

配置19: Starling-LM-7B-beta-ExPO

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7699231字节
    • 下载大小: 4117570字节
    • 数据集大小: 7699231字节

配置20: Yi-1.5-34B-Chat

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,8361242字节
    • 下载大小: 4494985字节
    • 数据集大小: 8361242字节

配置21: Yi-1.5-6B-Chat

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,8748577字节
    • 下载大小: 4289171字节
    • 数据集大小: 8748577字节

配置22: Yi-1.5-9B-Chat

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,8302071字节
    • 下载大小: 4353037字节
    • 数据集大小: 8302071字节

配置23: claude-3-haiku-20240307

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5110828字节
    • 下载大小: 2717555字节
    • 数据集大小: 5110828字节

配置24: claude-3-opus-20240229

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5197618字节
    • 下载大小: 2816193字节
    • 数据集大小: 5197618字节

配置25: claude-3-sonnet-20240229

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5182728字节
    • 下载大小: 2782802字节
    • 数据集大小: 5182728字节

配置26: command-r

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5407976字节
    • 下载大小: 2997710字节
    • 数据集大小: 5407976字节

配置27: command-r-plus

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5794085字节
    • 下载大小: 3165095字节
    • 数据集大小: 5794085字节

配置28: dbrx-instruct@together

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,5077117字节
    • 下载大小: 2607792字节
    • 数据集大小: 5077117字节

配置29: deepseekv2-chat

  • 特征: 同配置1
  • 分割:
    • train: 1024个例子,7720444字节
    • 下载大小: 未提供
    • 数据集大小: 未提供

每个配置的数据集特征包括session_id、chat_history、model_input、output、generator、configs、dataset和primary_tag,其中configs是一个包含多个参数的结构体。所有配置的数据集大小和下载大小各不相同,但每个配置的训练数据集都包含1024个例子。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作