allenai/WildBench-V2-Model-Outputs
收藏Hugging Face2024-07-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/allenai/WildBench-V2-Model-Outputs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置与不同的模型相关联。数据集共享一些共同的特征,如session_id、chat_history、model_input、output、generator、configs(包括engine、max_tokens、repetition_penalty、temperature、top_p)、dataset和primary_tag。每个配置都有一个train分割,指定了num_bytes和num_examples,以及download_size和dataset_size。这些数据集设计用于训练目的,可能涉及自然语言处理任务,特别是与聊天和模型输入/输出相关的任务。
This dataset contains multiple configurations, each associated with different models. The datasets share common features such as session_id, chat_history, model_input, output, generator, configs (including engine, max_tokens, repetition_penalty, temperature, top_p), dataset, and primary_tag. Each configuration has a train split with specified num_bytes and num_examples, along with download_size and dataset_size. The datasets are designed for training purposes, likely involving natural language processing tasks, particularly those related to chat and model inputs/outputs.
提供机构:
allenai
原始信息汇总
数据集概述
本数据集包含多个配置,每个配置对应不同的模型和数据集特征。以下是各配置的主要信息概览:
配置1: Hermes-2-Theta-Llama-3-8B
- 特征:
- session_id: 字符串
- chat_history: 字符串序列
- model_input: 字符串
- output: 字符串序列
- generator: 字符串
- configs: 结构体,包含engine(字符串)、max_tokens(int64)、repetition_penalty(int64)、temperature(float64)、top_p(float64)
- dataset: 字符串
- primary_tag: 字符串
- 分割:
- train: 1024个例子,7614340字节
- 下载大小: 3946689字节
- 数据集大小: 7614340字节
配置2: Llama-2-70b-chat-hf
- 特征: 同配置1
- 分割:
- train: 1024个例子,7918821字节
- 下载大小: 4102606字节
- 数据集大小: 7918821字节
配置3: Llama-2-7b-chat-hf
- 特征: 同配置1
- 分割:
- train: 1024个例子,7761455字节
- 下载大小: 3957407字节
- 数据集大小: 7761455字节
配置4: Llama-3-Instruct-8B-SimPO
- 特征: 同配置1
- 分割:
- train: 1024个例子,7466588字节
- 下载大小: 4120425字节
- 数据集大小: 7466588字节
配置5: Llama-3-Instruct-8B-SimPO-ExPO
- 特征: 同配置1
- 分割:
- train: 1024个例子,7405168字节
- 下载大小: 4102313字节
- 数据集大小: 7405168字节
配置6: Meta-Llama-3-70B-Instruct
- 特征: 同配置1
- 分割:
- train: 1024个例子,7996057字节
- 下载大小: 4196555字节
- 数据集大小: 7996057字节
配置7: Meta-Llama-3-8B-Instruct
- 特征: 同配置1
- 分割:
- train: 1024个例子,7920638字节
- 下载大小: 4036539字节
- 数据集大小: 7920638字节
配置8: Mistral-7B-Instruct-v0.2
- 特征: 同配置1
- 分割:
- train: 1024个例子,7642321字节
- 下载大小: 3981044字节
- 数据集大小: 7642321字节
配置9: Mixtral-8x7B-Instruct-v0.1
- 特征: 同配置1
- 分割:
- train: 1024个例子,7433096字节
- 下载大小: 3931698字节
- 数据集大小: 7433096字节
配置10: Nous-Hermes-2-Mixtral-8x7B-DPO
- 特征: 同配置1
- 分割:
- train: 1024个例子,7741196字节
- 下载大小: 3942628字节
- 数据集大小: 7741196字节
配置11: Phi-3-medium-128k-instruct
- 特征: 同配置1
- 分割:
- train: 1024个例子,7661229字节
- 下载大小: 3814774字节
- 数据集大小: 7661229字节
配置12: Phi-3-mini-128k-instruct
- 特征: 同配置1
- 分割:
- train: 1024个例子,7256384字节
- 下载大小: 3771393字节
- 数据集大小: 7256384字节
配置13: Qwen1.5-72B-Chat
- 特征: 同配置1
- 分割:
- train: 1024个例子,7274905字节
- 下载大小: 4005718字节
- 数据集大小: 7274905字节
配置14: Qwen1.5-72B-Chat-greedy
- 特征: 同配置1
- 分割:
- train: 1024个例子,7265870字节
- 下载大小: 3984547字节
- 数据集大小: 7265870字节
配置15: Qwen1.5-7B-Chat@together
- 特征: 同配置1
- 分割:
- train: 1024个例子,5023481字节
- 下载大小: 2754953字节
- 数据集大小: 5023481字节
配置16: Qwen2-72B-Instruct
- 特征: 同配置1
- 分割:
- train: 1024个例子,7741539字节
- 下载大小: 4067592字节
- 数据集大小: 7741539字节
配置17: SELM-Zephyr-7B-iter-3
- 特征: 同配置1
- 分割:
- train: 1024个例子,7623027字节
- 下载大小: 4113150字节
- 数据集大小: 7623027字节
配置18: Starling-LM-7B-beta
- 特征: 同配置1
- 分割:
- train: 1024个例子,7644001字节
- 下载大小: 4039359字节
- 数据集大小: 7644001字节
配置19: Starling-LM-7B-beta-ExPO
- 特征: 同配置1
- 分割:
- train: 1024个例子,7699231字节
- 下载大小: 4117570字节
- 数据集大小: 7699231字节
配置20: Yi-1.5-34B-Chat
- 特征: 同配置1
- 分割:
- train: 1024个例子,8361242字节
- 下载大小: 4494985字节
- 数据集大小: 8361242字节
配置21: Yi-1.5-6B-Chat
- 特征: 同配置1
- 分割:
- train: 1024个例子,8748577字节
- 下载大小: 4289171字节
- 数据集大小: 8748577字节
配置22: Yi-1.5-9B-Chat
- 特征: 同配置1
- 分割:
- train: 1024个例子,8302071字节
- 下载大小: 4353037字节
- 数据集大小: 8302071字节
配置23: claude-3-haiku-20240307
- 特征: 同配置1
- 分割:
- train: 1024个例子,5110828字节
- 下载大小: 2717555字节
- 数据集大小: 5110828字节
配置24: claude-3-opus-20240229
- 特征: 同配置1
- 分割:
- train: 1024个例子,5197618字节
- 下载大小: 2816193字节
- 数据集大小: 5197618字节
配置25: claude-3-sonnet-20240229
- 特征: 同配置1
- 分割:
- train: 1024个例子,5182728字节
- 下载大小: 2782802字节
- 数据集大小: 5182728字节
配置26: command-r
- 特征: 同配置1
- 分割:
- train: 1024个例子,5407976字节
- 下载大小: 2997710字节
- 数据集大小: 5407976字节
配置27: command-r-plus
- 特征: 同配置1
- 分割:
- train: 1024个例子,5794085字节
- 下载大小: 3165095字节
- 数据集大小: 5794085字节
配置28: dbrx-instruct@together
- 特征: 同配置1
- 分割:
- train: 1024个例子,5077117字节
- 下载大小: 2607792字节
- 数据集大小: 5077117字节
配置29: deepseekv2-chat
- 特征: 同配置1
- 分割:
- train: 1024个例子,7720444字节
- 下载大小: 未提供
- 数据集大小: 未提供
每个配置的数据集特征包括session_id、chat_history、model_input、output、generator、configs、dataset和primary_tag,其中configs是一个包含多个参数的结构体。所有配置的数据集大小和下载大小各不相同,但每个配置的训练数据集都包含1024个例子。



