five

manishiitg/llm_judge

收藏
Hugging Face2024-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/manishiitg/llm_judge
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如prompt、response、type、lang、model_name等,主要用于通过LLM JUDGE评估书面任务。数据集分为训练集,包含18480个样本,文件大小为93086212字节。此外,文件还列出了不同模型在印地语和英语提示下的评分和问题数量,表明数据集用于评估不同语言模型的表现。

该数据集包含多个特征,如prompt、response、type、lang、model_name等,主要用于通过LLM JUDGE评估书面任务。数据集分为训练集,包含18480个样本,文件大小为93086212字节。此外,文件还列出了不同模型在印地语和英语提示下的评分和问题数量,表明数据集用于评估不同语言模型的表现。
提供机构:
manishiitg
原始信息汇总

数据集信息

特征

  • name: prompt
    • dtype: string
  • name: response
    • dtype: string
  • name: type
    • dtype: string
  • name: lang
    • dtype: string
  • name: model_name
    • dtype: string
  • name: simple_prompt
    • dtype: string
  • name: judgement_pending
    • dtype: bool
  • name: judgement
    • dtype: string
  • name: rating
    • dtype: float64

数据分割

  • name: train
    • num_bytes: 93086212
    • num_examples: 18480

数据大小

  • download_size: 29472635
  • dataset_size: 93086212

配置

  • config_name: default
    • data_files:
      • split: train
        • path: data/train-*

模型评估

语言: hi

模型 语言 得分 问题数量
Qwen/Qwen1.5-72B-Chat-AWQ hi 8.3722 562
Qwen/Qwen1.5-14B-Chat hi 8.2561 561
google/gemma-7b-it hi 7.8930 561
Qwen/Qwen1.5-7B-Chat hi 7.8518 562
manishiitg/open-aditi-hi-v3 hi 7.7464 562
manishiitg/open-aditi-hi-v4 hi 7.5537 562
manishiitg/open-aditi-hi-v2 hi 7.2536 562
teknium/OpenHermes-2.5-Mistral-7B hi 7.2240 562
ai4bharat/Airavata hi 6.9355 550
01-ai/Yi-34B-Chat hi 6.5692 562
manishiitg/open-aditi-hi-v1 hi 4.6521 562
sarvamai/OpenHathi-7B-Hi-v0.1-Base hi 4.2417 606
Qwen/Qwen1.5-4B-Chat hi 4.0970 562

语言: en

模型 语言 得分 问题数量
Qwen/Qwen1.5-14B-Chat en 9.1956 362
Qwen/Qwen1.5-72B-Chat-AWQ en 9.1577 362
Qwen/Qwen1.5-7B-Chat en 9.1503 362
01-ai/Yi-34B-Chat en 9.1373 362
mistralai/Mixtral-8x7B-Instruct-v0.1 en 9.1340 362
teknium/OpenHermes-2.5-Mistral-7B en 9.0006 362
manishiitg/open-aditi-hi-v3 en 8.9069 362
manishiitg/open-aditi-hi-v4 en 8.9064 362
google/gemma-7b-it en 8.7945 362
Qwen/Qwen1.5-4B-Chat en 8.7224 362
manishiitg/open-aditi-hi-v2 en 8.4343 362
ai4bharat/Airavata en 7.3923 362
manishiitg/open-aditi-hi-v1 en 6.6413 361
sarvamai/OpenHathi-7B-Hi-v0.1-Base en 5.9009 318
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作