five

serbian-llm-benchmark

收藏
Hugging Face2024-10-07 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/datatab/serbian-llm-benchmark
下载链接
链接失效反馈
官方服务:
资源简介:
塞尔维亚语大型语言模型评估数据集,包含多个配置,用于问题回答和表格问题回答任务。每个配置包含查询、选项和答案等特征,并分为测试和验证数据集。
创建时间:
2024-10-03
原始信息汇总

Serbian LLM Evaluation Dataset

概述

  • 语言: 塞尔维亚语 (sr)
  • 任务类别:
    • 问答 (question-answering)
    • 表格问答 (table-question-answering)
  • 数据集名称: Serbian LLM Evaluation Dataset

配置信息

arc_challenge_serbian

  • 特征:
    • query: 字符串
    • choices: 字符串序列
    • answer: 整数 (int64)
  • 分割:
    • test: 328831.29010238906 字节, 1136 个样本
    • validation: 10420.709897610921 字节, 36 个样本
  • 下载大小: 215945 字节
  • 数据集大小: 339252 字节

arc_easy_serbian

  • 特征:
    • query: 字符串
    • choices: 字符串序列
    • answer: 整数 (int64)
  • 分割:
    • test: 563432.7272727273 字节, 2304 个样本
    • validation: 17607.272727272728 字节, 72 个样本
  • 下载大小: 356935 字节
  • 数据集大小: 581040 字节

boolq_serbian

  • 特征:
    • question: 字符串
    • passage: 字符串
    • answer: 字符串
  • 分割:
    • test: 2134478 字节, 3171 个样本
    • validation: 70288 字节, 99 个样本
  • 下载大小: 1487502 字节
  • 数据集大小: 2204766 字节

hellaswag_serbian

  • 特征:
    • query: 字符串
    • choices: 字符串序列
    • answer: 整数 (int64)
  • 分割:
    • test: 8060840.2947619995 字节, 9740 个样本
    • validation: 249935.7052380004 字节, 302 个样本
  • 下载大小: 5431323 字节
  • 数据集大小: 8310776 字节

high_school_statistics_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 119009 字节, 205 个样本
    • validation: 10499 字节, 21 个样本
  • 下载大小: 79619 字节
  • 数据集大小: 129508 字节

human_aging_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 52917 字节, 218 个样本
    • validation: 5613 字节, 23 个样本
  • 下载大小: 44239 字节
  • 数据集大小: 58530 字节

mmlu_abstract_algebra_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 22316 字节, 100 个样本
    • validation: 2345 字节, 11 个样本
  • 下载大小: 14128 字节
  • 数据集大小: 24661 字节

mmlu_all_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 7248461 字节, 13946 个样本
    • validation: 790350 字节, 1523 个样本
  • 下载大小: 4560106 字节
  • 数据集大小: 8038811 字节

mmlu_anatomija_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 36290.177777777775 字节, 134 个样本
    • validation: 3604 字节, 14 个样本
  • 下载大小: 29603 字节
  • 数据集大小: 39894.177777777775 字节

mmlu_astronomija_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 55447 字节, 152 个样本
    • validation: 6160 字节, 16 个样本
  • 下载大小: 43218 字节
  • 数据集大小: 61607 字节

mmlu_college_biology_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 54564.48611111111 字节, 142 个样本
    • validation: 5334 字节, 16 个样本
  • 下载大小: 46975 字节
  • 数据集大小: 59898.48611111111 字节

mmlu_college_chemistry_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 27873 字节, 100 个样本
    • validation: 2610 字节, 8 个样本
  • 下载大小: 26704 字节
  • 数据集大小: 30483 字节

mmlu_college_computer_science_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 45492.48 字节, 99 个样本
    • validation: 5375 字节, 11 个样本
  • 下载大小: 39712 字节
  • 数据集大小: 50867.48 字节

mmlu_college_mathematics_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 27080 字节, 100 个样本
    • validation: 2955 字节, 11 个样本
  • 下载大小: 23145 字节
  • 数据集大小: 30035 字节

mmlu_college_medicine_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 63485.387283236996 字节, 169 个样本
    • validation: 7787.181818181818 字节, 21 个样本
  • 下载大小: 53595 字节
  • 数据集大小: 71272.56910141882 字节

mmlu_college_physics_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 32636 字节, 102 个样本
    • validation: 3665 字节, 11 个样本
  • 下载大小: 27572 字节
  • 数据集大小: 36301 字节

mmlu_computer_security_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 30670.08 字节, 98 个样本
    • validation: 4953 字节, 11 个样本
  • 下载大小: 29021 字节
  • 数据集大小: 35623.08 字节

mmlu_conceptual_physics_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 48701 字节, 235 个样本
    • validation: 5593 字节, 26 个样本
  • 下载大小: 36300 字节
  • 数据集大小: 54294 字节

mmlu_econometrics_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 42769 字节, 114 个样本
    • validation: 5250 字节, 12 个样本
  • 下载大小: 32138 字节
  • 数据集大小: 48019 字节

mmlu_electrical_engineering_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 30675.972413793104 字节, 144 个样本
    • validation: 3552 字节, 16 个样本
  • 下载大小: 26586 字节
  • 数据集大小: 34227.972413793104 字节

mmlu_formalna_logika_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 52688.19047619047 字节, 124 个样本
    • validation: 6852 字节, 14 个样本
  • 下载大小: 32391 字节
  • 数据集大小: 59540.19047619047 字节

mmlu_global_facts_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 21406 字节, 100 个样本
    • validation: 2195 字节, 10 个样本
  • 下载大小: 18616 字节
  • 数据集大小: 23601 字节

mmlu_high_school_biology_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 122475.20967741935 字节, 305 个样本
    • validation: 12491 字节, 32 个样本
  • 下载大小: 89344 字节
  • 数据集大小: 134966.20967741933 字节

mmlu_high_school_chemistry_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 67222 字节, 203 个样本
    • validation: 8146 字节, 22 个样本
  • 下载大小: 50739 字节
  • 数据集大小: 75368 字节

mmlu_high_school_computer_science_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 48159.36 字节, 96 个样本
    • validation: 3968 字节, 9 个样本
  • 下载大小: 39089 字节
  • 数据集大小: 52127.36 字节

mmlu_high_school_european_history_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 250885.21212121213 字节, 164 个样本
    • validation: 28918 字节, 18 个样本
  • 下载大小: 175083 字节
  • 数据集大小: 279803.21212121216 字节

mmlu_high_school_geography_serbian

  • 特征:
    • query: 字符串
    • subject: 字符串
    • choices: 字符串序列
    • answer: 字符串
  • 分割:
    • test: 50013.656565656565 字节, 196 个样本
    • validation: 5321
搜集汇总
数据集介绍
main_image_url
构建方式
Serbian LLM Evaluation Dataset 是通过对多个任务类别进行精心设计和构建的,涵盖了问答、表格问答等多种任务类型。数据集的构建基于塞尔维亚语,确保了语言的本土化和多样性。每个配置(config)都包含了查询、选项和答案等关键特征,并通过测试集和验证集的分割,确保了数据的全面性和可靠性。数据集的构建过程严格遵循科学方法,确保了数据的准确性和代表性。
特点
该数据集的特点在于其广泛的任务覆盖范围和多样化的数据配置。每个配置都针对不同的学科领域,如生物学、化学、计算机科学等,提供了丰富的查询和选项。数据集的语言为塞尔维亚语,填补了该语言在自然语言处理领域的数据空白。此外,数据集的结构清晰,每个配置都包含了详细的特征描述和分割信息,便于研究人员进行深入分析和模型训练。
使用方法
该数据集的使用方法灵活多样,适用于多种自然语言处理任务。研究人员可以通过加载不同的配置,针对特定任务进行模型训练和评估。数据集提供了测试集和验证集,便于进行模型的性能测试和验证。使用该数据集时,建议首先根据任务需求选择合适的配置,然后利用提供的查询和选项进行模型训练,最后通过答案字段进行模型评估。数据集的结构设计使得其易于集成到现有的机器学习框架中,为塞尔维亚语的自然语言处理研究提供了强有力的支持。
背景与挑战
背景概述
Serbian LLM Evaluation Dataset 是一个专门用于评估塞尔维亚语大语言模型性能的数据集,涵盖了问答、表格问答等多个任务类别。该数据集的创建旨在填补塞尔维亚语自然语言处理领域的空白,特别是在多任务评估方面的不足。数据集的核心研究问题在于如何通过多样化的任务和领域知识,全面评估模型在塞尔维亚语环境下的表现。其影响力不仅体现在为塞尔维亚语NLP研究提供了基准数据,还推动了多语言模型在低资源语言上的应用与发展。
当前挑战
该数据集面临的挑战主要体现在两个方面。首先,塞尔维亚语作为一种低资源语言,其语料库的构建和标注过程面临数据稀缺和质量控制的难题,尤其是在涉及复杂任务如表格问答和逻辑推理时。其次,数据集的多样性和广泛性要求涵盖多个学科领域,如数学、物理、化学等,这对数据收集和验证提出了更高的要求,确保数据的准确性和代表性成为构建过程中的主要挑战。此外,如何平衡数据集的规模与质量,以支持模型的泛化能力,也是该数据集构建过程中需要解决的关键问题。
常用场景
经典使用场景
在自然语言处理领域,serbian-llm-benchmark数据集被广泛用于评估和优化塞尔维亚语语言模型的性能。该数据集涵盖了多个任务类别,如问答、表格问答等,能够全面测试模型在不同语境下的理解与推理能力。通过该数据集,研究人员可以深入分析模型在复杂语言环境中的表现,进而推动塞尔维亚语语言模型的发展。
实际应用
在实际应用中,serbian-llm-benchmark数据集为塞尔维亚语智能助手、教育工具和翻译系统的开发提供了重要支持。通过该数据集训练的模型能够更好地理解塞尔维亚语的语法和语义,从而提升用户体验。此外,该数据集还可用于优化多语言模型在塞尔维亚语环境中的表现,推动跨语言技术的应用。
衍生相关工作
基于serbian-llm-benchmark数据集,许多经典研究工作得以展开。例如,研究人员利用该数据集开发了针对塞尔维亚语的预训练语言模型,并在问答和推理任务中取得了显著进展。此外,该数据集还催生了一系列关于多语言模型优化的研究,为塞尔维亚语自然语言处理技术的发展奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作